最近の更新 (Recent Changes)

2012-02-27
2011-05-23
2011-05-22

最新檔案發佈

Speech Controller Framework (0.1.2)2011-05-22 21:46

現在、他プロジェクトに集中するために活動を停止していますが、必要がある方、興味がある方が要れば toy@ownway.info までご相談ください。

ノウハウは持っているので力になります。

本当は音声認識を使ってアプリケーションの起動や操作を行うフレームを作ってみたかったんです。そのための基盤として作り始めました。

はじめに

概要

音声認識によるアプリケーション操作用フレームワークの開発と提供を行います。

音声認識には自由文法型の音声認識と文法指定型の音声認識がありますが、本フレームワークは後者の文法指定型の音声認識を元に明示的な操作指令を音声として受け取り、それを処理するための汎用的な機構を提供します。


文法指定型の音声認識を採用する理由

自由文法型の音声認識は、任意の自然な日本語を認識できます。しかし、結果が自然言語の日本語テキストでしか受け取れず、機械的な処理に向いていません。

それに対して文法指定型の音声認識では、指定した文法内での音声認識しかできませんが、結果を機械的に処理しやすい記号(整数もしくは事前に指定した文字列)で受け取れるという利点があります。


フレームワークの基本的な考え方

状況に応じて音声認識に使用する文法を切り替えながら、音声認識の結果を受け取り、それを何らかの画面表示に結び付けていくためのフレームワークを提供します。

音声認識エンジンには Microsoft Speech SDK の利用を想定しています。

しかし、抽象化層を設けることで異なるエンジンの取り込みも視野に入れます。

そのため利用者は Microsoft Speech API(Microsoft Speech SDK が提供する機能にアクセスするための API)の詳細を知る必要はありません。


備考:その他の音声認識エンジン

Microsoft Speech API を使ってしまうと Windows に利用が限定されてしまうので Julius を使った実装との切り替え等もできたら良いなと思っています。

Julius … 存在だけで使ったことないのですが …、知ってる方にご協力頂けると助かります。


トピック


参考

  • Ownway.info(Speech)
    • Microsoft Speech SDK を使った音声認識プログラムの開発方法をまとめたページです。本プロジェクトの開発者が本サイトを運営しています。