はじめに

概要

音声認識によるアプリケーション操作用フレームワークの開発と提供を行います。

音声認識には自由文法型の音声認識と文法指定型の音声認識がありますが、本フレームワークは後者の文法指定型の音声認識を元に明示的な操作指令を音声として受け取り、それを処理するための汎用的な機構を提供します。

自由文法型の音声認識は、任意の自然な日本語を認識できます。しかし、結果が自然言語の日本語テキストでしか受け取れず、機械的な処理に向いていません。

それに対して文法指定型の音声認識では、指定した文法内での音声認識しかできませんが、結果を機械的に処理しやすい記号（整数もしくは事前に指定した文字列）で受け取れるという利点があります。

状況に応じて音声認識に使用する文法を切り替えながら、音声認識の結果を受け取り、それを何らかの画面表示に結び付けていくためのフレームワークを提供します。

音声認識エンジンには Microsoft Speech SDK の利用を想定しています。

しかし、抽象化層を設けることで異なるエンジンの取り込みも視野に入れます。

そのため利用者は Microsoft Speech API（Microsoft Speech SDK が提供する機能にアクセスするための API）の詳細を知る必要はありません。

Microsoft Speech API を使ってしまうと Windows に利用が限定されてしまうので Julius を使った実装との切り替え等もできたら良いなと思っています。

Julius … 存在だけで使ったことないのですが …、知ってる方にご協力頂けると助かります。

Ownway.info(Speech)
- Microsoft Speech SDK を使った音声認識プログラムの開発方法をまとめたページです。本プロジェクトの開発者が本サイトを運営しています。