Nov11’s diary(自宅での開発環境作り )

3Dプリンタと切削加工機で工作した事をアップして行きます

自作したロボットアームを制御する(日本語指示)(その1)音声認識&音声合成機能

仮想現実(VR)が完成したので、外部情報の取り込み&3D認識に取り掛かろうって思っていたけど大事な機能を追加する事を忘れていたので機能を作成する事にした

忘れていた機能は、エド(ロボットアームの呼称)と音声対話をする為の、音声認識音声合成機能で、この機能が無いと、エドと対話しながらオセロゲームを行う事が出来ない!!

んで、実装をどうするかグーグルさんで検索すると、音声認識組込モジュール(SR-MOD100)やスマートフォンを使用した音声認識、後は、大学が進めている「Julius」と言うソフトがヒットした
音声認識組込モジュール(SR-MOD100)は、簡単だけど、文章認識って感じでは無い
スマートフォンは、無線環境が無いとダメだし、パソコン有るのにわざわざって感じになってしまう
「Julius」は、何だか、ややこしそうな感じがする
色々と悩んでたら、Windowsには、音声合成音声認識が入っているとの事なので、これを利用させてもらう事にしました

プログラムを作成して、動作させてみると、若干の誤認識はあるが、良い感じで動作してくれました

で、以下が、認識をしている時の画像です

f:id:Nov11:20170909152344j:plain

んで、以下が、認識をしている時の動画です

認識は、日本語を音声合成で読み上げて、読み上げた内容を音声認識させてみた結果です
(※)夜中に一人で、パソコンに向かってブツブツ言ってる姿を想像したら、少し怖くなって、音声合成の音声を認識させる事にしたです...

テスト時に発音や、文節毎に、ひと息いれないと誤認識してしまう事が判ったので、これを利用して、音声操作を行う為には、筆者の脳も学習機能を起動させる必要があるみたいです
慣れるまで、一人パソコンに向かって、ブツブツ言わないといけないのが辛く恥ずかしい作業となりそうですが...

後は、誤認識補正と日本語解析&言語変換を作成すれば、音声対話や日本語入力での操作が可能になりそうです。最終的には、アニメやSF映画みたいに、軽い冗談を入れた会話をしながら筆者の作業を手伝ってくれるまでになると嬉しいのだけど、先は長そうだが、くじけずに頑張るぞぉ~!

なお、ブログの内容を参照して実行した結果に責任は負いかねますので、ご了承下さい