フォト
無料ブログはココログ

« 方違えして帰る日に | トップページ | 続:Windows7の音声認識を導入する件(設定編) »

Windows8.1の音声認識を持ち出す件

先月から、Windowsが標準で持っている音声認識の使い方をいろいろと考えてきました。

れはWindowsのシステムやソフトを音声で操作する『コマンド』と、音声で読み上げた文章を文字として入力していく『ディクテーション』からなるのですが、Windowsの音声認識では使用中にコマンドとディクテーションが選択できません。このためディクテーションとして入力しているつもりの文章でも、コマンドとしてソフトへ命令する動作をしてしまうことがままあります。

たとえばワープロソフトやメモ帳に入力する文章中に『ドアを閉じる』という語がある場合、最後の『閉じる』という語はディクテーションでもコマンドでも用いられるため、音声認識ではコマンドとして反応する結果、文章を音声入力しているはずなのにいきなりソフトの終了をするかどうか聞かれたりします。これは焦ります。

そうした使い勝手の悪さや、マイクやサウンドカードなどの機材の相性による入力の精度の低さを克服できれば、Windowsの音声認識はなかなか便利なものだと思うようになりました。

ほぼ2ヶ月を要したシステムの構築と運用が落ち着いてきたところで、ふと思ったのです。

この音声認識のシステムをデスクトップのパソコンではなく、タブレットのパソコンで運用したらどうなるだろうかと。

音声認識そのものはWindows8.1でも標準装備されていて、普通に動作するはずですが、たとえば運転中に車の中でディクテーションをしたら文字が読み上げた通りに入力されていくのでしょうか?

そんなことを考えてしまったのです。いったん気になりだすと、やってみずにはいられなくなります。

実験に使用したのはWindows8.1搭載のタブレットと、普段はデスクトップPCに接続して運用しているUSBのサウンドアダプターとヘッドセットです。

一人で乗る車の中とはいえ、ヘッドホンをして車に乗っているのはいかにも気味悪いので、ヘッドセットの装着にはいささかの工夫をしています。ふつうなら頭にかけるヘッドホンを首に巻くように置いて、マイクの部分だけ角度を調整して口の近くにくるようにしました。

そうした状態でディクテーションして文字が入力できるならば、一人で車を運転している最中に、ブログやメールや、あるいは訴状や準備書面が書けてしまうかもしれません。

今までは、自分で車を運転していたら運転の他には何もできないと思っていたのです。皆さんそうであるはずです。

仮に運転中の音声入力がうまくいったならば実務のやり方が変わってしまうような可能性を秘めています。失敗しても冗談で終われます。

そんなことがあって今日、機材を持ち出してみたのです。行き先は、名古屋市近郊の法務局です。国道を道なりに走る区間が続きますので、ぶつくさいいながら走っても危なくないと期待します。

音声認識の運用にあたっては、マイクをはじめとする適切な機材の選択と、コンピュータに対する事前のトレーニングが必須になります。
これを怠るとほとんどの場合、音声認識の精度は上がらないまま音声認識がうまくいかないものとして、使用者は音声認識の機能の使用をあきらめてしまうようです。

今回持ち込んだシステムでは、車の中ではない環境つまりノイズのない室内でトレーニングされたシステムを持ち込んでみましたので、車の音やエアコンの音などのさまざまなノイズがある環境下では音声認識がうまくいかないことも考えられました。

しかし、軽自動車を運行し、窓を閉めてエアコンをかけながら音声認識を試してみたところでは、通常の日本語の文章はおおむね正確に認識できることがわかりました。

ただし、窓を開けてしまうとがマイクにあたる関係で、音声認識はほとんど不可能になります。

コマンドについても、音声認識の開始終了やソフトの起動など基本的なものはおおむね通常通りできると考えてかまいません。
ですからヘッドセットをつけた状態で車を運転していてパソコンが起動していて音声認識待機状態にあるならば、音声認識で入力するソフトウェアを起動したうえでディクテーションを開始して文章入力し、必要なタイミングで文書を保存して音声認識を終了させるということまで手を使わずに可能だ、ということになります。

音声認識で入力する文章の受け皿としては、Windows標準で持っているメモ帳などを使用すればいいので、音声入力した文書は事務所に戻ったあとで、または車を安全なところに停めて、メモ帳からメールやワープロなど必要なソフトへコピーして用いていけばいい、ということになるでしょう。

では肝心な音声認識の精度なのです、この記事は車の中で発話し音声認識させた結果を使っています。

字体を斜めにしたところ認識を誤った箇所と考えてください。

同音異字が入った場合は、音声認識としては誤っていないと考えています。これは、キーボードの入力なら打鍵ミスではなく変換ミスの一種だと考えたためです。

このように、自動車の中でしゃべって音声認識で文章の入力を試みた場合、文章内でおおむね8割から 9割以上の文字が正しく入力されていくということがわかりました。これなら、運転中は入力のみおこなって訂正をせずにおいても、正確に入力されている語から内容を思い出してあとで訂正できます。

つまり、資料を見ずに頭のなかで考えて発話すればいいなら、運転中にタブレットの画面や書類に目をやる必要がありません。

決まった語で認識に失敗する傾向もあるようです。ディクテーションをする機能なのにディクテーションと一回で変換できたことがありません(汗)

助詞の『が』も、僕の場合は入力されづらいようです。

難しいことばは認識も漢字変換もしにくいので、それを考慮して微妙に文体を変えている自分にも気づきます。

音声認識に用いているタブレットは、ダッシュボードの上に適当においてあります。このシステムちゃんと使えるということになった場合には、もう少し見やすい位置を工夫する広がるかもしれません。

ハンドルとスピードメーターの間においてみようかなとも思いました、さすがにこれは健全でありすぎます。

冗談のような実験の結果として、運転中にしゃべってさえいれば、ほとんどの文章が音声だけで入っていくので車での移動時間が無駄にせずに済むということにもなってしまいました。仕事で起案する文書でも、法律扶助相談の調書や、お客さまからのメールでの問い合わせに対する回答は、車の中での音声認識で作れてしまうように思えます。これらは資料をみずに書けるからです。

専門用語があまり出てこない簡易な事案であるならば、訴状や準備書面も書けそうです。

« 方違えして帰る日に | トップページ | 続:Windows7の音声認識を導入する件(設定編) »

零細事務所の電算・情報・通信」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

トラックバック


この記事へのトラックバック一覧です: Windows8.1の音声認識を持ち出す件:

« 方違えして帰る日に | トップページ | 続:Windows7の音声認識を導入する件(設定編) »

2021年12月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31