« Windows8.1の音声認識を持ち出す件 | トップページ | 背もたれに何かするテスト »

続:Windows7の音声認識を導入する件(設定編)

おそらくはキーボードの使いすぎと思われる右腕のしびれと、補助者さまの少々長めのお休み。

そんな中、仕事が少々多めになった8月を乗り切るために頼った新装備は、導入費用ゼロの音声認識です。打鍵せずに文章を入力できたら、作業はどれだけ速く、ラクになるでしょうか?

-新しい機材としては煮物から炒め物からインスタントラーメンまで適当にそれらしく作れる電子レンジ用シリコンスチーマーにもずいぶん頼りましたが、それは機会があれば別の記事にしようと思います-

Windows7が標準で持っているこの機能と、IP電話のためにもっていたマイクを使って日常の文章を音声で入力しようとするこの試み、先週はタブレットを持ち出して自動車運転中にも使えることを確認しました。

この先実務を変えていく可能性を見いだした、当事務所の夏の自由研究。四十肩に悩んでいたり入力速度が上がらない同業者さんのうち、この記事は裁判事務などで長文を入力される方のためのものです。まず、機材を導入して設定してみましょう。5千円もかかりません。

1.マイク
Windowsに限らず、音声認識の精度を左右する最も重要な機材はマイクです。
値段が高いものならいいというわけではありません。アマゾンでレビューを見て星が四つ以上ついている製品であれば、価格1000円台のものでも全く構わないのです。

パソコンに接続するマイクには、3.5ミリのオーディオ用のピンジャックで接続するものと、USBで接続するものがあります。

オーディオ用のピンジャックで接続するものは、パソコンが装備しているマイク接続端子に接続することになりますが、この利用方法はあまりお勧めできません。パソコンが内蔵しているサウンドカードに接続しての利用はノイズが乗りやすいと言われています。

もっとも、こうした問題は Windows95のころから言われてきたものなので、これは前世紀から解決されていないということになるのでしょうか(苦笑)。

ピンジャックで接続するマイクは、音量やノイズについて本体のサウンド機能との相性が強く出ます。僕が現用しているスタンドマイクは、デスクトップPC本体への直接の接続では音声認識に使えませんでした。

マイクをパソコンに接続してしか使わないのであれば、USBに接続するマイクを採用してもかまいません。USB接続のマイクはノイズが乗りにくく音質が安定しているといわれていますが、パソコンに接続して使うだけの製品ですので選択肢は限られてきますし、スマートフォンのハンズフリーなどへの転用はできません。

すでにピンジャックで接続するマイクをもっている場合には、後で説明するUSB接続のサウンドアダプターを併用することで本体内蔵のサウンドカードを使わずに済みます。
タブレットのように4極のオーディオ端子があってマイク専用の入力端子がない場合にも、4極の端子から3極×2(マイクとヘッドフォン)への変換ケーブルを買うかUSB接続のサウンドアダプターとmicroUSBの変換ケーブルを買う選択を迫られます。

僕のおすすめは、ピンジャックで接続するマイクを持っているならまずUSB接続のサウンドアダプターを買ってみてそれを使うシステムです。

マイクはさらに、ヘッドセットとスタンドマイクに分かれます。
ヘッドセットはヘッドホンとマイクが一体になっているもので、当然ながら頭に装着する煩わしさがあります。寸法や形状によって、長時間の装着が苦痛になるものもあるようです。このため、家電量販店でなんとなく購入するのはおすすめできません。

誰かが使っているのを試着できればベストですが、そうでなくても装着感に問題があるレビューが出ている製品は避けましょう。ヘッドホンとしての活用を考えないなら、片耳だけのヘッドセットは両耳のものより圧迫感が減ります。

特に両耳のヘッドセットは着けるのが面倒な代わり、マイクが口もとに近く距離が一定しているため、音声認識の精度を確保しやすい利点があります。

スタンドマイクはいつも机に置いておけばいいので、ヘッドセットのような煩わしさがありません。音声認識をいつも使える形で維持するにはこちらのシステムがよいです。
しかしマイクと口もとの距離が変化しやすく、周囲の雑音も入るため、精度の高い音声認識ができる環境を作りにくい難点があります。僕が使っている下記のスタンドマイクでは、キーボードの隣に置いておけば普通にしゃべってもまずまずの精度で入力ができるようです。入力精度の比較は、前の記事をご覧ください。

マイクの種類による精度の違いをどう取るかにもよいますが、長文などの音声入力そのものを少しでも高い精度で行いたいならヘッドセットマイクを取ることになります。複数のオペレータに同時に作業させたいならヘッドセットしか選択できません。

一方でスタンドマイクとUSBサウンドアダプタの組み合わせは、音声認識のほか電話会議システムのような多人数対多人数でのハンズフリーの通話を可能にします。依頼人との電話での打ち合わせが頻繁な事務所なら、持っていて損のないシステムです。

マイクを選ぶにあたって、特にヘッドセットで、bluetooth接続のものは魅力的に見えますが、僕が採用した二種類の機材はいずれも使えませんでした。他の方のブログにも失敗例がありますので、今のところBluetooth接続のヘッドセットはハードルが高いのかもしれません。

2.USB接続のサウンドアダプタ

本体のサウンドカードとピンジャックで接続するマイクの相性が良くない場合に利用を推奨できるのが、USB接続のサウンドアダプタです。
既に本体にサウンドカードがある場合には無駄に思えますが、紹介する製品は音声認識や電話の音質の向上に寄与するし安いので、購入して損はないと思います。

3.選択すべきでない商品と装備

マイクであれば何でも使えるというわけではありません。使えなかったものを紹介します。
昨年購入したWindowsタブレット(AsusのVivotab Note8)に内蔵されているマイクは、音声の入力はされるのですが入力した文字の半分以上で認識が失敗します。googleの音声検索は普通にできるので、Windowsの音声認識のほうがマイクへの要求は数段厳しいことになっていそうです。

音声認識を使うために要するマイクの構成すらできなかった製品もあります。

グリーンハウスのオーディオレシーバーはBluetooth接続でマイクを搭載しており、スマートフォンでオーディオを聴けるほかハンズフリー通話にも使えるという触れ込みだったのですが、Windowsタブレットに接続した環境ではマイクの構成ができませんでした。ためしに通話で使ってみたところ、周囲の雑音を拾いぎて文字通りお話しになりません。NTT西日本のフレッツ光のポイントで交換できる商品ではありますが、この商品の入手はお勧めしません。

ワイヤレスという発想は魅力的ですので、もう一つBluetooth接続の携帯電話用ヘッドセットを買ってみました。ノイズキャンセリング機能を装備した三千円ほどのものでしたが、Windowsの音声認識では使えませんでした。以前の記事にも書きましたが、『司法書士』というと『地方都市』と認識されます。
実はほかの会社の音声認識ソフトでは、このヘッドセットが良好な成果を収めています。これはヘッドセットそのものが悪いというより、音声認識のシステムの側に個性というか問題があるのかもしれません。これは、音声認識ソフトを購入後にレビューしましょう。それまでは電話でだけ使います(というより、片耳のヘッドセットですから電話でだけ使うための製品なんですが)。

数年前に買った、Buffaloの携帯電話用マイクも出てきました。片耳に装着するもので、マイクと口との距離が大きなヘッドセットより離れます。装着すると、マイクが頬に当たります。利用はできましたが精度に劣る印象があります。

この種の小型ヘッドセットでBluetooth接続でないものは、サウンドアダプターを介すればおそらく利用可能です。
しかしノイズキャンセリングなどに工夫を凝らした製品でない限り、小型のものほど不利なはずです。単純にマイクを口に近づけることができるほど精度の高い認識結果を得られると推測します。

4.接続と設定の問題

基本的な設定の方法は、他の方が書いているコンテンツに譲ります。
何の問題もなければ、マイクをPCに接続したら『Windows音声認識』→『マイクのセットアップ』→『音声認識チュートリアルの実施』→『コンピューターをトレーニングして認識精度を上げる』までで30分かかりません。

設定から運用までで、上手く行かなかったところがあります。
本体に標準装備のサウンドカードと後からUSB接続したサウンドアダプターがある場合は、その選択が適切になされていないとマイクのセットアップができません。僕はここでドツボにはまりました。
これは、『コントロールパネル』→『音声認識』→『高度な音声オプション』で出てくる『音声認識のプロパティ』で『詳細設定』で確認・変更できます。『このオーディオ入力デバイスを使用する』にチェックして、適切なデバイスに変更してください。

1

マイクのセットアップの画面で、発話して音声が入力できた(音量のインジケータが振れた)場合でも、音量が大きすぎる・少なすぎる場合があります。
普通に発声して音量がインジケータの半分を超える場合は少し音量を絞ったほうがよいでしょう。ヘッドセットでも発声時のノイズ(ポップノイズ)を拾っているかもしれません。

音量が正しく設定できない場合にはマイクのセットアップ後に『音声が不明瞭です』というメッセージを出されます。
サウンドカードの設定でAGC(オートゲインコントロール)にチェックが入れられる場合にはそれを試してみましょう。マイクブーストの利用は推奨しません。音声も背後のノイズも大きな音量になるからです。
マイクブーストを使わなければ十分な音量に達しない場合はそのサウンドカードの利用をやめましょう。USB接続のサウンドアダプタの利用を推奨するのは、こうした問題を避けるためです。

マイクがセットアップでき、音量も順当であったとしても、音声認識チュートリアルの進行が悪いことがあります。読み上げる文章を何度も言い返さないと次の文章が表示されないような状況です。
ここではマイクの音質が悪すぎて認識できていない可能性があります。『マイクのプロパティ』でビットレートを変えられる場合、最低でもCDの音質まで上げておく必要があります。ここが『電話の音質』に設定されていて全然ダメだったことがありました。

2

音声認識チュートリアルの進行が悪いマイクは、その後の音声認識でも必ず悪い結果を出してきます。原因を突き止めるか利用を止めるかしなければしないと、本番では使えません。

音声認識チュートリアルが各文章1回の発声で進んでいった場合は、引き続き『コンピューターをトレーニングして認識精度を上げる』で学習を進めて精度を上げます。これが1回済めば、あとは学習を繰り返してもあまり精度が上がっていかない印象があります。

ここまで済んだら、おそらく音声認識がつかえる機材一式ができあがっています。

« Windows8.1の音声認識を持ち出す件 | トップページ | 背もたれに何かするテスト »

零細事務所の電算・情報・通信」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

トラックバック


この記事へのトラックバック一覧です: 続:Windows7の音声認識を導入する件(設定編):

« Windows8.1の音声認識を持ち出す件 | トップページ | 背もたれに何かするテスト »

2021年4月
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30