フォト
無料ブログはココログ

« さようなら、テレビ(Fire TV Stick 4K Maxを買いまして) | トップページ | 変わってしまうのか変われるのか »

来年の実務を変えるサービス(条件付きで採用するNottaの話し)

重要な会話は録音してある、という相談者は結構います。民事家事関係裁判書類作成・法律相談全体のうち3~4件に1件くらいはそういう展開になるでしょうか。この件数には録音付きの動画も含みます。

ならば相談中にそれを有効活用できる人はどれだけいるか、というと20件に1件を下回ります。

まぁ相手方のほうはさらに酷く、それを有効活用して訴訟を勝ち抜いたひとを見たことがないのです。
あの連中が嬉しげにスマホでデジカメでICレコーダーで取りまくったデータ、いったいどこ行ったんだろう…まさかこの期に及んで肖像権やらプライバシーやらについてご配慮いただいた、なんてことはないはず。

いったい何がダメなのか、録音については明らかな実情があります。録音機器がこれだけ進歩してなお、機材や録音環境に起因するノイズがあったり音量が低すぎたりして記録して役に立たない、あるいは録音はできたが録音件数と時間数が膨大にあって(平均30分の録音が60個♪とか)決定的な録音をどこでやったか当人も覚えてない、この2点に制約されて当事務所の依頼人も録音の有効活用はなかなか難しいのです。

それらを乗り越えるとラスボスが控えています。

録音内容の文字化に結構な手間あるいは時間、そうでなければカネがかかる、と。
生き残った勇者も多くはここで倒れる、と言っていいわけです(苦笑)

ちなみに、いろんな業者が提供している録音反訳サービスの依頼費用は裁判所提出用ですとだいたい録音1分につき200円台~400円台となっております。最低価格の設定もあったりします。いずれにせよ録音60分につき税込み2万~3万円となりまして、当事務所の客層では利用を躊躇するに十分なお値段、なのです。

当事務所で無理矢理に受託する場合は特別に1分100円台の設定をすることがありますが、これはよほど録音時間が短い場合に限ります。裁判書類作成を巡って安易に受けたらひどい目に遭えるサービスの筆頭がこれ、と常々肝に銘じているところ。

その次にキケンな業務は係争地周辺の強行測量でして、ただこれは年1~2件しか機会がありません。

お話しを戻します。重要だけれど外注業者に頼みにくい当事務所直轄事業としても受けにくい依頼人にやってもらおうとすると依頼人が依頼意思ごと挫折しかねない(汗)、そんな『録音データの文字起こし』にようやく決定的な対処法ができたようなのです。表題の件。

音声ファイルに記録された会話を自動で文字に、つまり文字起こしできるサービスを常々探しておりました。

一昨年ぐらいまでは事前に学習させた話者1名(つまり、僕)がリアルタイムに丁寧に発話するなら9割を超える程度の正確さで入力できるサービスにたどり着いてはいたのです。

このため、『すでに録音された、複数話者の会話の録音の反訳』ではいわゆるリスピークを試みておりました。

つまり僕が録音内容を聞きながらそのとおりに一人でしゃべり、僕がしゃべった結果を音声認識させて文字起こしをしていたのです。

この方式だとだいたい録音1分につき6~7分で反訳が済みます。
しかし20分の録音を1分150円で反訳することにしてしまった場合、得られるお金は3千円。でも作業所要時間は最低120分、ということで時給1500円…つまり補助者さまにお任せしても赤字になりかねない、という実情にはあるのです。この作業で利益を上げようとした場合、1分300円あたりの設定が妥当だと僕も思います。

そんなに作業時間がかかるの?などと言う、心ない人もいます。
そういうことを言った時点でもう反訳業務の依頼を受けるつもりはなくなりまして、いったんご自身で思い切り頑張ってもらうことにしています。

苦しめ、などとは申しておりません。
三途の川の岸辺からそっと出発を見送るだけです(遠い目)

録音の文字起こしを初めてやった(正確には、不用意な発言をきっかけに『やらされることになった』人を含む)人で、録音時間1分につき10分以内に作業を終えられる人など見たことありません。

人によっては10分の録音を1週間かけて文字化できない(作業そのものを放り出す)、ということもあります。

実は人が頭の中で会話を理解するやり方は案外適当らしく(一語一語を認識するというよりは意味や流れや雰囲気、といったものを捉えているように思える)、無理に逐語訳させようとすると破綻する、という実情はあるのです。

このあたり、工場のライン作業と同じでして脇から見てる分には自分でもできそうに見えますが自分がラインに配置されると全然そうじゃない!というのと同じような面もあるかもしれません。

で、最終的にはワープロなり表計算なりで文字データを入力せねばならない反訳書作成について一番適当な作業方法は作業者によるリスピークだ、という理解でしのぎながら、折々に使えそうなサービスを試していたのです。今月まで。

録音機材はスマートフォンかICレコーダー、つまりマイクはモノラルかステレオまたはデュアルマイクか、はたまた電話(←音質が落ちる)の録音であるかは不明、音質向上に関する配慮は皆無、録音形式はMP3かWav、話者は2~4名、録音時間は数分から2~3時間、そんな音声ファイルがどどーんと数十件やってきた、というよりはキタ━━━(゚∀゚).━━━!!!

そんなかなり悲惨な状況に対処できるサービスの候補を、このたび2つに絞ることができました。

1つはNotta、もう1つはRimo Voiceです。

双方とも、録音データをクラウドにぶん投げれば、ありがたきAIさまが自動解析して文字化してくださるというもの。
当然ながらお布施を納める必要はございますが、録音時間1分あたり数十円におさまります。誤認識の割合は両者ともほぼ同じ印象でした。

例として、テーブル上に置いた適当なスマホで室内の会話を録音、話者2名が時に言い合いをしながら進める日常会話、といった録音をこれらのサービスで文字起こしさせた場合、漢字ひらがな交じり文にしたときの認識率は5~7割ぐらいといったところでしょうか。

当然ながら人名その他の固有名詞の変換は苦手です。複数話者の会話が混じってしまった場合はほぼ変換不能となります。これらは両者ほぼ共通の特徴といえます。

ご同業の皆さまには上記いずれかのサービスの利用を視野においた場合、依頼人や相手方の名字はスズキさんやサトウさんといったシェアの高い名字が好ましく、会話内容はできるだけ日常的なものがよく、珍しい名前の人がでてきたり普段出てこないような話題=劉備玄徳さんと諸葛孔明さんが天下三分の計をめぐらせている、などという録音の反訳はできるだけ関与を避けるべきだ、ということになりましょうか。

まぁ、これは録音データが残ってるなら聞いてみたい気もしますが。

冗談はさておいて。
裁判所に出す反訳書作成準備のためのサービスとしてみた場合、両者には微妙な、でも大きな差があります。

両サービスとも、自動で録音時間数を挿入してくれます。これがNottaの場合は約1分ごと、Rimoのほうは数分に1回程度しか入りません。

つまり、要所要所で録音時間と重要発言を併記したい反訳書作成ではNottaのほうが優れます。

また、両者とも不完全ではありますが複数の話者を分離して改行を入れてきます。
これはNottaのほうが頻繁に改行してくる傾向があります。

ですのでNottaのほうを採用したくなるのですが、士業としては待たねばなりません。

Nottaには致命的というべき欠点があります。プライバシーポリシーを読んでもわかりませんでしたが、利用規約を引用します。

Photo_20211231010401

つまりプライバシーポリシーがどうあれ、データはあの大陸のサーバに送られる可能性があるわけで。

このサービスを使うには、お客さまに事前確認せねばなりません。

ひょっとして、中国政府の打倒などを話題にしておられませんか(笑)

ちなみにRimoのほうは国内の会社がやってるようです。悩ましい選択ですよね。

« さようなら、テレビ(Fire TV Stick 4K Maxを買いまして) | トップページ | 変わってしまうのか変われるのか »

本人訴訟」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

« さようなら、テレビ(Fire TV Stick 4K Maxを買いまして) | トップページ | 変わってしまうのか変われるのか »

2022年11月
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30