フォト
無料ブログはココログ

« 2022年1月 | トップページ | 2022年3月 »

2022年2月

東京発東北方面日帰り出張相談の限界点(東京出張の日程調整を始めました)

今月の新件。もちろん裁判事務。

お客さまからやってきたレターパックを開封して、思わず呻いた。

文字が、小さい(苦笑)

このお客さまもリピーターの方、というより当事務所裁判事務の歴史に残る勝利を挙げられた方が十数年ぶりに再挙されることとなったのです。
ですので難易度なんか別に高くてもかまわないんですが…文字が読めないのはいただけませんね(溜息)。老眼鏡をかけて資料の精査に入ります。隣の部屋では本日出勤日の補助者さまが、PythonでCSVファイルを扱うプログラムの習得に励んでおられます。

…平和、です。

さてさてどうやら冬も越せそうだ、ということで表題の件。次の東京出張は3月2~4日、都内での滞在が決まっています。

楽しいの問題はそこから先です。郡山のあたりにちょっと気になる方がおられます。

ここで郡山は当然ながら東北新幹線/東北本線の郡山であり、関西本線の郡山ではありません。後者だったら単に青春18きっぷ1枚でカタがつきます。

少し顔を見て話をしてきたい、運がよければ依頼になるかもしれない、そういう状況ではあるのです。

ちょっと調べてみます。3月2日午後から4日夕方までは都内で仕事があり、春の青春18きっぷは選択可能、時間はあるがおカネはない、そんな前提で。

3月4日も、上野に泊まるなら。

翌朝の東北本線始発普通列車に乗れば郡山着は9時台、郡山から名古屋への普通列車の最終の接続は11時前、となっています。

つまり郡山駅で1時間超の時間はとれる、名古屋から東京への出張の帰路に郡山に立ち寄ることによる交通費増加は発生しない、と(棒読み)

贅沢なコース。
3月5日に郡山に泊まってしまえばどうとでもなります。

この場合、宿泊費交通費含め7千円程度の費用増です。3月5日、上野-郡山間で1回ぶんの青春18きっぷを使い、郡山で5千円弱の宿に泊まることはできます。滞在可能時間が増えるのでもう少し宿の安い地域も選択可能ではある、と。

請求してみてもバチはあたらんだろう、とは思えるのです。7千円。
ちなみに相談料金そのものは非事業者向けの設定として、2時間5500円となっています。

これがどうなるかで3月5日以降の日程がどうなるか大きく変わるのですが、ともかく東京出張2泊だけは決まりました。23区内での出張相談は当事務所への依頼歴のある方は無条件で、そうでない方には十分な換気と対人距離が取れる場所であることを確認してお受けできます。

ところで、一昨年から入館に抽選制を採っている国立国会図書館は平日朝11時までに入館してしまえば予約不要ということになっています。そろそろ国会図書館の喫茶室を相談場所にする運用を再開してもいいような気もしています。

このルールを知ったため、僕の東京出張は第1日目(高速バスで昼過ぎに都内に入る)の午後の価値が暴落し、2日目以降の午前中の価値が暴騰することになりました。お客さまに対する提案としては、初日午後に限っては交通費宿泊費日当等の追加費用なし、第2日目以降の日程を取りたい場合はできるだけ夕方以降となるようにしつつ、それでも午前中からとされる場合は必ず宿泊費負担を求める、という運用になっています。

そうは言ってもいままで1泊4千円台の宿は上野~浅草周辺でいくらでも見つかったのですが、僕がチェックしているいくつかの宿ではそろそろ価格の上昇、日によっては満室状態が観測されています。

昨年まで1泊4500円の宿が今月6500円になったら、宿泊費が1.4倍になった気がする(が、コロナ前繁忙期の価格に比べれば7割引きではある、と)。

変な世の中になったことの反射的効果が、僕を通じてお客さまに及んでいるとは言えるでしょうか。とりあえず出張相談は、可能です。相談料金は非事業者(で、付加金・慰謝料の請求を含まないもの)については2時間5500円、事業者からの相談は2時間13200円となっています。4月以降、金額を変更するかもしれません。

特定の誰かを指しているわけではないのですが、以前は労働紛争労働者側としてご依頼をくださった方が独立開業され、今度は経営側として相談・ご依頼をくださるパターンが少しずつ現れてきています。この場合は経営側で躊躇無く受託する(が、この事務所の裁判事務が依頼人に厳しいことはどっち側だって同じですけどね)ことにしています。ご興味のある方はお問い合わせください。

1台目を直したかったのか2台目を買いたかったのかは不明(FunHD 液晶パネル交換のような件)

新しい裁判事務のご依頼はどうやら来週あたりからスタートするようです。久しぶりに近畿地方でのしごとが来る、その前に表題の件。

画面にでっかい黒いシミを投影するようになった中華プロジェクターをどうにかせねばなりません。発現している事象は液晶パネルの致命的故障です。

手っ取り早くこれを取り替えるには。当然ながら、安く。

お約束でありすぎる展開をたどって手頃な中古の同型機を、3千円台で入手できました。

2行上の文章で『これ』は普通の事業所なら中華プロジェクターまたはプロジェクターの本体を指すのでしょうが、当事務所では『液晶パネル』を指すのです。

ブログのネタをくれたとはいえ、たった2年弱の使用を経て壊れたのはFunlogyなるメーカーのFunHDです。

メーカーは国内にありそれを重視して1台目は新品で買ってみましたが、次以降は新品で買うまでもないメーカーだとわかりました。

ちょっと改造したくらいで壊れやがって(逆ギレ)

経緯を要約します。本機は中国の怪しいメーカー製の安価なプロジェクター、いわゆる中華プロジェクターと同様に中国製でありファンがうるさい特徴を持ちます。これを本体に装備されたファンの速度を落とすことで静音化を図っておりました。1年半ほど前に実施したこの作業の際に、液晶パネルを過熱させて変色したのを確認しています。

…実は今までよくもってくれた、ということかもしれません。

そんなわけで、新品を買うことはないものの同型機の中古が安ければそれが欲しい、という程度には気に入っています。

中古機を探す過程で、違うメーカー少なくとも2社が同じ筐体で微妙に違う仕様のプロジェクターを出している、さすが中華プロジェクターだ、ということもわかりました。そっちの他メーカーに浮気してみたくなりましたが中古市場ではそちらのほうが高く、危険な遊びはしばらくお預け、となったところです。

で、やってきた2台目のFunHD。挨拶代わりに分解しました。

R0011952

制御回路の載った基盤は微妙にバージョンが違っています。スピーカーを左のコネクタから結線するか右のコネクタに結線するか、といった違い。あとは設定画面に出てくる日本語が凄く下手かちょっと下手か、など。

実は今回来た2台目のほうが1台目より製造時期が古いらしく、制御基板には4ヶ月ほど古い日付が刻印されています。主たるコネクタの配置は全て同じです。予想も期待もしたとおりに。

あと、なぜか2台目のほう=製造時期の古いほうがファンの動作音が静かな気がします。

詳細に分解してわかったのですが、ファンへのケーブルに抵抗が直列に挟んでありました。

で、早速健常な2台目から僕が欲しかった部品=液晶パネルを外して1台目に移します。

動作しました。

ただ、僕の欲しいものはそれじゃない、と気づいてしまったのです。

なぜか2台目=製造時期の古いほうが投影される画面が明るい。さらに焦点を合わせるためのレンズの回転がなめらかです。

ひょっとしたら製造時期が新しいほうが、製品として劣化している可能性が(苦笑)

方針を変えました。1台目で改造したファンと減速用の電圧降下モジュールを、2台目に移植するほうがよさそうです。

その前に、せっかく新旧同じ機種です。故障部品を使ってやってみたい実験がありました。

壊れたほうの液晶パネルに、温度計のプローブをセロテープでくっつけました。
冷却用のファンをどれだけ遅くしたら=静音化したらパネルが高温に耐えられなくなるかを試してみたかったのです。ついでに、空気を取り入れるスリットにつけるフィルターの代用品は何がいいか、とか。

どうやらフィルターの代わりは台所用三角コーナーに使う不織布製の袋か洗濯槽のホコリ取りネットがよい(純正フィルター装着時に比して1℃以下の温度上昇で済む)、騒音源として目立つ液晶パネル冷却用のファンはかなり風量を絞ってもよく、代わりにヒートシンクを冷却するファンを改善して排気能力を上げてしまえば液晶パネル温度は上がらない、ということがわかりました。

あと、初回の改造時に僕が増設したヒートシンク冷却用ファンは向きを逆にするとさらに2℃ほど冷える!ということも。

※一昨年の静音化改造では、本機のヒートシンク部分のケースを外して筐体外からヒートシンクに風を送るファンをつけたのですが、これだとヒートシンク周辺の熱気が隙間から筐体内に行ってしまう、ということらしいです。迂遠に思えるのですがこのファンを逆向きに取り付けることでもヒートシンクを冷やすことはでき、この場合はヒートシンクから筐体外に空気を送って熱気を直ちに遠ざけているので筐体内の温度を上げることがない、と理解しました。

そんなことを試してみましたが1台目の液晶パネルは若干色が変わったくらいでまだ完全に壊れはせず(パネル表面温度65℃~62℃を1時間維持した程度では壊れない模様)、あとはいっそ超音波洗浄機で洗えるか試そうか、などと思っているところです。

2台目ならぬ2代目は、初代より若干静かになるようファン速度の設定を追い込んでみました。
電圧降下モジュールの設定を筐体のフタを開けずに調整できるよう、さらに改良も加えました。

どうせ使わぬスピーカーを除去した穴が、ちょうどいい位置と寸法で空きまして

そんなこんなで休日のまる1日を投じた作業が終わり、机の上を元に戻し、1台目は部品取り用に保存と決して片付ける頃には、気づいていたのです。

Photo_20220224015301

Aliexpressでお買い物できたら、当事務所ではもう一台中華プロジェクターが使えるようになるらしい、と。

さすが中華プロジェクターというべきなのか、同じページには同型番らしいパネルがお値段半額以下、というのもあったりするのです(苦笑)

 

 

 

何かを踏みつけるとシアワセになれそうな反訳書作成のはなし(ちょっと意外な機材編)

この週末は林業雑誌への寄稿を準備しておりました。通常は3~4ヶ月周期で依頼される本件、おそらくはオトナの事情なのでしょうが2ヶ月連載のご注文をいただいていたのです。

そんな今週の凶事。中華プロジェクターが故障しました。

Img_20220221_034800

丸い黒いシミが画面左側で成長し、他の小さなシミを吸収合併しながら少しずつ移動しています。
3日後には画面右下にももう一個、仲間のシミが生まれました。

むかしむかし、Basicで作ったライフゲームを連想してしまいましたがこれは40代以上の、しかもコンピュータがお好きな方にしかご理解いただけないはずです。

いつもはこの投影画面を左右に分割して、右はテキストエディタ左はPDFその他の資料を表示しているところ、もうやりにくくてしょうがない(苦笑)

このプロジェクター、新品での導入から1年8ヶ月ほどしか経っておりません。調べたところ、液晶プロジェクターやノートPCの液晶パネルにこうした故障が出ることはあり、しかも中華プロジェクターの場合は1年弱で出る人もいる…言ってしまえばハズレ多めのクジ引き、ではあるらしいのです。

そんなこともあって、反訳書作成業務の話題を続けた今回は、最後に機材の話です。


複数の話者が録音なんか意識せず適当に言い合い、録音そのものもそのへんのスマホなど適当な機材と適当な環境でなされる、でもそれを文字化して提出しないと裁判所は証拠として採ってくれない、業者に出すと1分300~400円超の報酬を要求し依頼人自身がやろうとすると録音時間の10倍以上の時間投入を要する。そんなステキな裁判書類、反訳書。

もちろん素敵というのは皮肉です。
うっかり関与すると泥沼にはまる裁判書類作成業務の筆頭がこれだ、よって本件のみタイムチャージ制とする、とお客さまにも断言しています。

この作成をクラウド型の自動反訳サービスで行うと少しは不幸から遠ざかれそうだ、当事務所では一応Nottaを用いたい、という話の続き。

当事務所でも、昨年までは録音内容の反訳を完全にスタンドアロンなシステムで行っておりました。再生ソフトはこの世界ではおなじみのOkoshiyasu2を使い、キーボードに割り当てたショートカットキーで再生と停止と巻き戻しを定義して、聴き取った結果は表計算ソフトに入力していたのです。

これに対してNottaを使う場合は、ブラウザ経由で音声の再生と文字の編集ができます。あとは通信回線とPCの能力が十分であればいい。
見ているとHDDが律速段階になり、SSD搭載機はあまり影響を受けにくいように思えます。

うちのPCは全部SSDなんですが、HDD装備機を運用するお客さまがときに悪戦苦闘なさることがあるようで…必要なら費用をもらって介入するようにはしているところ。たぶん代書人と電器店は兼業できるのです(冗談)

で、本題。ブラウザ版Nottaにもショートカットキーが一応あります。カスタマイズはできないようです。再生/停止、3秒進む、3秒戻る、検索、この4動作はショートカットキーが決められています。このほかHomeで文頭、Endで文末へカーソルジャンプし、文中でEnterキーを押下すると文章が分離され、分離箇所に録音時間が表示されます。

反訳結果を例示します。冒頭にはNottaが付与する発言時間が示されています。

01:05
この労働契約ではバナナはおやつになりますよね。そうです。ならばバナナの規則は就業規則違反になりません。

上記の例で(←いったいどんな労働相談なんだろう)、『そうです』という部分は依頼人、これ以外の部分は代書人がしゃべっているのですが自動反訳サービスが認識を誤って1行にまとめてくることは結構あるのです。

このほか赤字の部分は誤認識箇所です。『なります』→『入ります』、『規則は』→『喫食は』と修正を要する、としましょうか。

※録音してるとわかってる話者は、変わった言葉を使わない・明朗にゆっくりしゃべる・できるだけ標準語を話す・自分から相手の会話に割り込まない、といった配慮をしたいものですが、そうすると『なんだか妙にお行儀のいいひと』になってしまいます。何年か前にそういう意識をして同業者さんと話した結果を補助者さまに反訳していただいたとき、彼女には見破られました(苦笑)

お話しを戻します。上記反訳例で編集作業としては、赤字の箇所周辺の再生停止巻き戻しをしつつ

  1. なり→入り との修正
  2. ますよね。|そうです。 の箇所で改行
  3. そうです。|ならば の箇所で改行
  4. 規則は→喫食は との修正

をサクサク行う必要があります。できるだけ停止や巻き戻しを減らし、他の再生箇所が正しく文字化されているのを見ながら編集作業をするのが時間短縮のコツです。

ここで、キーボードから手を離したくない、複雑なショートカットキーを押したくない、という発想がでてくるのです。

実は昨年末、中華な機材がもう一個壊れておりました。ペダル1個のUSB接続フットスイッチです。お値段千円ちょっとで5年は使ったでしょうか。

説明します。これは言ってみれば、マウスのボタンだけが足で踏めるスイッチになったもの、です。ボタンには希望のキーストローク(右クリックとかAlt+Ctrl+Delとか。『バナナハオヤツニハイラナイ』といった定型語句も可)を割り当てておくことができます。

このフットスイッチ、当事務所では図書館で借りてきた本1冊まるごとスキャンして電子化するのに使う重要機材なのです(みみっちい重要機材ではありますが)。フラットベッドスキャナに本を置いたあと、マウスに手を動かす時間が節約できます。で、これが壊れたのをきっかけに

国内メーカーが出してる、ちょっとお高いフットスイッチに買い換えておりました。今回は2ペダルを装備しています。

気がつけば電子化した図書が百冊を超えておりまして…本を買わずに済んだ差益をほんのちょっぴり投じたら買えた、ということです。

このペダルに普段は左クリックを割り当てていますが、反訳作業時は『Shift+Space』と『Enter』を割り当てます。
Nottaでは前者は再生・停止、後者は改行、つまりNottaが自動ではできなかった複数話者の分離に使います。

Enterはキー1回押下なんだから割り当てる必要ないか、とも思いましたが、ブラウザ版Nottaでは別の認識箇所を再生・確認中に別の箇所をマウスクリックしてカーソルを移動させ、改行その他の編集を行うことができます。そうすると、マウスに手を置いたままフットスイッチで改行を連打するのは悪くない、ということになりました。三秒巻き戻しのコマンドを割り当てるよりよさそうだったのです。

それと、漢字変換して修正した文字入力を確定させるときもEnterキーは使います。右と左のペダルを連打すれば入力確定→再生再開、を文字のキーから手を離さずに行えます。これでもう少し、作業速度が上がりました。

そうは言いつつも。
壊れたほうのフットスイッチの修復を終えました。二つのフットスイッチは全然別のメーカー製なので、別のキーを割りあてて計3つのペダルを利用できることになっています。

これで3秒巻き戻しのショートカットキーも、押さずに済むようになりました。

反訳書作成業務で幸せになれる気配はまだ気配だけですが、少なくとも不幸から遠ざかった、とはいえます。

他国の法律がちょっと気になる反訳書作成のはなし(サービス選択編)

日中は久しぶりに、すずき電器店の仕事をしておりました。

当事務所では裁判事務のご依頼を無事に終えた方に、電気製品の修理選定運用等の助言または代行等をおこなっております。ふだんはパーソナルコンピュータ関連品を扱うことが多いのですが、今日の案件は換気扇。

といっても取り外し後の制御部品の故障箇所診断だけですので、電気工事士法および同法施行規則には抵触しないことを確認しています。

…まさか電気工事さんとのあいだに業際問題を発生させるわけにもいかないし(苦笑)

なにをやるにも法律が気になる立場、ということで前回の記事の続きと表題の件です。

民事訴訟でたまに必要となるが、真面目に取り組んだら録音時間の10倍はかかる、大抵の場合立場が対立する複数の話者による会話の文字化。そんな反訳作業と反訳書作成の話の2回目は、僕が自動反訳サービスとしてNottaを選定したわけと留意点について、です。


人の発話を文字化する(テープ起こしなり記事録作成なり反訳で検索すると見つかる)サービスやソフトはいくつもあります。

大きくは、スタンドアロンつまりネットにつながっていないコンピュータ上で動作するソフトと、リアルタイムにインターネットにつながって動作するサービスとの二者に分けられるでしょう。

会話の内容を文字にする、という効用のみに注目すると、スタンドアロンのソフトはクラウドを利用するサービスに比べて劣ります。特に、不特定多数の話者の会話を何がどうあっても文字化せねばならない民事訴訟での反訳書作成業務では、そういえます。

理由は超簡単です。十分に流行っているクラウド型の反訳サービスには、それこそ日進月歩の勢いで『さまざまな音声のサンプル』と『利用者が勝手に修正してくれた音声反訳の成果』がサービス提供事業者にどんどん集まってくるわけだから。

それらを反映してサービス品質は、迅速に確実に顕著に向上します。

性能のみに着目すれば、反訳書作成でスタンドアロンのソフトなんか使う奴は馬鹿だ、と言い切って差し支えありません。
事務局で働く労働者に十分な残業代を払わないからそんなことやってられるんだろ、と僕なら疑いますがこれは極論です(苦笑)

ただしこれは会話を文字化する、という効用に関してのみの話です。

その辺の上司のパワハラとか別れかけの夫婦の駆け引きとか詐欺的投資の勧誘とか、とりあえず当事務所が現在扱っていない案件で例示しましたが…第三者からみてどうだっていいような会話なら興味を持つ人もそうはいない、とは思います。

これが中国政府の打倒だとちょっと話が変わってくるわけです。例えとして極端なのは自覚していますが。

今やってるオリンピックでも一部から指摘が出ているように、開催国に行った選手や随行者のオモテやウラの情報はあらゆる電子デバイスから当局が取り放題♪になる可能性について、少しは意識しておきたいところです。

本人訴訟の当事者として=つまり自分が了解して中国・香港の事業者が提供するサービスやアプリを使うなら別にどうこう言う話ではないですが、士業が誰かから依頼を受けた案件で勝手にこうしたサービスを選定するのはマズい気がしています。

まぁ潜在的にデータが他人に漏れる可能性は、全てのネット関連サービスにつきまとっています。gmailが安全でNottaが危険ということもない。

というよりgmailなんか、アドレス持ってると他人に言うだけでアカウントを乗っ取られる危険度を自分で上げているように思えてなりません。

だってgmailのアドレスって、あれはメールアドレスじゃなくてIDじゃないか、と思うのです。それを使ってログインすれば実にいろんなサービスを受けられるのに…お客さん達、みんな見え見えまるわかりなパスワードしか設定してないんですもん(詳細はこれ以上は言いませんが)

実は僕のgmailのアドレスをお客さまとのやりとりに用いないのには、上記のワケがあったりします。もちろん二段階認証を用いてはいますが…人によってはそれもなかったりします。

結局のところクラウドサービスの提供者から情報が漏れるよりサービス利用者から漏れるほうが可能性としてずっと高い、という不都合な真実はさておいて、お話しを戻します。

今時のクラウド型サービス事業者なら、少なくとも日本語でサービスを提供しているなら、一応見られるプライバシーポリシーを制定公開しています。

まぁ業界団体およびその会則やら専門家倫理、監督官庁からのお呼び出しくらいならクリアできそうな規定を持っているであろう、これは米国所在の超巨大企業からそのへんに生えてるCATVのプロバイダまで共通です。

そこに書いてあるプライバシーポリシーを信頼しました、と遠い目をしてつぶやいていればまぁ、品位保持義務違反を認定されたり懲戒事由への該当を指摘されることはないだろう、とは僕も思います。

ただ中華人民共和国については、最初っから喧嘩腰な法律を制定してくれています。いわゆる国家安全法と国家情報法がそれで、あれはどうみたって香港所在の企業が日本人向けに出してるプライバシーポリシーなんかよりそっちの法律の方が優先するに決まってます。

端的に言うと、あの国で事業やってるかぎり役人が見たいといった情報は全部見せる義務があるようにしか見えません。

繰り返しになりますがお話しが日本国内で完結するパワハラや離婚条件や投資詐欺程度なら真剣に考える必要はないとしても、法体系として守秘義務が害されるような状況になりうるサービスを敢えて利用するなら依頼人の同意は一応求めておいたほうがよかろう、ということで。

会話の反訳でクラウド型サービスを使おうとする場合、提供事業者が日本国内にあるか香港を含む大陸中国にあるかは、士業にとっては重要になってきます。

たとえ会話内容に、天安門事件への歴史的評価や新疆ウイグル自治区の人権状況が含まれていなくても。

クラウド型サービスがいいと言いながら反訳サービスの選定で最後までAmivoiceを残したのはこの提供会社は日本にあるから、だったりします。

性能だけで比べた結果、以前のブログでも少し書きましたがクラウド型ではRimo VoiceNottaの二者が残りました。

この両者は、録音されたデータに含まれる日本語会話の文字化なら甲乙つけがたい精度を持っています。ただし、Nottaのほうが話者を切り分けて改行や録音ファイル中の発言時間を入れてくれる機能に優れています。

このため、話者複数・長時間の録音になりやすい裁判書類としての反訳書作成業務ではNottaが第1選択肢に上がってくるのです。

※Rimo Voiceはそのウェブサイトで、日本語に特化したAIがどうこう、というアピールをしていますがそうした恩恵は感じません。むしろ利用者の数(提供される音声データと修正結果)が多ければ性能は勝手に上がっていくのがクラウド型反訳サービスの特徴であり可能性だ、と考えます。

もう一つ、両者の大きな違いはRimoが日本の会社、Nottaはどこに国籍があるか明示されていない会社によって運営されていること、です。

Nottaのほうは、ウェブサイトからは会社がどこにあるか読み取れませんでした。
特定商取引法に基づくサービス提供者の表示も実はないようです。

でもウェブサイトのソースには繁体中国語が書いてある、と。

で、念入りに見ていくと。本日時点の利用規約第22条では紛争発生時の専属的合意管轄を香港国際仲裁センターにしてあることがわかります。

こんな会社、日本にあるわけがない(笑)

むしろNottaの提供会社は香港にあり、ゆえに中国の国家安全法その他の法律が利用規約に優先し、当局がその気になったら録音も反訳結果も読み放題♪という可能性は一応想定しておくのがスマートな利用法です。

そんなNottaを単純にありがたがって使うのはいささか間抜け、ということになりましょうか。
ウェブで仕事するライターがNottaを推奨するツイートをあれこれ見ますが、こんなオッチョコチョイの取材は受けたくないな、と思わされます。

士業としては、依頼人に一応のリスクを説明し、録音会話中に大陸反攻とか自由チベット万歳といったNGワードがないことを事前確認し、さらに念のため文書またはメールによる明示的承諾を得られれば反訳書作成にNottaを使い、そうでなければRimo voiceを使うことにして。

実はこの両者と、音声の文字化に際してスタンドアロン型では大きな国内シェアを持っているであろうAmivoiceとの品質差は凄く大きい、という話を済ませてしまいます。

テープ起こしに関連するサービスをいろいろ調べていると、国内ではVoXTというサービスのウェブサイトが出てきます。
これはAmivoiceを組み込んだサービスを提供する会社が運営する音声認識サービスで、一応クラウド型を標榜しています。録音データをアップロードお金払えば文字化してくれる、というもの。

そのウェブサイト中、音声文字化に供する音声ファイルの品質の重要さを説明するページがあります。
音源が遠かったり雑音があったりすると文字化困難になる、ということで、4つの音声ファイルと同サービスでの認識結果が出ています。

4_20220214005601

と、なれば。

そのページで提供されている音声ファイルをNottaの音声認識にかけてみるのは誰でも考えますよ(笑)

結果は当然、Nottaが圧倒的に優越するものでした。
性能のみに着目するかぎり、VoXTその他Amivoiceの関連サービスの採用は非推奨、選択肢にも挙がらない、というわけです。

ただ、上記引用箇所のページ記載の主張内容は正しいのです。

提供される録音の品質は、クラウド型でもスタンドアロン型でも音声認識の精度に決定的な影響を与えます。

限定的ながら、音源の提供をうけた後に若干の対処が可能です。ここで使用するのはAudacityですが、音声の増幅とノイズ除去の機能がありWav形式でのエクスポート可能ならどんな音声編集ソフトでもかまいません。

『Audacity ノイズ除去』等で検索してソフトと使用法は把握していただくとして、説明を続けます。

※気づいたらこの超優秀フリーウェア、開業以来十数年使わせてもらってます…ネットの普及で世の中がよくなった、と思える数少ない例の一つかもしれません。


余談はさておいて。以下の比較を試みました。

守秘義務に反しない範囲で説明します。さいきん提供された要反訳ファイルは以下のようなものでした。

  • 録音機材は一般的なAndroidスマホ+同スマホ標準装備の録音アプリ
  • 録音場所は普通の部屋のなか
  • 録音担当者もそうでない者も勝手に発言する、2名の会話

要するにスマホさえありゃ誰でも録れる音声ファイルが来た、ということです。

これをまず、提供されたままNottaで音声認識にかけました。これをファイルaとします。
自動で反訳した結果の大雑把な印象として、総文字数の半分~7割程度が正しく文字化された感じがします。

さらに、Audacityで音声の増幅を弱めにおこなったものと強めにおこなったものを用意しました。それぞれファイルb、cとします。

最後に、ファイルcで音声増幅後にAudacityでノイズ除去をおこなったものを用意しました。ファイルdとします。

ファイルb・c・dの認識結果を、それぞれ当初のファイル、つまりファイルaと比べました。

比べた箇所は、裁判所に提出できる反訳書作成の手間に直結する『比較したファイルの片方だけ、発話した内容が正しく文字になっている箇所』と、『同じく片方だけ、発話した人が違う箇所の前後で適切に改行した箇所』です。

双方ともに正しく認識したり、双方とも誤認した箇所はカウントせずに比べました。同じ箇所2分間の反訳内容を比べた結果。

ファイルa:修正なし b:弱度の増幅 ファイルc:強度の増幅 d:強度の増幅+ノイズ除去

a  b  |  a  c  |  a  d |

 2  7    4  14   5  16

見にくい表ですね(苦笑)

aとb、つまり提供された音源aと軽度の増幅を施した音源bを比べた場合、aが正確に認識した位置でbが間違った箇所は2箇所、bが正確に認識したのにaが間違っていたのは7箇所、そういった比較結果になりました。

bとcの結果を比べると、ある程度は音声を増幅したほうがいいようには思います。ただし音割れするまで増幅すると、かえって認識結果は悪くなります。Audacityには音声の波形が出ますので、原音の波形が損なわれない範囲で増幅するのがよいでしょう…が、たまたま波形が大きい箇所は会話とは違う雑音が入ってるということも多いもの。録音を一通り聞いてから決めますが、僕は多少波形が壊れても強めに増幅していいと考えていたりします。

実施するかしないか微妙に迷うのはノイズ除去をするかどうか、です。これは機材に固有の(一定の周波数・音量の)ノイズをカットするもので、その辺のICレコーダーやスマホなら絶対入ってしまうノイズの低減に威力を発揮します。最終的に録音を人間が聞き分けるときにも有用ですから、一応微弱に実施するのがよさそうだと考えているところです。

そんなことやったってファイルacとadの比較を見ていると、2分の録音で差し引き10箇所ちょっと修正の手間が減るだけでは?と思われるかもしれません。

いいえ。その音源が180分あり、更にそんな録音ファイルが20個ある状況を考えてください(と、ドス黒い声で言ってみたい今日この頃)


この記事には後日、Audacityの波形の画像を加えたほうがよさそうです。次回以降に続きます。

あと、法的判断に立ち入らない=もっぱら技術的な観点からの助言のみを求める反訳書作成相談については、司法書士法第3条1項5号所定の裁判書類作成にかかる相談として当事務所でお受けします。地裁家裁簡裁などの提出先・請求額にかかわらず対応可能です。

そんな相談するのかい、とご同業の皆さまから突っ込まれそうですが、当事務所ではときどきあるのです。

なにしろ、これは合法的に提供可能なサービスなんですから(遠い目)

用意ドン、でしばらく停止する反訳書作成のはなし(準備編)

反訳書。訴訟で提出する、複数人での会話の記録を文字化した書面です。

民事関係裁判書類作成を主たる業務とする当事務所で、最もやってはいけない作業を三つあげればまずこれだ、といえる仕事が反訳書の作成です。今夜はその業務を一つ終えました…作業が終わったときには20時を回っており、晩ご飯のお買い物に出るのもおっくうになってしまいましたが。

この作業が面倒な理由。人の頭はたぶん、会話を正確に文字として認識していないように思えます。10分なり1時間なりの、ウソやごまかしや怒鳴り合いなどが入った録音データをポンと投げられて、再生と巻き戻しを繰り返しながら文字入力して厳密に逐語訳する作業に慣れている、などというのはこれを仕事でやってるごく一部の人に限られます。講演や裁判所での尋問など、話者が限定されており発言が交錯しない録音を文字化するのよりはさらに難易度が高いのです。

さらに、これは当事務所特有の理由かもしれませんが。
録音中に出てくる人物の最低一人は、反社会的なパーソナリティ(゚_゚;)

会話内容や事案そのものに下手に思い入れると義憤に駆られるかゴミ箱を蹴飛ばしたくなるか昼寝したくなる、併せて関係者ご一同様には代用監獄か閉鎖病棟でいい物件をご紹介してみたくなる、そんな人が必ず出てくるのです。そのいずれかの施設利用歴が既にある人が出てくる会話も時折あるようで、とにかく心穏やかにできる業務ではない、そのことだけが明らかな状態で作業に入る、と。

勝手な人が馬鹿なことをした紛争でほかに書証がないとき、半ばやむを得ず作るのが反訳書。そういうことなのです。

逆に考えれば、事実認定をめぐって激しく争う案件になることが多く真面目に取り組めば代書人としての技量はあがるが時間あたり収益は下がる、そういうことだったりもします。

ですので案件としては好んで受けていることが多いのですが(この点では、依頼人の皆さまには安心していただきたく存じます)とにかく反訳書作成の依頼を安易に受託しないよう常に気をつけているところ。

作業を手伝っていただく補助者さまを意識して、反訳書作成を控えた出張時には特に念入りに、いいチョコレート(お土産)を探せ、というのも重要な注意点です。

そんな反訳書作成のご依頼を受けまして。
一昨年と昨年に引き続き、やっぱり今年も挙動の変な相手方の言動がいっぱい入った録音データがやってきました。

しかし当事務所の実務は、一昨年と昨年とは違うのです。印象としては、作業に伴う苦痛が6割ぐらい減った気がしています。

…昨日から、なんですがね。

実は新しいサービス・ソフト・機材の使用に伴う作業方法をようやく確立できたのが昨日でして。

お客さまとは先月から、複数ある録音ファイルを分担して反訳作業にあたっているのです。

結果として…

正直に淡々と作業に取り組まれたお客さまの努力を裏切ってペースアップすることになったかもしれません。意図してやったわけではありません。

納期約一週間あったうちの半分を、利益を生まない試行錯誤に費やした結果を明日以降記事にします。要約すると

  1. データの漏洩を気にしなくていい状況下にあることを確認したうえで、自動反訳のサービスはNottaを利用する
  2. 録音機材は指定できないから、渡された録音データはAudacityで前加工を施す。施すのは音声の増幅と、若干のノイズ除去。
  3. 音源は音楽用CD形式での提出を考慮して、前加工では最大74分(CDにより80分)ごとの録音時間で録音データを分割する。これも前加工で行い、NottaにはWav形式のデータをアップロードする。
  4. Nottaは適切に整備されたPCと有線LAN、光ファイバーでのインターネット接続がある環境下ではWeb版の利用を可とする。そうでなければタブレットかスマホにアプリをインストールして運用すると、挙動の低速化は防げる。
  5. 複数回この不幸、いえ業務としての反訳書作成に立ち向かう予定がある場合、フットスイッチの導入を強度に推奨する。2ペダルを装備したものがあると、ひょっとしたら幸せになれるかもしれない。
  6. 業務として反訳書作成を行う場合は、依頼人とはできるかぎりNottaのシステムを用いて反訳結果の確認や編集を依頼・分担することが望ましい。
  7. 校正が済んだ反訳データは、Nottaにテキスト形式でエクスポートさせ、表計算ソフトに取り込んで完成させる。

以上で、発言ごとに話者が分離され、録音ファイル中の発言時間が併記された反訳書の内容が入手できることになります。作業時間を短縮する(または、時間の浪費を回避する)のに役だったわりに、世のウェブサイトに載ってないのは上記2・4・5項でした。このあたりの工夫を確実に有用なものにするために…ある程度時間を突っ込んで(見かけ上作業が進んでない状態に耐えて)試行錯誤を続ける必要があったわけです。

なので、作業終了までこっちの進行状況は黙ってました。この作業に関しましては(笑)

フットスイッチを含めて、この作業に必要な費用は5千円でお釣りがきます。ご同業の先生方にはちょっといいフットスイッチを買う1万円コースがよいでしょうか。

本人訴訟の当事者などごくごく少数の読者さんを想定しつつ、この記事は明日以降に続きます。

« 2022年1月 | トップページ | 2022年3月 »

2024年9月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30