低レベルな記念日(実務に使いだす、Python)
昨日、東京から帰ってきました。所定6時間弱かかるバスがあっという間に名古屋に着いたように思えたのは車内で仕事をしていたからです。
ブログへの出現頻度が高すぎる、とは思うのですが録音が膨大にある事案を担当しています。この反訳が膨大な手間を発生させています。
同時にちょっとした新しい経験と、工夫の余地も。今日はそうした話しです。
IT反革命というかDX化の失敗というか、そうでなければ現代版ラッダイト運動はこの事案でも堂々発生しました。
膨大な録音をまず自動で反訳するサービス(Notta)にかけるところまではいいのです。
それをお客さまに修正していただきます。
これを受け取って反訳書の書式を整えるのが僕の仕事です。
Nottaの出力結果はテキストで出力され、発言時間と発言内容が自動で記録されます。が。
発言時間→発言者(お客さまにより追加)→発言内容、の順に記録したデータをくれ、とお客さまに申し上げたらそのとおりのテキストファイルが引き渡されました。
CSVでもエクセル形式でもなくて(゚◇゚)ガーン
※指示が曖昧だった僕が悪いのです
そういうことにしときます
(と、血の涙を流しながら言ってみたい)
で、各データの間はカンマではなく全角や半角のスペースを駆使して区切られており、そして一部は区切られておらず、さらに半角スペース全角スペースがランダムに出現します。録音時間と発言内容との間には、発言者(全角2~3字の文字列)が書いてあることもないこともあります。
つまり、これを一発で表計算のワークシートに収容することは表計算ソフトの機能を用いる限り、絶対できないのです。
実は同様データをすでに渡されて、裁判所に提出しています。
その際には置換作業を7回やって、データを分割し、さらに目視で修正するとワークシートに収容可能だ、と確認はしたのです。
前回は提出ファイルが3件で済んだのですが、今回は4件、行数=録音時間は3倍以上、そんな未来が見えてきました、と。
そんなのデータ区切りを指定して依頼人に差し戻せばよいではないか、他事務所なら当然そうするし、どうせ依頼人は手作業でそれをやるから、そのうち当該作業を粛々とこなしてきた当事務所の重要さに気づくであろう。
という意味のことを補助者さまは話します。たぶん彼女は正しいのです。
ですが、それは今や、ハラスメントに該当しそうです。
なにしろ処理対象が余裕で3千行を超えており、4千行に達する勢いです…あはは(乾ききった笑い)
折しも、といいましょうか。補助者さまに対して続けてきたプログラミング言語(Python)の技量習得はオンライン学習サービスの利用を終え、外部から提供されるCSVの読み書き・データ加工が限定的に可能なところまで進んできていたのです。
そうしたわけで、補助者さまへの説明を兼ねて簡単なプログラムを書くことにしました。
当初は正規表現を使わずに、パターンでマッチする文字列だけ置換してファイルに出力することを想定(妄想)していたのです。
うまく行かなくなった箇所に対応するだけの置換条件を増やしたためコードがやたらに長いわけですが…補助者さまへの説明用だ、とご理解ください。
これで1ファイル3千行の処理は1秒弱で終わり、手作業で修正する箇所は10行弱=0.3%程度にとどまります。
プログラムの作成、というよりお客さまが渡してくるテキストファイルに用いられる全半角スペースの出現パターンの分析に数時間を要したため、この業務単体で言えば表計算を用いた手作業より時間は要するのです。
ただ、今後も同じようなファイルはいくつも来るのです。
僕がお客さまに、納品データの形式変更を指示しなければ。
ここで安易な変更を行うことはさらに混乱を招くわけですから、ならばこちらで作業を吸収して現状維持をするのが妥当です。
顧客には優しいが方向性は間違ってる気もしてはいます。ですが記念日というべきかもしれません。
当事務所においても、ようやく実務にPythonを使って数時間単位の作業時間を減らせるようになった、とは言えるのです。
このコードが 長いねと補助者さまが言ったから 4月11日はPython記念日
( ↑ 20代30代の方には、俵万智という歌人がおりまして…と解説を加える必要があるのでしょうか)
« プチ断食に最適な宿(福島東京出張6泊7日 4~6日目) | トップページ | さらに、低レベルな記念日 »
「本人訴訟」カテゴリの記事
- 憲法など無きものと思え(上告理由としては)(2024.12.08)
- そうだ、米原、いこう(僕なりのやり方で時間をお金で買ってみた件)(2024.05.22)
- 10月下旬の東京出張決定について|裁判事務のご依頼かくあるべし、という話し(2023.10.16)
- (それでも)裁判書類の添削のご依頼をお受けしています(2023.08.12)
- 8月初旬の出張【変更】/依頼受付の停止について(2023.07.30)
「零細事務所の電算・情報・通信」カテゴリの記事
- 片足をひたしてみるマイクと音声編集の沼 後編(2024.05.06)
- 片足をひたしてみるマイクと音声編集の沼 中編(2024.05.01)
- 片足をひたしてみるマイクと音声編集の沼 前編(2024.04.24)
- 申請用総合ソフト:バーコードリーダを使用せずに行うQRコード読込の導入事例(2024.03.21)
- 冗談から使い始める生成AI(2024.01.20)
コメント