ソフト

録音音声データを自動で文字化できるソフトは使えるか

  • このエントリーをはてなブックマークに追加
音声認識ソフトで録音音声を文字化

テープ起こし(文字起こし)の作業を軽減したいので、何かいいソフトはないか。こうした質問は、一般の方はもちろん、私たちテープ起こしライターの間でもよく聞かれます。

そこで近年注目されているのが、録音音声データを自動で文字化(テキスト化)できる音声認識ソフトです。これを使えば、面倒なテープ起こし作業から解放される!?

おもな音声認識ソフトやサービス

スマホでお馴染みの音声認識機能

スマートフォンのテレビCMなどで、スマホに向かって利用者が質問すると、求める情報を提供してくれたりする場面を見かけます。これは音声認識機能により、人の発した音声を言葉として理解してくれるからです。

音声認識の技術自体は昔からありましたが、iPhoneに「Siri」が搭載されたあたりから俄然注目を集めるようになり、その技術も急速に進化しています。

この音声認識の技術を使うことで、音声入力による文字化も可能で、その精度もかなり高くなってきました。

録音音声を自動で文字化できるか

さて、それではICレコーダー等により録音済みの音声データについては、自動で文字化できるのでしょうか。

というのも、いわゆるテープ起こし(文字起こし)においては、講演やインタビューなどの録音音声データを文字化できなければ、実用的とはいえないからです。

録音音声データを自動で文字化することは、できるか否かと問われれば、「できる」が答えになります。

録音音声を文字化できるソフト・サービス

たとえば、以下のような音声認識ソフトやサービスを使えば、録音音声からの文字化が可能です。

ただ、「できる」と「使える」は違います。その点については、次項で述べます。

  • ドラゴンスピーチ11
  • AmiVoice SP2
  • VoXTセルフ
  • Voice Rep Pro 2

他にもあるかもしれませんが、比較的よく知られており、ネット検索などで調べやすいのはこれらのソフトやサービスです。

それぞれのソフトやサービスについてくわしく知りたい方は、ご自身で検索して調べてみてください。

情報収集は冷静に

少し余談になりますが、ネット検索で調べる際、気を付けたほうがよいことがあります。

一部の音声認識ソフトは、アフィリエイト・プログラムを使って販売されているため、やたらと持ち上げたレビュー記事等を見かけます。

ネット検索に慣れた方でしたら「これは宣伝臭いな」と気づくと思いますが、慣れていない方は少し引いたスタンスで冷静に情報収集されることをお勧めします。

なお、アフィリエイト・プログラムで販売している音声認識ソフトはダメだと言っているわけではないので、もし検索していて気づいても、その点は誤解されないようにお願いします。

録音音声を文字化(テキスト化)する精度は

実用レベルに達しているか

録音音声データを自動で文字化することについて、「できる」と前述しました。

それでは、テープ起こしの実用に耐えうるものかどうかという問題についてです。つまり、「使えるか」ということです。

これは簡単に白黒はっきりとは言えませんが、現役のテープ起こしライターとして日々作業をしている私の個人的見解としては、「まだ実用レベルでは使えないかな」というのが現時点での答えになります。

〇△×で言えば、△といったところでしょうか。

音声認識に適した録音音声とは

音声認識の技術は日進月歩なので、私の見解が最新だとは言いませんし、将来的にはより実用レベルへと近づいていくことでしょう。

また、現時点においても、いくつかの条件を満たした「音声認識に適した録音音声データならば可能」といえます。

その条件とは、以下のようなものになります。

  1. レコーダー(のマイク)と話者の口元の距離が近く、録音音声が明瞭である場合。
  2. 録音場所の雑音、様々な原因によるノイズがないクリアな音質である場合。
  3. 不明瞭な発音、強い訛りなど、聞き取れない言葉が少ない場合。
  4. 複数人のランダムな会話でない場合。

1については諸説ありますが、マイクと口元の距離は10センチ以内とも言われています。

2、3については、実際の音声データは録音場所、話者、録音状態、聞き取りやすさ等が様々で、10本の音声があれば10本とも異なります。

現実的には、アナウンサーのような人が話しているのを、静かな場所で、至近距離で録音しました、などというクリアな音声は少ないといえます。

4は、だいぶ技術が進化しているようですが、音声認識で複数人の話者を聞き分けするのは難しいといわれています。

どの程度の録音音声なら認識できるか

「雑音や不明瞭な言葉は音声認識できないというが、どの程度なら大丈夫なのか」と聞かれることもあります。

上述のとおり録音音声は様々なため、具体的に明示することは難しいです。

録音音声を科学的に分析して、何かの数値がいくつ以上(以下)ならOKといった基準を作ることは可能かもしれませんが、私の知る限りまだそのようなものはありません。

この方法なら音声認識で文字化(テキスト化)できる

最初から音声認識ソフト使用を前提にする

もし、録音前から、この音声データは音声認識ソフトで文字化すると決めて、録音時点から十分注意して音を録れば、良い結果を得られる確率は高まります。

私はお客様が録音した音声データをお預かりしてテープ起こしを行いますから、どうしても様々な音声データを取り扱うことになります。そのため、「まだ実用では使えないかな」という見解になってしまいます。

音声認識ソフトを使った裏技

録音音声データを音声認識ソフトで文字化する、別の方法について説明します。

これまで述べてきたように、音声入力がしっかりできていれば、音声認識による文字化の精度は上がります。

そこで、ヘッドセットマイクを使用して、録音音声を聞きながら話の内容を復唱し、音声認識ソフトで文字化するという方法です。

要は、録音音声を聞いて、作業者自身があらためて音声を入力し直すということです。

私自身はそこまでして音声認識ソフトを使おうとは思わないので試したことはありませんが、ご興味のある方は試してみてはいかがでしょうか。

■関連記事

この記事を読まれた方は、下記の記事もあわせて読まれています。

テープ起こしに役立つ音声ソフト「okoshiyasu2」

  • このエントリーをはてなブックマークに追加

簡単!無料!テープ起こし見積り

録音済みの音声について、テープ起こしを依頼したときの見積料金をスグに知りたい。そんなときにご利用いただきたいのがこちらの「簡単!無料!テープ起こし見積り」です。以下のとおり、いつでも気軽にお申し込みできるのが特徴です。

  • ★録音時間・お名前・メールアドレスのみの記入でOK!

  • ★取り急ぎ見積料金だけスグに知りたい

  • ★もちろん、テープ起こし見積りは無料です


テープ起こしの見積りは当サイトの依頼フォームからも申し込みできますが、入力項目が多いのでやや手間がかかります。現段階ではとりあえず見積料金だけすぐに知りたいという方は、こちらの「簡単!無料!テープ起こし見積り」をご利用ください。

簡単!無料!テープ起こし見積り

コメント

コメントを残す

*