音声データを耳で聞いて、文字に直すテープ起こしの作業は、想像よりも時間を要する作業です。
録音データは音声ばかりでなく背景の雑音も一緒に録音されてしまうことや、レコーダーの設置場所などによっては音声が聞き取りにくくなっている個所があったりと、不明瞭な声を文字にしていくのは非常に時間と根気のいる作業となります。
ここでは、そのテープ起こしを楽にする便利なツールについてご紹介します。
レコーダーが無くてもスマートフォンで音声を録音できる録音アプリ、録音データを聞きやすいスピード、クリアな音質で再生するサウンドプレーヤーソフト、キーボードでの入力よりも時間と労力を節約できる音声入力機能、その他の高機能ソフトの4つの分類に分け、それぞれの特徴をご紹介します。
無料で利用できるものから有料のものまで、幅広い内容のツールがあります。
iOS用のボイスレコーダーアプリです。音声録音の他、必要な箇所だけを切り出して保存する編集機能も備えています。内臓のフィルターが背景の雑音を抑えるため、聞き取りやすい音声の録音が可能になっています。
また、録音した音声データをテキストデータに変換することもできるとても便利なアプリです。
また、SNSやメールでのデータの共有もできます。iPhone用のアプリのため、持ち運びにも便利で手軽に利用することができます。
販売価格は360円です。
Android用のボイスレコーダーアプリです。シンプルな録音アプリで、高音質での録音が可能です。録音時間の制限がないため、長時間の利用にも対応するこができます。録音ファイルは圧縮して小さいサイズで保存することもできます。
録音ファイルはメールやSNSで共有することができ、アプリを開かずにバックグラウンドで録音を開始することもできます。
無料で利用することができます。
テープ起こしを行う株式会社アスカ21が提供しているソフトウェアです。テープ起こしに便利な機能を搭載したサウンドプレーヤーをインターネット上から無料でダウンロードすることができます。
聞き取りにくい音声をクリアにするイコライザーやエフェクト機能、特定の部分だけ繰り返し再生したり、ゆっくり再生したりすることができる機能など、テープ起こしの際にあると便利な機能がそろっています。
また、テープ起こしの際は、極力キーボードから手を離すことなく入力作業を続けたいものです。
そのため、再生や一時停止などの操作も、マウスを触る必要がなく、キーボードだけで操作できるようになっています。
テープ起こしプレーヤーが対応している音声ファイルの形式は、WAVE、MP3、WMA、FLAC、AAC、AC3、Rawとなっており、幅広い形式に対応が可能となっています。
これまで、iPhoneをレコーダーとして使用していた場合は、iTunesなどでファイル形式をMP3に変換する必要がありましたが、テープ起こしプレーヤーは、iPhoneのデータをそのまま読み込むことができます。
再生速度や音程などを個別に操作することのできる音声再生ソフトです。キー設定を行うことで、キーボードのみで再生や一時停止、巻き戻し、早送りの操作を行うことができます。
巻き戻しや早送りの秒数も設定することができ、再生速度の調整や一定区間を繰り返し再生する区間リピートの機能もついています。
テキストを入力しながらでも、ウインドウが隠れている状態で音声の再生・停止などの操作をすることができ、テープ起こしの作業に使いやすくなっています。
WAVE、MP3、Ogg Vorbis、WMA形式の音声ファイルに対応しています。
無料でダウンロードできます。
音声ファイルの再生速度と音程を個別に変更することができる音声再生ソフトです。
テープ起こしで聞き取りにくい箇所などで音程を変えずにゆっくり再生する機能や、指定した箇所だけを繰り返し再生する機能も備えられています。また、音程や再生速度を変更したデータを保存することもできます。
WAVE、MP3、WMA、Ogg Vorbis、AIFF形式のファイルに対応しています。
無料でダウンロードできます。
Windowsに標準搭載されている機能で、パソコンのマイクの設定を行い、Windows音声認識ソフトを立ち上げるとマイクに向かって話された言葉がメモ帳に文字として記載できる機能です。
音声ファイルには対応していないため、テープ起こしの際にはクリアな音質の場合にはレコーダーをパソコンのマイクの前で再生することで利用できます。
無料で利用ができます。
WindowsだけでなくMacにも音声入力機能が装備されています。テキストを表示させたい場所でショートカットキーを押すか、音声入力メニューを選択することで簡単に利用することができます。
こちらも音声ファイルには対応していないので、クリアな音質の場合にはレコーダーをパソコンの前で再生し、テキストデータを生成する形になります。
無料で利用ができます。
Googleドキュメントにも音声入力機能が備わっています。ツールメニューから音声入力をオンにし、表示されたマイクをクリックすることで話す内容がテキストデータとして表示されるようになっています。
こちらも音声ファイルには対応していないため、クリアな音質の場合にレコーダーの音声を再生し、テキストデータを生成する形となります。
無料で利用ができます。
Texterはリアルタイムで自動文字起こしができるiOSアプリです。音声入力以外の機能も充実しており、画像やPDF、動画、手書き文字でもテキストにすることが可能。また、英語やフランス語などの主要言語を翻訳する機能も備わっています。
Texterの基本利用料は無料で、すべての機能を制限付きで利用することが可能。たとえば、無料版での音声入力は1分までとなっており、月1,000円~の有料プランに加入することで、1時間以上の音声入力ができるようになります。そのため、長時間におよぶ音声を文字起こしする場合は有料プランがおすすめとなっています。
まずは無料版をダウンロードしてみて、使い勝手や音声入力の精度を確認してみてから、有料プランに加入するかどうかを検討してみてはいかがでしょうか。
音声文字変換&音検知通知は、聴覚障がいの方や難聴の方を支援するためにGoogleが開発した無料のAndroidアプリです。世界各国で1億回以上ダウンロードされており、日本においても、聴覚障がい児を支援している株式会社デフサポが、子どもと円滑にコミュニケーションを取るためのツールとして導入している実績があります。
音声入力機能の特徴としては、マイクで録音した音声をリアルタイムでスマートフォンにテキスト表示できること。また、操作もアプリを起動して中央のマイクアイコンをタップするだけと簡単で、80以上の言語や方言、2言語間のクリック切り替えに対応しています。
録音中は話し手の音量が周囲の音量と対比して表示されるほか、話している途中の音量調整も可能で、しっかりと声を拾うように設定できるのもポイント。また、音声を変換したテキストは3日間保存されるように設定でき、保存したテキストのコピー&ペーストや検索も可能です。
高精度の音声入力・音声操作のソフトウェアです。高度な音声入力が可能となっており、IT用語や政治経済用語なども含む約100万語搭載の辞書を利用しています。
WAV、DSS、 DS2、 MP3、 WMAファイル形式の音声ファイルに対応しています。指定されたフォルダに保存されている音声データを自動的に文字化するエージェント機能も搭載されています。
Word、Excel、PowerPoint、OutlookといったWindowsソフトにも対応しており、直接入力の他、音声ファイルをこれらのWindowsソフト上にテキスト化することができます。
「ドラゴンスピーチ11」の販売価格は23,100円(税抜き)、「ドラゴンスピーチ11 Lite日本語版」の販売価格は14,148円(税抜き)となっています。
専用ソフトウェアを使って、録音データのテキスト化を行うテープ起こし支援サービスです。
インターネット上に音声データをアップロードする自動的にテキスト化がされるようになっています。
音声認識により文字変換されたデータを元になった録音データの音声を聞きながら修正や校正ができるアプリケーションも用意されています。
1分30円の従量課金制となっており、録音データの利用したいところだけサービスを使うこともできます。
新規の申し込みから2週間以内であれば1時間分の音声を無料で利用することができるので、気軽に試してみることもできます。
VoXTフルという専属のテープ起こしスタッフがテープ起こしを代行するサービスも用意されています。
RIMO Voiceは、音声ファイルや動画ファイルをアップロードすることで、日本語に特化した自動処理技術によって精度の高い文字起こしができるサービスです。対応可能なファイル形式はM4A、MP3、WAV、MP4、MOV、AACなど。1時間の音声データであれば、5分前後で文字起こしを完成できます。
また、RIMO Voiceは音声とテキストが紐づいて保存されることが特徴で、単語を選択すれば聞きたいところだけを簡単に確認することが可能。人力での修正がしやすくなっており、時間をかけずに正確なテキストに仕上げられます。
料金は、30秒の音声につき20円、または30秒の動画につき30円かかるほか、40時間まで10万円で利用できる定額制プランもあり。利用料は少し高いものの、2020年9月にリリースされてから100社以上の企業で導入されており、信頼性の高さがうかがえます。
COTOHA Meeting Assistは、NTTコミュニケーションズが開発したAIエンジン搭載の議事録作成支援サービスです。会話をその場でテキスト化できるほか、録音ファイルのアップロードによるテキスト化も可能。録音データの対応ファイル形式はWAV、mp3、mp4となっています。
テキスト化したファイルは企業ごとに専有型クラウドサーバーで管理されるので、情報漏洩のリスクが少ないこともポイント。また、ZoomやMicrosoft Teamsなどといったオンライン会議ツールとの併用にも対応しています。
COTOHA Meeting Assistはクラウド型サービスのため、専用ソフトのインストールやサーバーの構築は必要ありません。インターネットに接続できる端末と外部接続マイクがあれば、契約開始からすぐに利用できます。初期費用はかからず、月額料金55,000円(50時間まで)で利用可能です。
働き方改革や感染症の影響でリモートワークを導入している企業が増えており、オンライン会議用のツールとしてZoomを利用している方も多いはず。Zoomは会議への参加やチャット機能だけでなく、ほかのサービスと組み合わせることで会議の内容を簡単に文字起こしすることが可能。Zoomをさらに便利なツールとして利用するために知っておきたいサービスをまとめてみました。
Otter.aiはアメリカの企業が提供している文字起こしサービスで、雑音が入るような環境でも正確に文字起こしできる精度の高さが特徴です。
Zoomと連携したライブビデオ会議メモ機能を公開しており、Zoom上の会議内容をリアルタイムでテキスト化できます。ただし、英語向けのサービスのため、2021年7月時点では日本語にはまだ対応していません。将来的には日本語を含めた多言語に対応する予定とのことですが、今のところは外国の取引先との英語での会議に利用したい方向けのサービスと言えるでしょう。
ライブビデオ会議メモ機能を利用するには、有料のZoom Pro以上の加入およびOtter for Teamsへの登録が必要になります。無料プランのZoomではリアルタイムでの文字起こしはできないものの、ローカルに保存した動画や音声のデータをOtter.aiに取り込んでテキスト化することは可能です。
Zoomの有料プランを利用している場合は録画データをクラウド上に記録でき、文字起こし機能を使ってテキスト化も可能です。文字起こし機能は英語のみのサービスとなっており、2021年7月時点では日本語にはまだ対応していません。Zoomでは、2021年の秋までに全ユーザーが文字起こし機能を利用できるように進めており、日本語への対応も期待できます。
Zoomの文字起こし機能を効率的に活用するなら、Dropboxとの連携がおすすめです。連携しておくと文字起こししたテキストをDropboxに自動保存でき、Dropboxを介して簡単に共有が可能。また、テキストの中から特定のキーワードを検出できるDropboxの機能を使うことで、欲しい情報を素早く取り出せ、議事録作成の作業効率をアップできます。
Zoomでの会議を日本語で文字起こしする方法としては、Googleドキュメントの音声入力機能を使ったやり方があります。
Googleドキュメントの音声入力機能は、パソコンのマイクが拾った音のみを認識するため、相手側の声もリアルタイムで文字起こしする場合は、別のソフトの使用やセッティングが必要です。2~3人程度の少人数の会議を簡単に文字起こしするなら、Googleドキュメントを会議に参加する全員にシェアする方法がおすすめ。それぞれが発言する際に音声入力をオンにすることで、シェアしているGoogleドキュメント上で文字に変換されます。
参加者が多い会議の場合は、録音したデータを使うのが簡単でしょう。この方法では、Googleドキュメントを開いたパソコンとは別に端末がもう一つ必要になり、別の端末から保存した録音データを流すことで、Googleドキュメントが音声を拾って文字に変換することが可能になります。
テープ起こしの際、元となる音声データがマイクを通して録音されたものではなく、レコーダーと口元の距離が離れている場合は、音声からテキストデータを自動生成することは難しくなります。
したがって、ここで紹介した録音アプリや音声再生ソフト、音声入力機能などを単独で活用することは現実的ではありません。
音声データを音声再生ソフトで聞き取りやすくし、そこで拾い上げた内容をキーボード入力ではなく、改めて口述して音声入力機能を利用し、テキスト化していく方法が最も効率的ではないかと考えられます。
音声入力機能も精度がかなり上がっているとはいえ、雑音が含まれた不明瞭な音声データではテキスト化することは難しいのが現状です。
また、句読点や改行などは「まる」や「てん」などの言葉で指示する必要があります。
したがって、どのツールを使っても、録音データをそのままテキスト化するということは現時点では不可能になっています。
テープ起こしに利用できるツールはさまざまなものがあります。無料で利用できるものも多くあり、手軽に利用することができます。
しかし、音声データをそのままテキスト化することは難しく、これらのツールを上手に組み合わせながらテープ起こしに利用していくことが賢明な選択です。