昔、音声を文字起こしをしたいなと思いつつ自分で文字起こしをしようと思いましたが、聴きながら文字を打つというのは、なかなか特殊なスキルで断念していました。
そこでクラウドソーシング（ネットで仕事を依頼）に文字起こしをお願いしましたが、それなりに手間もかかるものです。
やりとりもありますし。
自分でセミナー音声や動画を文字起こしできないかということで、今は Google ドキュメントを使っています。

Google ドキュメントはパソコン上で開くので、パソコンで再生した音声・動画をそのまま認識できればいいのですが、その方法はうまくいきませんでした。
パソコンで再生した動画や音楽音声を文字起こしするアプリもありますが、認識精度はGoogleがやはり優れています。
となれば、 Google ドキュメント音声認識を使いたいもの。
Google の音声認識入力を使いつつ、うまく文字起こしができないかと考えたのが、泥臭くも確実な方法でした。。

Googleドキュメント＆マイクで文字起こし

パソコンで音声を再生してパソコンにつないだマイクでその音声を聞き取り、それをパソコン内の Google ドキュメントで音声認識するという方法です。
なんだか変な感じではあるのですがこのように設置しています。

2時間22分のセミナーを文字起こししてみました。

冒頭部分

終わりの部分

全部で43000字ほど。
Googleドキュメントの特性上、改行や句読点は入っていません。
（しくみ上入りません）
修正が大変じゃないかと思われるかもしれませんが、前述の記事でご紹介したようなプログラムを使えばある程度のものは修正できます。

GAS正規表現置換で、Googleドキュメント音声認識入力のデメリットを補う方法 | EX-IT

改行は、ブログやメルマガの場合、 Enter キーでその都度入れています。
しかし、音声を文字起こしするなら、ずっと見ておくのも大変なので後で入れたほうがいいでしょう。

これも、こういったプログラムで「ます」を「ます+改行」に置換する、つまり「ます」の後ろで改行するということができます。

var text= text.replace(/ます/g,’ます\n’);

こういった修正ができるので、音声認識入力が定着したわけですし、 Google ドキュメントの魅力（GASというプログラムを使える）です。

修正後はこうなります。

まあ、これでも修正は結構必要ですけども、これだけのテキストが手に入るというのは大きなメリットです。

Google ドキュメントはネットにつながっていれば、どこからでも見ることができます。
1台のパソコンで音声を再生→音声認識の処理をしている間、他のパソコンで仕事をしていて音声認識が止まってないかを確認することもできます。

途中で音声認識が止まることっていうのもあり得えますが、設置や機材が命です。
個別コンサルティングセミナーはとまらずに収録できました。

コツは次のようなものです。

パソコンの設定

途中でスリープ状態になると音声認識が止まってしまいます。
そのため、スリープをオフまたは思いっきり長くしておきましょう。

パソコンのスピーカー

パソコンのスピーカーによって音が聞き取りにくいときがあります。
私が今使っているVAIOだと精度が下がり、SurfaceBook 2のほうが精度が上です。

マイクの位置

パソコンのスピーカーにできるだけ近くマイクを持って行きましょう。

静かな場所

マイクによっては周りが静かかどうかが大事です。

Google ドキュメントの音声認識が止まるケース

Google ドキュメントの音声認識が止まるのは、間があった場合、静かな部分がある場合です。
セミナー音声だと、スライドの切り替え、ホワイトボードに書くといった状況をはじめ、間があることがり、そこで止まってしまう場合があります。
音声認識を無理せず小分けにしたほうが無難です。

音声の状態

音声の収録状態によって音声認識できるかどうかが変わってきます。
私が今収録してある音声でいろいろ試してみたところ、。
音声にちょっとエコーがかかっているような感じだとうまく認識できませんでした。
最も認識できたのはセミナーではなくパソコンで収録のみやった音声です。
やはり音が安定しているので認識もよく、止まりません。
テキスト化することを考えると、収録の方法も考える余地はあります。