音声認識入力の現状とコツ(Mac、iPhone、iPad)×「酢醤油使って」→○「数字を使って」

  • URLをコピーしました!

音声認識入力を試してみて、その現状とコツをまとめてみました。
今回の記事も音声認識入力で書いています。

DSC05669

音声認識入力の現状と気になる点

キーボードを使わずに、しゃべるだけで入力ができる音声認識。
技術の向上と共に使いやすくなっています。

ただし、100パーセント完璧と言えない状態です。
最近書籍の原稿やブログを音声認識で入力することを試していました

気になる点は次の3つです。

修正は必要

認識が100パーセント完璧とは言えない以上、修正は必要です。
例えば、「数字を使って」というものは「酢醤油使って」と変換されたりもします。

今ブログを書いていてもこのように修正しました。

マック→Mac
こと→音
戦略→1200円
シリ→Siri
ウィンドウズ→Windows
ツカエル→使える
カカセません→欠かせません
テレ入力→手で入力
も九時→目次
目的→目次
スペース→(スペース)
ソノッド→その都度
ゲンジョウ→現状
やり安いです→やりやすいです。
健康→原稿
ミルク→入力
修正の今はある→修正の手間はある
私の可愛い声が低いので→私の場合声が低いので
使い勝手わかる→使い勝手は変わる

Macでは、では改行するとき「新しい行」と話すのですが、正しく認識しない場合があり、「新しい行」と入力されることもあります。

場所を選ぶ

声を出すので当然場所を選びます。
自宅やオフィスでも人がいる場合はやりにくいでしょうし、カフェで音声認識入力するのも抵抗があります。
PCのマイクの場合周りの音を拾う可能性もあるので気をつけましょう。
Macで音声認識入力していたら、Macの冷却ファンが回り出し、それも拾ってしまい「しゅうしゅう」と入力されてしまいました。
ちょっとにやりとしてしまいます。

トレーニングが必要

タイピングにトレーニングが必要なのと同様に、音声認識入力のトレーニングが必要です。
コツをつかみ音声認識入力ならではのテクニックを磨かなければいけません。

Mac、iPhone、アプリでの音声認識入力

私は現状Mac iPhone iPadで音声認識をしています。

Macの場合

Macの場合はfnキーを2回押すと音声認識入力ができるようになります。
EX IT 3

iPhoneの場合

iPhoneではキーボードのマイクボタンを押すと音声認識入力ができ、
IMG 7251

GoogleChromeではGoogleならではの音声認識入力もあります。
IMG 7250

アプリを使う場合

アプリ音声認識入力のアプリもあります私はiPadの音声認識装置を買ってみました。
1200円です。。
IMG 0237

iPhone版とiPad版があり、それぞれで使うにはそれぞれで買わなければいけません。
私が買ったのはiPad版。
文章を修正するときに、iPadProのほうがやりやすいと思ったからです。

これら3つを比べるとそれも一応いったんありますが、iPhoneはSiriがあるために、音声認識入力の精度が多少高いように思います。
有料のアプリだから完璧にできるというわけでもありません。

アプリを使うと、そのテキストをコピペまたは共有する必要があり、その手間がかかります。
ブログを書くならブログ画面(私の場合はMacのMarsEdit)、原稿を書くなら原稿を書くWordで音声認識入力するのが楽です。

Macでは、ヘッドセットマイクをつけてみると、やはり精度が上がりました。
Windowsの音声認識入力も使ってみましたが、こちらはほぼ使い物になりませんでした。これは私の声の特性なのかもしれません。

Mac、iPhone、iPadなら実用レベルです。

音声認識入力のコツ

音声認識に力をやるべきかどうか実際使えるかどうか。

それは判断するには、使ってみることそしてトレーニングしていくことが欠かせません。
判断をするのはそれからでも遅くはないでしょう。手で入力するのと比較してやはりコツが必要です。

次のような点に気をつけてみましょう。

1 書く内容を決めてから話す

項目を挙げて、書く内容をある程度決めてから話すとやりやすいです。
ブログなら見出しを立ててから書き出し、原稿なら当然最初に目次を作っていますのでその目次に沿って話します。

セミナーに近い感覚です。
キーワードをちりばめたスライドを作って、それについて話すという、セミナーで話す感覚に近いです。

2 キーボードと併用する

音声認識だけでやるのが理想的ではあるのですが、現状はキーボードと併用するほうがやりやすいです。
例えば改行する場合にかならずしもそのコマンド(Macだと「新しい行」)を、認識するとはかぎりません。
Enterキーで改行したほうが心は安まります。

「、」や「.」も、その都度、「てん」「まる」と言って入力するのですが、話しているときには当然「てん」「まる」とは言いません。
通常話すように「てん」「まる」を使わずに入力しておいて、後で修正したほうが私はやりやすいです。

3 その都度修正する

修正は必ずありますので、その都度修正したほうがやりやすいです。
ブログなら1記事単位。原稿なら1項目単位。

新刊の執筆で音声認識入力を使ったときに、時間がたってから修正したことがありました。
そうするとしゃべった内容を忘れているのです。
修正が難しくなります。

しゃべったすぐ後なら、内容が頭に入っていますので、これはこうかなというのがわかるのです。
ただ、音声認識入力に慣れてくると、「こう聞き違えてるんだなぁ」みたいなのが分かるようになります。

昨日、修正したのは、「夕刊するで処理しましょう」→「IF関数で処理しましょう」でした。

この修正の手間はあるのですが音声認識入力には多大なメリットがあります。
それはすらすら書けることです。

修正の時間を含めても圧倒的に早い時間で書けます。
場所を選ぶ問題があり、精度にも問題もありますが使ってみましょう。
こんなもんだとわりきったほうが楽です。
「、」「。」「改行」にこだわらなくなって、後で修正すりゃいいやと割り切ってから楽になりました。

私の声が低いので認識精度がどうかな・・・と心配ではありましたが、それなりに聞き取ってもらえています。
もっと滑舌がいい人であれば、さらに精度が高くなる可能性もありますし、人によって音声認識入力の使い勝手は変わるかと思います。

重要なのは、前述したとおりトレーニングが必要であり、トレーニングによって上手くなれるということです。

以前に比べて音声認識の精度は間違いなく上がっていますし、これからは音声認識入力がメインになることも考えられます。
今のうちからトレーニングをしてみましょう。

ひとりビジネスの方はやりやすいのでぜひ!





【編集後記】

昨日の午後にSkype打ち合わせ。
チャットワークも導入しました。

【昨日の1日1新】
※詳細は→「1日1新」

渋谷 Bonvivant
渋谷 もうやんカレー

  • URLをコピーしました!