「Windows10 音声認識」を試してみた
Windows10には様々な機能が搭載されているが、日常使う機能は限られている。
「Windows 音声認識」も埋もれた機能の一つだ。
音声認識といえば、[Cortana(コルタナ)]やワード/パワーポイントの[ディクテーション]があるが、
「Windows 音声認識」は、アプリの起動(閉じる)は勿論のこと口述筆記的な使い方が出来るようだ。
興味津々、 早速「Windows 音声認識」を試してみよう。
1.Windows 音声認識をスタート(メニュー)にピン留め
暫くの間は頻繁に使うので、スタート(メニュー)にピン留めする
[スタート]=>[すべてのプログラム] =>[Windows簡単操作]=>[Windows 音声認識]右クリック=>
[スタートにピン留めする]
2.Windows 音声認識の初期設定
始めて[Windows 音声認識]を使う場合は、初期設定が必要です。
画面の指示に従って操作すれば簡単に設定できます。項目のみ列挙します。
1. 「Windows 音声認識」は[Windows簡単操作]の中にあります。
[スタート]=>[全てのプログラム]=>[ Windows簡単操作]=>[Windows 音声認識]
をクリックします。
2.「音声認識へようこそ」の画面が表示されます。
3.「マイクの種類」の画面が表示されます。
=>パソコン内蔵マイクを使う場合は[その他]を選択してください。
[スタート]=>[全てのプログラム]=>[ Windows簡単操作]=>[Windows 音声認識]
をクリックします。
2.「音声認識へようこそ」の画面が表示されます。
3.「マイクの種類」の画面が表示されます。
=>パソコン内蔵マイクを使う場合は[その他]を選択してください。
4.「マイクのセットアップ」の画面が表示されます。
5.「マイクの音量調整」の画面が表示されます。
6.「マイクのセットアップが完了しました」の画面が表示されます。
7.「音声認識の精度を上げる」の画面が表示されます。
8.「有効モードの選択」の画面が表示されます。
9.「音声認識リファレンスカードの印刷」の画面が表示されます。
10.「コンピューターを起動するたびに音声認識を実行する」の画面が表示されます。
6.「マイクのセットアップが完了しました」の画面が表示されます。
7.「音声認識の精度を上げる」の画面が表示されます。
8.「有効モードの選択」の画面が表示されます。
9.「音声認識リファレンスカードの印刷」の画面が表示されます。
10.「コンピューターを起動するたびに音声認識を実行する」の画面が表示されます。
=>必要な時手動で起動するということでチェックを外した方がいい。
11.「このコンピューターを音声で制御できるようになりました」の画面が表示されます。
12.「マイクバー」が表示されます。
11.「このコンピューターを音声で制御できるようになりました」の画面が表示されます。
12.「マイクバー」が表示されます。
3.音声認識機能の構成を実施
[コントロールパネル]=>[音声認識]=>[音声認識機能の構成]の画面(↓)
マイクのセットアップをします。
①マイクの種類:内臓マイクを使うので[その他]にチェックを入れ=>[次へ]
②マイクのセットアップ:表示内容を読んだうえで[次へ]
③マイク(High Definition Audioデバイス)の音量調整:表示されている文章を読み上げ=>[次へ]
3.2コンピューターをトレーニングして認識精度を上げる
テキストを読み上げ、自分の声をコンピューターに学習させ認識精度を上げます。
①次々に表示されるテキストを読み上げていきます。
②トレーニングの進捗状況が[緑のバー]で表示されます。10分ほどで完了です。
③完了すると[追加のトレーニング]ボタンが表示されますが今回はパス=>[次へ]。
④[音声データをMicrosoftと共有する]は[送信しない]を選択。
4.「Windows 音声認識」を使ってみる
4.1準備
①スタートメニューに設定したWindows 音声認識]を起動します。
②マイクバーが表示されます。
③マイクバーには
・「聞き取りを開始」と言ってください
・処理中ーしばらくお待ちください
・スリープ状態です
などのメッセージが表示されます。マイクバー上のマイク部分をクリックすると
最終的には「聞き取ります」のメッセージが表示されます。
4.2使ってみる
「聞き取ります」のメッセージが表示されたら準備完了です。
4.2.1音声認識コマンド
話しかける言葉(音声認識コマンド)は、Windows音声認識コマンドに詳しい。
以下は試してもみたものの一部です。
No | 操作 | 話しかける言葉(太字部分) |
1 | アプリ(XXX)を開く | XXXを開く(起動) XXXはアプリ名 |
2 | アプリ(XXX)を閉じる | XXXを閉じる XXXはアプリ名 |
3 | 読点「。」 | まる 「。」は「まる」と読む |
4 | 句点「、」 | てん 「、」は「てん」と読む |
5 | 改行 | エンターまたは改行 |
6 | カーソルの移動 | XXの前へ(XXの後へ) XXは単語 |
7 | ドキュメント内の単語の選択 | XXを選択 XXは単語 |
8 | キー操作(の一部) delete,backspace,enter,space |
そのまま英語読み デリート,バックスペース,エンター,スペース |
9 | タブの切り替え | XX(XXタブ) XXはタブ名 |
10 | 操作の取り消し | キャンセル |
11 | シャットダウン | スタート=>電源=>シャットダウン |
4.2.2入力
ワードに簡単な文章を入力してみましょう。
[ワードを開く]=>[白紙の文書]=>
[きょうのてんきはあめですまる]=>[エンター]
[きょうのてんきはあめですまる]=>[エンター]
[きょうのてんきははれですまる]=>[エンター]
4.2.3修正
誤字・脱字・言い違いなども音声で修正できます。上記の音声コマンドを使って操作します。
①入力した文章中に変更したい単語があった場合
a)修正したい単語を選択します(XXXを選択 XXXは単語)
ドキュメント内に同一単語が複数ある場合は、単語毎に数字が表示されるので
数字(いち、に、さん、・・・、OK)を読み上げ「オーケー」と話しかければよい。
例: 1行目の「雨」を「雪」に修正したい
入力した文章
|
「あめをせんたく」と語りかける |
1行目の雨を選択
|
いち=>オーケー
と語りかける
|
b)修正したい単語(1行目の[雨])が選択できたら、変更したい単語を語りかける。
上記の場合では「ゆき」と語りかけます。
・複数の変換候補が表示された場合は該当する番号の数字を読み上げ「オーケー」と話しかけます。
今回は「ゆき」と語りかけると以下の候補が表示されました。
❶が「雪」となっていますので「いち オーケー」と語りかけます。
・変換候補にない場合は、もう一度語りかけます
4.2.4辞書への登録
認識されにくい単語や表現を辞書に登録すると認識精度が上がる可能性があります。
①「マイクバー」上で右クリックしメニューから「音声辞書を開く」をクリック
②「→新しい単語を追加する」をクリック
③「単語または表現」のところに認識されにくい「単語や表現」を入力し[次へ]をクリック
④「完了時に発音を録音する」にチェックを入れ[完了]をクリック
⑤「録音」をクリックし入力した「単語や表現」を読み上げます
=>読み上げ時マイクバーが「聞き取ります」の表示になっていること
⑥「正常に録音されました!」と表示されたら[完了]をクリック
=>「開く」をクリックすると読み上げた音声が再生されます
【試してみた感想】
声が悪いのか、話しかけ方が下手なのか、将又音声認識のレベルが低いのか
なかなか言うことを聞いてくれません。
実用的には??? 遊びとしてなら・・・。
ボランティア活動(シルバーCITAサロン)でも取り上げてみた。
音声トレーニングは一人ずつやっていただいたが、一斉に使いだすと他人の声を拾ってしまい
ほとんど使い物にならない。ヘッドセットを使えば少しは良くなるかもしれないが、
現状では、静かな環境でひっそり楽しむしかないようだ。
【ご参考】
「『OfficeとOneNote for Windows10』の音声認識を試してみた」も参考にしてください。
【おまけ】
1.【ワード/パワーポイントのディクテーション】
現時点のワード2016の[ホーム]タブにある[ディクテーション]は[日本語]をサポートしていない。
英語はサポートされているので、
[ディクテーション]をクリックしマイクの横に赤丸が表示されたら
「でぃす いず あ ぺん ピリオド」と話しかけると
「This is a pen.」と入力してくれる。
認識精度は[Windows音声認識]よりよさそうだ。
早く日本語にも対応してくれることを期待する。
=>[ディクテーション]は、マイクロソフトアカウントでサインインしないと有効にならないようだ。
2.【Dictate(ディクテイト)】
ワードやパワーポイントなどに音声認識機能を付加するアドインソフト
「dictate(ディクテイト)」がマイクロソフトから提供されている。日本語も使える。
【Dictateの使い方】
①Dictateのサイトを開く(https://dictate.ms/)
②32ビットOfficeの場合、[Down load for Office32-bit]ボタンをクリックする。
③[実行]をクリックするとインストールが始まる。
④パワーポイントまたはワードを起動し[Dictation]タブが追加されていることを確認する。
下(↓)はパワーポイントの例
⑤[Language Option]の
[From]を[Japanese],[To]を[Japanese]に変更します。
(これの意味は、「日本語の口述を日本語に変換する」ということ)
⑥[Start]ボタンをクリックします(クリックすると[Stop]の表示に変わります)。
⑦マイクに向かって話しかけます。
⑧話しかけた言葉がリアルタイムで認識されテキストに変換してドキュメントへ入力してくれます。
⑨途中で[改行]などはできないが、認識精度はWindows音声認識よりはるかにいい。
⑩[Stop]ボタンをクリックすると終了。
⑪入力されたデータは[ベタ打ち]状態なので、手動で修正する必要がある。
3.翻訳
Microsoft Storeで「翻訳」という名のアプリが提供されている。
このアプリはなかなかの優れものだ。
日本語に対応していることは勿論、テキスト、音声、画像入力にも対応している。
音声認識精度もなかなかのものだ。
日本語⇄日本語に設定すれば、音声入力=>日本語テキスト化が出来る。
コピー機能もあるのでそのままワードに貼り付けることも可能だ。
参考資料
①Windows音声認識コマンド
ワードやパワーポイントなどに音声認識機能を付加するアドインソフト
「dictate(ディクテイト)」がマイクロソフトから提供されている。日本語も使える。
【Dictateの使い方】
①Dictateのサイトを開く(https://dictate.ms/)
②32ビットOfficeの場合、[Down load for Office32-bit]ボタンをクリックする。
③[実行]をクリックするとインストールが始まる。
④パワーポイントまたはワードを起動し[Dictation]タブが追加されていることを確認する。
下(↓)はパワーポイントの例
⑤[Language Option]の
[From]を[Japanese],[To]を[Japanese]に変更します。
(これの意味は、「日本語の口述を日本語に変換する」ということ)
⑥[Start]ボタンをクリックします(クリックすると[Stop]の表示に変わります)。
⑦マイクに向かって話しかけます。
⑧話しかけた言葉がリアルタイムで認識されテキストに変換してドキュメントへ入力してくれます。
⑨途中で[改行]などはできないが、認識精度はWindows音声認識よりはるかにいい。
⑩[Stop]ボタンをクリックすると終了。
⑪入力されたデータは[ベタ打ち]状態なので、手動で修正する必要がある。
3.翻訳
Microsoft Storeで「翻訳」という名のアプリが提供されている。
このアプリはなかなかの優れものだ。
日本語に対応していることは勿論、テキスト、音声、画像入力にも対応している。
音声認識精度もなかなかのものだ。
日本語⇄日本語に設定すれば、音声入力=>日本語テキスト化が出来る。
コピー機能もあるのでそのままワードに貼り付けることも可能だ。
参考資料
①Windows音声認識コマンド
「試してみた」シリーズ