目で見て体験

スマホの世界や、これからの先進技術をご紹介。

GoogleHomeと音声認識の進化に対する驚き

年末からスマートスピーカーの宣伝を目にする機会が増えました。

GoogleのものであればGoogleホームそしてGoogleホームmini。

アマゾンが出しているエコー。

LINEが出しているclova。

それぞれに特徴がありますが、基本的な機能としては人間が音声でかたりかけてそれに応答するというもの。基本的な音声認識と言うものは10年20年前から存在をしていますが、あまり実用性が高いと言い切れるものではありませんでした。

それは、どうしても自然に喋っているつもりでもきちんと文章を変換することができずに、かえって修正することに時間がかかってしまったからです。

スマホが存在する前、パソコンでの音声入力に、専用のソフトを購入してまで試してみたことがあります。考えてみると、それがもう20年近く前になります。その時に使い物にならなかったそういうイメージをいまだに引きずっていたので音声入力からは若干遠ざかってしまっていました。

正直なところ、最近のGoogleの音声入力であったり、iPhoneの音声入力であっても、こんなにも精度が高く認識してくれるものかと驚いています。

年末に、Googleホームminiを買いました。

今後の入力デバイスとして、音声がどれぐらい種類になっていくと言うものを知りたかった…そういう意識があります。

今、我が家でGoogle Homeには、朝起きた時にSpotifyで音楽をかけてもらうと言う役割を担ってもらっています。

これは、音声入力がまだまだ使い切れないと言うことではなく、単純に対応している機能の少なさということが挙げられるかと思います。

文字変換であったり、前後の文脈の認識と言う意味では、非常に高い精度まで音声入力はできるようになってきています。正直、パソコンでキーボードを使いながら打つよりも圧倒的に音声入力のほうが早いと思います。ただ、残念なのは自分の思考が音声入力に追いつかないと言うところです。

具体的にどういうことかと言うと、どんな文章を打とうかなと考えながらしゃべる必要があるので、自分の頭で考えていることが、口をついて出てくるのには少し時間がかかって、なんとも不自然な喋り方をすると言うことです。

慣れの問題もあるかもしれないのですが、周りに人がいないとは言え若干恥ずかしい思いもありますし、うまく話せずに止まってしまうこともあります。

ここまでの文章で、大体1,000文字になります。これを、iPhoneの音声入力だけで作っています。

素晴らしいなと思ったのは、ほとんど文字変換の修正の必要がないことです。固有名詞になると少し難しいところもありますが、普通の文章であれば全く修正をしなくてもかなりの文章を書き進めることができます。

これができることでパソコンがなくても長い文章を入力すると言うスマホで苦手だと思われていたことができるようになりそうです。

実際にスマホの音声入力でここまで書いてみて思ったのが、今までパソコンで書いていた時と文体が変わってくるということです。

とは言え紙とペンで文章書くときと、パソコンで文章書くと人でも、文体が変わる事はあったかと思います。

今後音声入力が種類なってくると、文体もそれに合わせたものが出てくると言うことではないでしょうか。

試験的な文章の練習にはなりましたが、音声入力で今ここまでできるんだぞと言うことを感じていただければと思います。