Echo Spotは、ガジェット好きとしてとりあえず購入しましたが、正直ただのディスプレイがついたスマートスピーカーという認識で、あまり期待はしていませんでした。そしてクレードルに置いたタブレットと何が違うんだろう、そんな感覚だったのです。
しかし、ちょっと使ってみて、これはもしかしたら時代を変えうる新しいデバイス なのではないかと感じました。
今までのスマートスピーカーは、対話するといっても相手はただのスピーカー。便利には便利だけど、モノに対して話しかけるということ自体にどこか違和感がある。
そして今までのスマートフォンやタブレットは、話しかけて操作できるといっても、その操作は限定的で大半タッチ操作が必要となる。タッチ操作を前提としたデバイス。
そんな中で、Echo Spotは対話前提のインターフェースによって成り立ち、話しかけると聴覚だけでなく視覚的にも訴えかけ、インタラクティブに様々なことを教えてくれる。
とすると、私が勝手に捉えたそのイメージは、タブレットでもスマートスピーカーでもなく、人間とコミュニケーションを取る価値がある機械という意味では、「胴体のないロボット」でした。
どういうことなのか?早速見ていきましょう。
もくじ
話しかける相手に顔がない。そんなAlexaさんの「表情」が見える
私はガジェット好きとして、Amazon Echoシリーズ、Google Homeシリーズ、Clovaシリーズをすべて買い揃えて利用してきました。
もちろんこれらはそれなりに便利に利用してきています。特にAmazon Echoによる定型アクションを絡めた家電操作は大変重宝していて、これをメインで利用していました。
しかし、「話しかける」という操作前提において、これらはどこか違和感があったのです。そもそも話しかける相手はスピーカーであり、ただてっぺんが光る物体です。
何かインプレッションをもたらすことのない、まるで地蔵に話しかけているような感覚。
音声でそれなりに必要な情報は返ってくるものの、やはり何かが味気ない。
そんなわけでどんなに対話で操作できるといっても、その相手の形状はただのスピーカー。何かを知りたいときにあまり積極的に話しかけることがない。なんだかんだスマートフォンを手にとってしまう、そんな利用用途でした。
Alexaさんが視覚的にも教えてくれる。身振り手振りのごとくインタラクティブに。
しかし、Echo Spotは違います。表面にはディスプレイが搭載され、それはまるで人間で言うところの「顔」の役割を果たしているかのようです。
これまで音声でしか回答は返ってきませんでしたが、Echo Spotではある質問に対し、ディスプレイを以て視覚的に補足しつつ回答してくれるのです。
これは日常的に無表情で会話されるのと、表情や身振り手振りといった視覚的な補助がある、通常のコミュニケーションをとるかのような感覚に近いです。
▲例えば天気の機能でもそれが明らか。天気は自動的に画面遷移して解説してくれる。スマートフォンならタッチとスクロールが必要なところ。
▲音楽は歌詞を表示(Music Unlimitedで再生)。これがかなり便利。しかも音楽再生に合わせて自動でスクロールをしてくれる。デバイスに触れる必要はない。
▲料理は映像でしっかり見せてくれる。当然のごとく音で再生されるよりもわかりやすい。
対話は、声だけですべてが完結されるものではありません。そこには、話し手の表情やボディーランゲージといった視覚的に見えるもので理解が大きく増すものです。
Echo Spotのディスプレイは、音声回答だけでなく、そのような視覚的な補助をしてくれます。
そういう意味で、Alexaへ話しかける、対話するということの価値を大きく引き上げてくれたのが、Echo Spotだったのです。
動画が見れる?見て買い物できる?それはスマホでもできたこと。じゃあ何が違うのか

Echo Spotの特徴としてよく謳われているのが、スマートスピーカーとしての利用を前提と捉えたときに、「音声だけでなく、動画や見て買い物ができるよ!」というもの。これは確かにその通り、とても便利でスマートスピーカーの欠点を補完してくれる機能性ですよね。
しかし、よくよく考えてみると、そんなことはスマートフォンでもタブレットでも可能でしたよね。それがどうした?といった感覚。
じゃあEcho Spotは何が新しいんだろうと考えたときに、その際機能を主軸に考えてしまうと、むしろ退化しているものを目新しいかのように見せているだけではという錯覚を起こします。
直近でいうと、iPadがiOS11でやっとディレクトリシステムに対応したときのあの感覚。そんなことはノートパソコンで元々できましたよね。
様々なメディアを見て、自分の中で納得しようとしましたが、だいたい何ができるのかは想像がつきつつもなんか腑に落ちなかった。
デベロッパーではなくユーザー視点として、ここを説いている人がほぼいなかったので、今回はこの観点を中心に何が今までと違うのか、どう新しいのか、実際に利用してみた感想を踏まえ以下に解説していきたいと思います。
操作の入り口が会話であること
これはスマートフォンやタブレットという、俗にいう従来のスマートデバイスとの最たる違いです。Amazon Echo Spotは音声操作を前提としています。起動にしてもまずは「アレクサ」からすべてが始まるのです。
タッチ前提の操作では、あるボタンを押すとこの動作をする、といった機械的な操作をある程度学習する必要があります。それは、スマートフォンがこれほどまでに普及した現在ではあまりハードルの高いものではないのかもしれません。
しかし、音声であれば、基本的には人間に話しかける感覚で操作することが可能です。ロック画面を解除して、目的のアプリをスワイプして探し出しタップして起動、そこから目的の操作をする。そういった手順を踏む必要はありません。
ただスマートフォンにももちろんiPhoneのSiriやGoogle Assistantに代表される、音声アシスタント機能は搭載されています。しかしそれらはあくまでタッチ操作を前提としたデバイスを操る場合の、補助的なものにすぎません。
スマートフォンがこのような音声操作前提のUIに作り変わり、かつユーザーが話しかけるデバイスとして認識することはもう無理でしょう。なぜならハードウエア含めタッチ操作を前提としたUIとその利用用途が完成されすぎているためです。
とすると新しいデバイスとそれに最適化されたUIによって人々の認識を根本的に変換する必要があり、人々が比較的手の出しやすい価格でそれを満たした最初のデバイスがこのAmazon Echo Spotなのではと考えています。
もちろん未だ発展途上のAlexaなので、むしろ目的の情報にたどり着くための音声コマンドを考えることが難しいという課題もあるにはあります。しかし、これがより進化していけば、まるで人間に指示するかのように様々なことができるようになることでしょう。
そういう意味で、この人間の基本的な所作に近い感覚で操作できるEcho Spotは、手軽で今後にも期待が持てる面白いデバイスであるといえるわけです。
音声操作前提のUIがユーザへ対話を強いる
音声操作が前提となるEcho Spotですが、もちろん従来どおりのタッチ操作も可能です。これは、Amazon Echoにディスプレイがついたことによる、大きなメリットの一つです。音声操作の方があらゆる面で優れているというわけではないので、タッチ操作という選択肢があるだけでも非常に良いポイントですね。
▲料理スキルの操作。これまでAlexaの音声をじっくり聞かないと、「動画を見る」までたどり着けなかったが、これの場合、表示されてからすぐ画面をタッチするだけで目的の動作にたどり着くことができる。
しかし、タッチ操作はあくまで補助的なものにすぎません。音声ガイダンスの次点の操作として、ちょっとスワイプしたりタップしたりするだけです。
Echo Spotの場合は音声操作>タッチ操作、スマートフォンの場合は、タッチ操作>音声操作。この優先順位が大きく異なる点です。
ディスプレイがあることによって話しかけるデバイスであることの存在をより意識できる
冒頭に述べたとおり、Echo SpotについたディスプレイをAlexaの「表情」と表現しました。スマートスピーカーの場合、スピーカーという物体そのものでしたが、Echo Spotの場合はディスプレイにサジェスチョンが出てきたり、時計の役割を果たしたりと、視覚的に認識できかつ価値ある情報を与えてくれるデバイスです。視覚的に見るメリットがある分、存在感が大幅に増します。
▲「アレクサに〇〇と言ってみて」といったサジェスチョンが表示される。これによって、話しかけて操作するデバイスであることをユーザー側が認識できる。
常に待ち受ける。据え置きが前提であることの利点
正直、これらのデバイスはタブレットを据え置きすることでもある程度のことができます。
しかし、Echo Spotの特徴は据え置きのデバイスであるという点です。タブレットは据え置きしたとしても取り外すという選択肢があるため、ちょっと外してどこかに放置したら、その時点でEcho Spotの使い方を維持することができません。
スマートスピーカーとしてもそうでしたが、こういった音声操作的なデバイスを利用する上では、ある特定の場所に必ず配置されていること、というのは重要です。
そういう意味で、常に話しかけるのを待っていてくれる、デメリットとも言える据え置き前提が、実はメリットであるとも言えるのです。
また、人が近づくとその人に気づいたかのようにディスプレイがパッとつき、Echo Spotでできることなどサジェスチョンが流れます。これが地味に便利で、Echo Spotに話しかける気が起こります。
Amazon Echoはスピーカーという物体そのものなので、ただの置物になりかねません。これは気が利いてていいですね。
機械の使い方を学習することの煩わしさを解消
Alexaは人に話しかけるのと同様に操作することができます。これまでのスマートデバイスはタップ操作やスワイプ操作など、特定の動作を覚える必要があります。これがなくなるだけでも、機械と接することへの煩わしさが解消されます。
ただ、現状のAlexaにはハードルがあります。やはり音声操作という技術自体が発展途上であるために、人に指示を出すかのように柔軟な操作はできません。ある程度命令するワードとできることを理解した上で、それに沿うような話し言葉を投げる必要があります。これは、現状のスマートスピーカー全般にも言える欠点です。
しかし、これが進化したらどうなるのでしょうか。話し言葉をより柔軟に理解して、さらにできることも増えていったら、一般的な人工知能のイメージそのままに、人と対話するような感覚で様々なことができるようになるかもしれません。
そうすると、もはや操作方法を学習する必要もありません。人と同じような感覚で向き合うことが可能です。
おわりに:Echo Spotはポストスマートフォンの原型なのかもしれない

対話するときは基本相手を見て話します。 その見た先にあるスマートスピーカーは、人間の五感の中で最も多くの情報を与えてくれる「視覚」に対し、特に価値を与えてくれるものではありませんでした。そして気がついたら存在を忘れ、置物になっている状態となる。
しかし、これまで述べてきたように、 Echo Spotはディスプレイによってその存在を示し、対話する上で対峙して見た際に、インタラクティブに、色々と教えてくれます。もちろんスマートフォンでも同じなのですが、音声操作を前提としたデバイスである以上、機械と「対話」することの価値を上げてくれたデバイスといえますね。
あくまで個人的な感覚ですが、人間と機械の会話によるコミュニケーションの質を大幅にあげてくれたという意味で、そのイメージはスマートフォンやスマートスピーカーでもなく、俗に言うロボットに近いです。
これが例えばIoTライクな概念による、機器間の連携・AIライクな卓越した頭脳・ARによる機械の知覚認識、これらが相互発展したときに人間と同じようにコミュニケーションが取れるようになるのかもしれませんね。
もし、この技術がどんどん発展し、よりAlexaさんが優秀になり、そしてさらに自律的に、人に寄り添うように動き出したらどうなるか?さらに家の内外、モノ、施設を含めあらゆる場所にこの対話できるディスプレイが搭載されていったらどうなるか。
もはや必ずしもスマートフォンを取り出して操作する必要がなく、これに話しかけるだけで本来スマートフォンで得ていた様々な情報を取得することができるようになります。
そうすると、より複雑かつ手間のかかるスマートフォンの役割は徐々に少なくなっていく。スマートフォンを取り出して操作することすら必要はない。ただ人と同じように接し、結果価値ある情報をインタラクティブに提供してくれる。
もしかしたら様々囁かれつつも、未だ決定打となるデバイスがない、俗に言う“ポストスマートフォン”は、ここからはじまるのかもしれないとまで思いました。
未だ発展途上ながら唯一無二のデバイス、スマートフォンを超える予感がする面白さを見せるEcho Spot。
最後に、ここまで期待させておいて難ですが、現時点での完成度、便利さという意味ではスマートフォンの方が断然上です。デバイスとしての成熟度が全然違います。
しかし、家に1台置いてみて、Alexaさんの成長の過程をぜひ体験してみてほしい、可能性を感じるデバイスです。