ユーザーには聞こえないハッカーからの指示を認識する音声アシスタント

2017.09.19

9 月 12 日に予定されている iPhone 8 と iOS 11 の発表に先立って、Apple の音声アシスタント Siri がより人間らしくなるだろう(リンク先:英語)という噂が聞こえてきました。



ユーザーエクスペリエンスは向上するでしょう。しかし、中国の浙江大学の研究チーム(リンク先:英語)が先週公表した報告書によると、Apple は Siri が何を認識するかについてもっと多くの時間を費やすべきでした。


研究チームが Siri をはじめとする音声アシスタント (VA) をテストしたところ、対象となったすべての VA が、人間からではない命令 (ヒトの声域外の命令、および人間の耳には聞こえない命令) に反応することが実証されました。



つまり、ユーザーの知らないうちに攻撃者が VA に命令を出せるということです。

研究チームは「Dolphin Attack: Inaudible Voice Commands (ドルフィンアタック: ヒトの耳には聞こえない音声命令)」と題したこの報告書の中で、Siri、Google Now、Samsung S Voice、Huawei HiVoice、Cortana、および Amazon の Alexa でこの問題が確認されたと述べています。20 kHz以上の周波数で超音波音声コマンドを使用することで、VA に以下を実行させることに成功しました。


  • ・「ドライブバイダウンロード攻撃の実行やゼロデイ脆弱性が存在するデバイスの悪用が可能な」悪意のある Web サイトにアクセスする。

  • ・ビデオ/音声通話の発信を開始することによって、ユーザーを監視する。これにより、デバイスの周辺の画像や音声の入手が可能になります。

  • ・デバイスに対して「偽のテキストメッセージや電子メールの送信、偽のオンライン投稿の公開、カレンダーへの偽のイベントの追加など」を指示することによって、偽情報を注入する。

  • ・機内モードをオンにし、すべての無線通信を切断するコマンドによって、DoS 攻撃を実行する。

  • ・デバイスの画面を暗くし音量を下げて、攻撃を隠蔽する。

  • ・「テストでは、iPhone で Facetime を起動する、Amazon Echo で音楽を再生する、Audi の自動車のナビゲーションシステムを操作する、などの攻撃を行った」と研究チームは述べており、これはつまり攻撃者がナビゲーションシステムの目的地を改ざんできることを意味します。


攻撃を開始できるかどうかにはかなりの制約があります。2015 年に Charlie Miller 氏と Chris Valasek 氏が成功させたジープの「チェロキー」のハッキングのように数キロ離れた場所からのリモート操作はできません(リンク先:英語)。スマートフォンに取り付けるハードウェアは 3 ドル程度のものですが、標的デバイスから数メートルまたは数センチメートルの場所にいる必要があります。したがって、攻撃者がすでに家の中にいるのでなければ、Alexa に勝手口のロックを解除するように命令することはおそらくできません。



一方で、混雑している地下鉄などの公共の場所では、他のデバイスに接近するのは難しいことではありません。

しかし、スマートフォンの画面のロックがあらかじめ解除されていなければ、超音波による命令のほとんどが機能しない、というもう 1 つの障壁があります。画面をロック解除する必要があるということです。Siri は、画面のロックが解除されていなくてもユーザーの連絡先リストに電話をかけられますが、Web サイトを開いたり、サードパーティ製アプリを開いたり、金融取引を行ったり、テキストメッセージを送信したりするといった重要な操作はできません。



言うまでもありませんが、ユーザーが iPhone を操作している最中はロックが解除されているため、その障壁は無くなります。しかし、攻撃者からの不正な超音波コマンドを Siri が受け取った場合、ユーザーは iPhone の画面を見ていて、いつもとは違う何かが起こったことにすぐに気付くはずです。

研究チームは、人間の声域以外のものに反応しないようにマイクを修正するなど、ドルフィンアタックを阻止するための提案も行っています。



しかし、そうした人間の耳には聞こえない高周波数も、人間の耳には聞こえないがコンピュータには聞こえる人間の発話の一部であるという理由から、音声認識ソフトウェアが人間の言葉を分析するうえで必要だとする専門家もいます。NewDealDesign の創設者である Gadi Amit 氏は Fast Code Design の取材に対し、VA が超音波周波数を無視するように設計した場合、「システム全体の理解度を低下させる」(リンク先:英語)可能性があると語っています。


とは言うものの、Apaple などの企業が自社の VA を人間により近づけることができるのであれば、人間以外から発せられた命令を認識するように設定できるはずです。

あるいは、iPhone を使用しているセキュリティ意識の高いユーザーは、[設定] で [“Hey Siri”を許可] オプションを無効にすればよいだけです。このオプションを無効にしておけば、ホームボタンを押さなければ命令できなくなります。



この研究チームの報告書についてのコメントを Apple は拒否しましたが、Amazon は次のように答えています。



“Amazon はプライバシーおよびセキュリティを非常に真剣に受け止めており、当該の研究チームの報告書をレビューしているところです。”



現時点では、セキュリティ上の大惨事が差し迫っている訳ではなく、潜在的なリスクが実証されたにすぎません (研究者は、約 2 カ月後に開催される ACM Conference on Computer and Communications Security(リンク先:英語) で論文を発表予定です)。しかし、あらゆる種類のハッキング技術と同様に巧妙化する可能性が高いため、VA の開発者および設計者は一歩先んじて、セキュリティを進歩させておく必要があります。

引用元

おすすめの記事はこちら