ChatGPT、スマートスピーカーの復活

Alexaが2014年に始まって以来、人工知能アシスタントサービスは熾烈な競争を展開してきました。2018年からは、さまざまなタイプのスマートスピーカーがリリースされ、スマートフォンアプリだけでなく、さまざまなスピーカーを通じてAIアシスタントを利用することができるようになりました。

ChatGPT、スマートスピーカーの復活 - ChatGPT reviving the smart speaker Smart Speakers

しかし、これらのスマートスピーカーはすぐに迷惑になりました。まず、AIアシスタントは音声を理解するのがあまり得意ではありませんでした。彼らは意図しないトリガーをコマンドと誤解し、起きてしまい、平和を乱します。

さらに、音声を理解できたとしても、彼らの応答はしばしば不十分でした。天気の確認、アラームの設定、音楽の再生、ラジオの聴取などの基本的なタスクにしか使えず、質問に答えたり情報を見つけたりする際にはあまり役に立ちませんでした。

ChatGPT、スマートスピーカーの復活 - ChatGPT reviving the smart speaker Superchat

ChatGPTのおかげで、このようなスマートスピーカーや第1世代のAIアシスタントは、復活の翼を広げる機会を得ています。2022年8月、AmazonはAlexaを改善する新しいAI言語モデルを発表しました。このモデルはAlexa Teacher Models(AlexaTM)と呼ばれ、さまざまな言語の翻訳やテキストの要約で優れたパフォーマンスを発揮しています。それ以前の2021年には、GoogleがLaMDAというオープンドメインのチャットボットを発表し、さまざまなトピックで複数のパーソナリティで会話できるAIモデルです。

Gorilla Technologyというスタートアップは、スーパーチャットというアプリを開発しました。このアプリは歴史的な人物や世界的に有名な人物とそのパーソナリティで会話することができます。QuoraのPoe、Character.ai、D-IDなど、同様のAIパーソナリティサービスを提供するスタートアップも注目を集めています。

さらに、CygniContGraVitasというスタートアップは、GPT-4を使用したAutoGPTサービスを開始しました。AIの最終目標を設定した後、AIは目標を達成するためにさまざまなタスクを実行する計画を立て、それに向かって努力します。ChatGPTは人間のコマンドや質問にのみ応答できますが、AutoGPTは最初の目標と指示の後に目標を達成するためのさまざまな詳細なタスクを自己改善して実行できます。

例えば、「100万個のInstagramアカウントを作成してフォローする」というコマンドがあれば、AutoGPTはこの目標を達成するためにコンテンツを熱心に作成し、さまざまな詳細なタスクを実行します。このようなモデルがスマートスピーカーに適用されれば、期待を超える会話サービスを提供することができるかもしれません。もしかしたら、第1世代のAIアシスタントは映画『アイアンマン』のJarvisの理想を実現できるようになるかもしれません。

ChatGPT、スマートスピーカーの復活 - ChatGPT reviving the smart speaker josh ai

2015年に設立された音声制御型ホームオートメーションシステムの開発会社であるJosh.aiは、ChatGPTのAPIを使用して既存のAIアシスタントよりも自然で賢い機能をスマートスピーカーに適用するためのプロトタイプを発表しました。ChatGPTのおかげで、ユーザーが文脈を考慮して不正確な質問や無意味な質問を出しても、Joshは周囲の状況を考慮し、それらを正しく理解して適切に応答できます。

さらに、AIアシスタントにリンクされた周囲のオブジェクトを文脈に関連して操作し、より統合されたサービス体験を提供することもできます。例えば、ユーザーが「今日は本当に疲れている。リラックスする方法はありますか?」と言った場合、ChatGPTにリンクされたJoshスマートスピーカーは、瞑想を案内するリラクゼーションのテクニックを提案したり、照明を暗くしたりYouTubeでリラックスできる動画をテレビで再生したりすることができます。

ChatGPT、スマートスピーカーの復活 - ChatGPT reviving the smart speaker RizzGPT

スタンフォード大学の学生たちは、GPT-4をメガネと組み合わせた「RizzGPT」というプロトタイプを開発しました。これは、他の人と話す際にメガネを介してテキストとしてさまざまな情報を表示するサービスを提供します。

ユーザーと他の人との会話は、スマートフォンに接続されたARメガネを通じてテキストに変換され、ChatGPTに送信されます。さらに、ユーザーが見ているシーンに関する情報(相手の顔、服装、状態、周囲のオブジェクト、環境など)もGPT-4に送信されます。これにより、声だけでなく、ユーザーの周りで起こっていることについての情報も提供することで、よりシームレスな会話が可能になります。

GPT-4に送信された情報を解釈し、メガネのディスプレイを介してテキストとして表示することで、ユーザーはより効果的な会話を行うことができます。将来的には、写真や動画、音声の形式でユーザーに追加の情報を提供することも可能になります。

例えば、講義中や重要なプレゼンテーション中、複雑な電気配線プロジェクト中にタイムリーかつ正確な情報をメガネが提供し、ユーザーの価値を高めることができます。これは、映画で見たJarvisの実現です。ChatGPTのようなLLM(Large Language Model)によって可能になったAGI(Artificial General Intelligence)サービスによるものです。

ChatGPT、スマートスピーカーの復活 - ChatGPT reviving the smart speaker GPT

そのようなChatGPTは、スマートスピーカーやARメガネ、さまざまなIoT(Internet of Things)デバイスと統合することで、以前は不可能だった新しい機能を提供し、以前よりも優れたサービス品質を確保することができるようになります。もちろん、そのようなChatGPTは、私たちを助ける仮想アシスタントとしての役割を超えて、ロボットにも組み込まれ、物理的な存在を持つことさえ可能です。

これは、ChatGPTが仮想的な存在だけでなく、私たちの現実に入り込んでくるという問題の別の側面であり、私たちの社会はこの技術が持つ社会的な影響を深く考慮し、準備し、人類に脅威を与えないようにするための対策を講じる必要があります。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

上部へスクロール