AppleのAI戦略、「誇示せず、ただ機能を提供する」 AI続々導入も“バズワード”避ける
ここ最近の生成AI(人工知能)ブーム。米マイクロソフトが、ChatGPTを開発する米オープンAIの技術を取り入れた製品・サービスの提供を開始し、米グーグルも検索サービスに取り入れるなど同様の動きを見せている。米メタも自社の生成AIを年内に商用化すると報じられた。米アマゾン・ドット・コムも自社の大規模言語モデル(LLM)の最新版を開発中だ。一方、米Apple(アップル)はこれまで生成AIについて言及せず、同社はまるで傍観者であるかのように見えた。
しかし、2023年6月5日(米国時間)に開催した年次開発者会議「WWDC23」で、同社のAIに対するアプローチが他社と違うことが分かった。
裏でひそかに動く「機械学習」や「言語モデル」
ロイター通信によれば、アップルは同日の基調講演で、最近のバズワードである「AI」を1度も使わなかった。同社は新たな製品やサービスにAI技術を忍ばせ、その利便性だけを説明したという。必要に応じて、より専門的な「マシンラーニング(機械学習)」や「トランスフォーマー言語モデル」といった言葉を用いて新機能を紹介した。
アップルはこの日、ゴーグル型ヘッドマウントディスプレー(HMD)「Apple Vision Pro」を発表した。ティム・クックCEO(最高経営責任者)が「空間コンピューター」と呼ぶこの製品を使って利用者同士はオンライン会議を行うことができる。
このとき、相手もゴーグルを装着しているはずだが、映し出されるのはゴーグルを着けていないいつもの顔だ。これは「Persona」と呼ぶデジタル肖像生成技術を利用しており、利用者の体を3次元(3D)スキャンすることで実現している。そしてこの技術のバックグラウンドにはマシンラーニングがある。
スマートフォン「iPhone」の次期OS「iOS 17」では入力テキストの自動修正(オートコレクト)機能が改良される。OSが利用者の習慣や好みを学習し、入力した単語を修正する場合と、そのままにする場合を判断するようになる。これは、マシンラーニング言語モデルの一種であるトランスフォーマー言語モデルで実現している。
アップルは技術的背景を語らない
米CNBCも、アップルは「AI」という言葉を好まないと報じている。アップルが製品や機能を説明する際は、より学術的な言葉である「マシンラーニング」を使うか、単にその技術で実現可能になった機能について話すという。
アップルはハードウエア製品の開発企業であり、これまで数十年にわたり徹底的な秘密主義を貫いている。CNBCによれば、アップルは競合テクノロジー大手のように、自社のAIモデルやトレーニングデータ、または将来の機能改善について論ずることはしない。その代わり、製品機能の詳細を説明し、そのバックグラウンドに最新技術があると、簡潔に述べる。
次期ソフトウエアにAI活用機能続々
開発者会議で発表した新機能にはワイヤレスイヤホン「AirPods Pro」(第2世代)のソフトウエアアップデートがある。今秋配信されるファームウエアを適用すると、会話感知機能が利用できるようになる。AirPods Pro装着中に利用者が発話すると、自動的に音量を下げ、前方にいる人の声を強調しながら背景のノイズを低減する。加えて、パーソナライズ音量機能も導入する。これは長期にわたり利用者の周囲の環境とリスニングの好みを解析し、個人の音響体験を自動で微調整する。ここでもマシンラーニングを用いる。
アップルは、タブレット端末「iPad」の次期OS「iPadOS 17」も披露した。こちらは、PDFへの情報入力を容易にする機能を追加する。マシンラーニングを用いて、PDF内のフィールド(入力欄)を識別する。これにより、「連絡先」アプリに登録してある自分の氏名や住所、電子メールアドレスなどを素早く入力できるようにする。
基調講演の会場で好評を博したものの1つには、新しい「写真」アプリの顔認識機能がある。デバイス上のマシンラーニング機能を活用して、人物や猫、犬などを認識する。今後のiPhoneでは自動で、利用者のペットを他の猫や犬と区別し、1つのフォルダーにまとめることができるようになる。
このほか、iPhoneに新たに加わる「Journal」と呼ぶ日記アプリでもデバイス上のマシンラーニングを活用する。撮影した写真や行った場所、行った運動といったiPhoneに保存された最近の行動データを基にテーマの候補を提案し、利用者が日記を書くきっかけを与えるという。「日記をつけるという行為は心身の健康を改善するといわれている」とアップルは説明した。
また、iPhoneのアクセシビリティーには、「Live Speech」と「Personal Voice」も導入される。前者は、対面や電話、ビデオ通話の際にテキストをタイプすると、それを音声で読み上げてくれる機能。後者は発話能力を失うリスクのある利用者が、自分そっくりの声を生成できるようにする機能だ。ロイターは、これらの機能にもAIが活用されていると報じている。
筆者からの補足コメント:
ロイターによれば、このほか、以下の①②の機能・サービスもAIを活用しているようです。①iOS 17の「Live Voicemail」(ライブ留守番電話)。誰かが留守番電話を残すときにリアルタイムでメッセージをテキストに書き起こす、というものです。②macOS Sonomaでの「Video conferencing」(ビデオ会議)機能の「Presenter Overlay」(プレゼンターオーバーレイ)。これはビデオエフェクトの1つです。共有しているコンテンツの上にプレゼンター(講演者)を表示し、その存在感を高めるというもので、AppleシリコンのNeural Engine(=機械学習処理に特化したSoC、システム・オン・チップの一部)によって実現します。そして、①②ともに、データをクラウドに送信せずにデバイス内で処理を完結する点がアップルならではの特徴です。
【関連記事】
- (本コラム記事は「JBpress」2023年6月9日号に掲載された記事を基にその後の最新情報を加えて再編集したものです)