AIの開発に欠かせない、意外な「人海戦術」とは
人工知能(AI)の活用が毎日のようにニュースで報じられる中、AIがどのように作られているのか気になっている人も多いのではないでしょうか。そのAI開発を支援するオーストラリアのAppen(アッペン)が日本法人を設立しました。
アッペンが提供しているのは、AIが適切な判断をするためにラベルが付けられた「トレーニングデータ」(教師データ)です。たとえば検索エンジンの精度を上げるため、最大で10万人もの人が検索関連性を向上させる作業にあたっており、アッペンはその結果をSNSやEコマース会社に提供しているといいます。
自然言語を認識して動作する音声アシスタントの場合も、地域や言語による言い回しを理解するために膨大なデータが必要になります。アッペンなら、ローカルな地名や子どもの発音といったデータを収集できるそうです。
もちろんAIの開発にはソフトウェアのエンジニアも必要ですが、人海戦術でデータを収集、あるいは判断する作業は欠かせないというわけです。アッペンは170カ国で100万人以上のクラウドワーカー(Cloud=雲ではなくCrowd=群衆のほう)と契約しており、日本でもアッペンの仕事は在宅ワーカーの間で知られているようです。
実際の作業は、画像や文書、音声データを見ながらラベル付けをしていくというもの。この作業自体にもAIを活用することで効率化を図っているものの、すべて自動化できるわけではないそうです。「自動ラベリングの技術はあるが、人間のクラウドワーカーによる品質の確保はいつの時代になっても必要だ」(アッペンCEOのマーク・ブライアン氏)。
世界各国で在宅ワーカーなどに委託する場合、気になるのがセキュリティの問題ですが、アッペンは「高セキュリティ施設」を運営しており、たとえばフィリピンでは1000名以上のクラウドワーカーが働く施設があるとのこと。こうした施設を複数の国に保有していることも強みとしているようです。
AIにおける「バイアスの排除」にも対応
世界的にAIの活用が進む中で「バイアス」の問題も関心を集めています。たとえば人物の顔を認識するAIが、有色人種の場合は精度が落ちるとなれば問題です。日本語の音声認識が標準語に最適化されていると、方言を話す人には使いづらいものになり、やがて社会的に不利益を被る恐れが出てきます。
これに対してアッペンは「AIの裏にあるデータにバイアスがかかってはいけない。アッペンのクラウドワーカーは170カ国、235言語を網羅しており、バイアスのない高品質なデータを提供できる。これが当社が選ばれる理由になるだろう」(アッペン中国およびAPAC事業担当専務取締役のロック・ティエン氏)と強みを語っています。
日本市場はこれからAI投資が加速すると期待される半面、ハードウェア中心の産業構造によりAIやソフトウェアの人材が不足していると指摘しています。そこでアッペンの日本法人ではリーダー企業との連携や官民一体プロジェクトに参加しつつ、啓蒙活動やパートナー連携に取り組んでいくとしています。
IDCの調査によると日本のAI市場は年率25.5%で成長し、2025年には約4910億円規模に成長するとか。その中で、AIの進化によってなくなる仕事が出てくるとは思われるものの、AIを育てる新しい仕事が大量に生み出されるというのは興味深いところです。