Facebook、AI(人工知能)を活用し視覚障害者向けに画像説明:世界2億人以上の弱視や全盲の方へ
Facebookは2016年4月4日、AI(人工知能)を活用して視覚障害者向けに画像の説明を行うサービス「自動代替テキスト(Automatic Alternative Text)」機能をiOS向けに提供開始した。
1日20億枚の写真がアップ、全世界の2億以上の弱視や全盲の方も楽しめるように
Facebookや傘下のInstagram、Messenger、WhatsAppでは、1日あたり20億枚もの写真がアップされているそうだ。特にスマホの世界規模での普及に伴って、写真を撮って簡単に誰もがアップできるようになったことから、写真と簡単なコメントだけをアップする人も多い。
一方で視覚障害者の方々にはそのような写真をアップすることも楽しむことも困難を伴う。Facebookによると、全世界で全盲の人が3,900万人、弱視が2億4,600万人いるとのこと。
Facebookではそのような視覚障害を持つ方々にも晴眼者と同じようにFacebookを楽しむことができるよう、サポートする技術を構築したいと考え「自動代替テキスト(Automatic alternative text)」を開発した。「自動代替テキスト」は、最新の物体認識技術を利用し、写真の内容の説明を自動的に生成する新しい技術。iOS端末のスクリーンリーダー(画面読み上げ機能)を利用している方は、Facebook上の写真をスワイプすると、写っているものを音声で聞くことができるようになる。
物体認識技術で画像を読み上げ:まずは英語でiOSから
これまでは、画面読み上げ機能を使ってニュースフィード上で写真に差しかかると、その写真をシェアした人の名前と「写真」という言葉が読み上げられるだけだった。今回発表した自動代替テキストにより、どのような写真か、より詳しい説明ができる。「自動代替テキスト」はiOS上の画面読み上げ機能を利用している方に向けテストを実施している。現時点では英語でのみ利用できる。Facebookでは他の言語やAndroidなどでも利用できるように準備を進めている。
これによって、例えば「画像には3人の人、屋外、笑っている」といった説明が読み上げられるようになる。これは、何十億というパラメーターを持った神経のように張り巡らされたネットワークで、何百万もの画像などを参考にして発達したFacebookの物体認識技術によるもの。Facebookのアクセシビリティ・チームは、物体認識技術を発展させることで、今後もより多くの方々に利用される技術を利用しやすく提供できるようにしていくことを目指している。本機能はまだ開発初期の段階だが、写真の内容を説明するというサービスの可能性を広げることは、視覚障害者の方々に、晴眼者と同じようにFacebookの機能を活用してもらうための重要な第一歩となる。
「らくらくホン」にもある読み上げ機能、画像には未対応
モバイルでの視覚障害者向けの読み上げサービスとして日本で有名なのは富士通が開発し提供している「らくらくホン」での読み上げ機能だ。「らくらくホン」は提供開始時から、視覚障害者向けに読み上げ機能を提供してきた。もう読み上げ機能を提供してきて、10年以上の歴史がある。世界に先駆けて日本では長年にわたって、モバイルでの読み上げ機能があったのだ。
「らくらくホン」の読み上げ機能では、メールや電話などの基本アプリのトップ画面など、さまざまなシーンでの音声読み上げに対応している。またブラウザの読み上げでは、見出しやリンク、テキスト入力欄・ボタンなどの単位でも、読み上げのフォーカスを移動できるのでブラウジングも快適にできることから視覚障害者向けにはお馴染みの商品、サービスである。但し「らくらくホン」では画像があることはわかるが、まだ画像の説明まではできない。