ファクトチェッカーが「コミュニティノート」に慎重な理由〜Global Fact10報告（その3）

武蔵大教授/ジャーナリスト

2023/7/26(水) 18:50

（文中敬称略）

世界各地からミスインフォメーション、ディスインフォメーションと戦うファクトチェッカーが集まる「Global Fact10（グローバルファクト・テン、以下『GF10』と表記）」（2023年6月27日〜30日　ソウル）の報告3つめです。

最近、日本でも本格的な運用が始まったツイッター（「X」に改名という情報ですが、この原稿を書いている時点では本格移行の時期など未だ明らかではないので、本来の「ツイッター」という呼称で議論します）の「コミュニティノート」について、GF10でもセッションがありました。その前身と言われる「バードウォッチ」も含めて、日本に先立ち、すでに19カ国で導入され、使い方の検証や議論が行われてきました。

ソーシャルメディア上を飛び交う、間違った情報やデマだけでなく、人を傷つける中傷やヘイトスピーチ、暴動などを引き起こす恐れもある陰謀論の拡散を止め、ユーザーに対する注意喚起を徹底するための効果的な方法探しは、緊急の課題です。GF10の報告でも、コンテンツ・モデレーションの問題として触れた通りです。

プラットフォーム各社は、自前でファクトチェックをしたり、ニュースメディアやジャーナリストに仕事を任せたりして対応しようとしてきました。しかし、ツイッターのコミュニティノートは、まったく別のアプローチです。

クラウドソース化の試金石だが・・

まず前提として、現在のコミュニティノートの仕組みは、ツイッターの説明でも、実態としても、純粋な「ファクトチェック」とは違うものです。ファクトチェックにはIFCN（国際ファクトチェック・ネットワーク）が定めた、｢情報源や方法を公開する｣とか「組織の資金源を公開する」などの厳しい基準を守ることが、国際標準となっているからです。

しかし、一般の人が信じてしまいそうだったり、思わず拡散に手を貸してしまうようなミス／ディスインフォメーションに対し注意を喚起し、専門家による検証を促すという効果においては、ファクトチェックと共通の部分も多いと思われます。

GF10でもコミュニティノートについてのセッションのタイトルは「クラウドソース化されたファクトチェックは機能するか？」でした。世界のファクトチェック・コミュニティの認識も、コミュニティノートがファクトチェック的な、あるいはファクトチェックを補完するような効果を実現できるかもしれないという期待もうかがわせました。

しかし、評価はまだ懐疑的のようです。このセッションでプレゼンを行ったジャーナリズムの研究機関ポインター研究所のアレックス・マハデバンは「ほとんど失敗している」「ぱっとしない（”lackluster”という言葉が使われていました。「活気がない」感じ）」と表現しました。

去年11月、ツイッターの経営者となったイーロン・マスクは「ツイッター上にある情報の正確さを向上させる、信じられないほどの可能性がある」と自画自賛しましたが、ほど遠いのが実態のようです。

9割以上のノートは表示されず

マハデバンは前身のバードウォッチがアメリカで始まった直後に加入を申請、半年あまりの間、この活動に活発に参加しつつ観察・分析を行ってきました。

彼によると、プレゼンがあった2023年6月30日の時点で、世界19カ国で約13万3千人のユーザーがコミュニティノートに参加していました。

また、彼の集計では、コミュニティノートには約12万2千件のポストがなされたということですが、そのうち、一般のユーザーのツイッター画面に表示され、読むことができるようになった情報は約1万400件、8.5％しかなかったということです。

表示されるまでの「関門」

コミュニティノートの書き込みが、どのようにして一般のユーザーの目に触れる「8.5％」になるのか、そのプロセスを見てみましょう。ツイッターは基本的に他のコミュニティノート・ユーザーがつける「レーティング」という評価システムを使っています。

例えば「ヘンリー王子がアイルランド人とイギリス人の違いがわからなくて、説教されている（笑）」というツイートには、「デジタル加工され、別の音声が編集でつけられたもの」というコミュニティノートが付されオリジナル音源のリンクも示されています。「現在は『役に立つ』というレーティングである」という表示も見えます。

「これは役に立ちましたか？」という質問に答える形でコミュニティノート・ユーザーはレーティング評価をします。「はい（Yes）」「どちらかといえばそう（Somewhat）」「いいえ（No）」の三段階評価です。

もし「はい」を選択すれば、さらに「どのように役立ったか」という項目が出現します。「信憑性の高い情報源から根拠を得ている」「理解しやすい」「ツイートの主張に正面から応えている」「（他の）大事な文脈（解釈や関連情報）を提供する」「中立的あるいは（党派的な）偏りがない言い方」などの項目にチェックをします。

このようなコミュニティノート・ユーザーの評価が集計され、ポイントの高いものが一般のユーザーに表示されるものと思われます。

ファクトチェックに近い機能も

コミュニティノートは時にファクトチェック的な「機能」は果たすことがわかります。

ここでとりあげたツイートで、編集で加えられたオリジナルの音声として指摘されていたユーチューブの映像は、2010年に公開されたSF映画『インセプション』のプロモ−トとみられるものです。出演者のキリアン・マーフィー（アイルランド人）とトム・ハーディ（イギリス人）がイスラエルのテレビと思われる番組でインタビューを受ける、わずか12秒の抜粋です。

アイルランド人とイギリス人のアイデンティティの違いを尊重することを知らないインタビュアーが「ふたりともイギリス人だよね？」と何度も問いかけ、マーフィーが「違う。自分はアイルランド人だ」と何度も訂正し、最後にハーディに「（イギリス人とアイルランド人というのは）大きな違いなんだよ！」と一喝される場面です。

リップシンク（音声と唇の動きが一致しているかどうか）を見ると、これがオリジナルの映像とみて、ほぼ間違いがないと思われます。

上記ユーチューブの音声で、ねつ造と指摘された映像。ヘンリー王子は斜め後ろを向いて口の動きは不明、向かいの男性の口元から注意を逸らす目的か、大きなテロップも入っている（2023年7月24日撮影）

純粋な基準に沿ったファクトチェックではありませんが、これはオリジナルの音声というエビデンス付きで、映像のチープフェイクを見破り、拡散するのを防いだという意味で、同じような「機能」を果たしたとも言えます。

全てではないにしても、使い方や情報の精度を保証する仕組みが考案されれば、一定の合理的な使い方もあるかもしれないということです。

イデオロギーを超えるという「壁」

しかし、マハデバンによると、コミュニティノートが一般のユーザーが見られるものに昇格するための条件は、高いレーティング評価を得ることだけが条件ではありません。

彼の集計によると、最も高い水準のレーティング評価を受けたコミュニティノートのうち、約6割は一般のユーザーには見られないままであったということです。

レーティング集計作業途中のコミュティノート評価画面。「Needs more ratings.（もう少し多くのレーティングが必要）」という表示が見える。（筆者撮影）

さらに「イデオロギー上のコンセンサスが必要だ」というのです。

マハデバンによると、ツイッターのアルゴリズムは、ユーザーの過去の行動を集計し、その人の政治的な傾向を判断しているということです。そうして分類した政治的に「右派」と「左派」の人が一定の同数だけ「そのコミュニティノートをツイートに追加すること」に同意するまで「待っている」のだということです。

※この原稿を書いている2023年7月26日の時点で、日本でツイッターが政治的右派と左派を分類するのに、どのような指標を用いているのか、筆者は情報を持ち合わせていません。（わかり次第、加筆修正する可能性があります。）

ミス／ディスインフォメーションの疑いがある問題あるツイートの大部分は何らかの政治的な言説を含むのも、また事実です。そうすると、左右両派からのイデオロギーを超えた平均的な合意は「達成するのはほぼ不可能だ」とマハデバンは言いました。

「4年前なら機能したかもしれないが、現在はもう、うまくいかない。右派の100人と左派の100人の両方がワクチンの効果に同意するようなことはあり得ないからだ」

「相互評価」に頼る弊害も

コミュニティノートの信頼性に絶対の基準がなく、コミュニティノート・ユーザーの支持を集めたものが評価されるという方式のために、間違った情報を伝えるコミュニティノートが表示され続けてしまうという事例も紹介されました。

2023年6月18日にオフィシャルのCNNアカウントは、自社のニュースストーリーを引用して以下のようにツイートしました。

「（映画や小説などで）黒人の父親というものは、家族と離れて暮らしていたり、あたかも居ないかのように描かれることが、しばしばである。しかし、それは多くの人が経験していることではないと、データも黒人の父親たち自身も感じている。そのような偏った描かれ方は、その作者の経験や偏見によるところが大きい。」

それに対して、表示されたのは以下のようなコミュニティノートでした。

CNNのツイートに付けられ、公開された間違ったコミュニティノート（現在は削除されている：筆者撮影）

「2021年のデータによると、64％の『黒人あるいはアフリカ系アメリカ人』の子どもは、一人親の家庭で育っている。」

しかし、マハデバンによると、これは「誤ったデータに基づいた、レイシズム的攻撃をするメモ」でした。

「ミスリーディングなデータの紹介と、ツイート内容を理解したり検証したりするために、何ら新しい材料を追加するものではなかった」にもかかわらず、このコミュニティノートは、数日間にわたって表示され「何百万人もの人たちが読んでしまった」と語りました。

コミュニティノート・ユーザーとして評価する人たちも、データの内容を時間をかけて読み、正確な評価をしていなかったということです。煩雑で読み解くのに時間がかかるデータなどがエビデンスとして提示された時には、避けられない問題とも言えます。

この間違ったコミュニティノートは、他のコミュニティノート・ユーザーが気づいて評価を下げたため、現在は表示されていません。しかし、集合知が発揮されない場合に、かえって間違った情報を拡散する温床になりかねないという、新たなリスクも確認されてしまいました。

限界を知る重要性

マハデバンは「ツイッターが意図したと思われる、クラウドソース化によるファクトチェックは実現できていない」と結論づけましたが、同時に「少しだけの希望」も示しました。

彼は、コミュニティーノートが、ポップカルチャーやネット上の風刺やジョーク、通販広告など、政治的な論争や生命の危険などが迫るものではない問題についてなら、フラグを立てたり、新しい文脈（知識）を上乗せするのに、かなり効果を発揮していると述べました。

特に、コミュニティノート・ユーザーはAIによって生成された映像や画像を見破るのに長けており、プロのファクトチェッカーより速く、優れていることも多いということです。

「その先」に何を求めるか

コミュニティーノートが、信頼のおけるものになるのかどうか、日本での使われ方も、注意深く見ていく必要があります。私もコミュニティノートに協力するための登録をしました。

良い情報と悪い情報を一つずつ書いておきます。

良い情報は、ツイッターは、現在のところコミュニティーノートに関する情報を積極的に公開しているということです。ソースコードは、GitHubで公開されています。

また、書き込まれたコミュニティノートの内容や、それらがどのような評価を受けたかというデータは、ほぼ毎日更新され、ダウンロードが可能です。

どのようなコミュニティノートが支持されるかという形式や文体などの傾向を調べたり、元のツイートとコミュニティノートがどのくらい関心を集めているか比較したりすることができます。

悪い情報は、経営者のマスクやツイッターが会社として、コミュニティノートをどのように育てていくのか、その方針が明確に示されていないことです。

GF10の別のセッションで話した、ツイッターの元「信頼と安心チーム」の責任者、ヨエル・ロスはコミュニティノートについて、参加者から質問を受け、以下のような実態を明らかにしました。（彼のセッションはGF10報告の「その１」前後編で詳しく説明してあります。こちらから探してください。）

ロスは、そもそもツイッターは、会社が責任を持って誤情報を発見し知らせる機能と、クラウドソーシングによるコミュニティノートの二本立てでミス／ディスインフォメーション対策を考えていましたが、「（別々に開発中だった）いろいろなタマゴを一つのカゴに混ぜこぜに入れて、『バードウォッチ』として発表し、あたかもクラウドソーシングのみの仕組みのように説明した」と語り、「それは完全な間違いだった」と述べました。

その後、経営者のマスクや、ツイッターが会社としてがミス／ディスインフォメーション対策の全体像を説明した形跡はありません。ロゴや基本サービスの変更などが次々と発表される中ですが、この問題にも注目していく必要があります。

Yahoo!ニュース