イスラエル関係のフェイクニュースを拡散したのは誰か
結論:普通のユーザ
パレスチナ自治区ガザを実効支配するハマスが7日朝にイスラエルに対して多数のロケット弾を発射し,戦闘員を侵入させ大規模な戦闘が続いているようです.
それに伴って,SNS上でも多くの真偽不明の情報が飛び交い問題となっています.
日本ファクトチェックセンターでも多数のファクトチェック記事が掲載されており,偽情報が多数存在することがうかがい知れます.
そこで,X(旧Twitter)上の情報から偽情報と考えられるものを抽出し,それらがどのように拡散しているのかを確認してみましょう.最近では情報安全保障としてネット上の情報が操作されている可能性が危惧されており,どのような人たちによって情報が拡散されているのかを明らかにするのは,情報を正しく理解するうえで重要となってきています.
そこで,関連するポストを収集し,その中でフェイクと指摘される情報を抽出,それらの情報を拡散しているアカウントの特徴を見ていきたいと思います.
まず,「ハマス,イスラエル,ガザ,パレスチナ」をキーワードにポストを収集しました.ご存知の通り現在APIがほとんど動いていない状態なので,ベストエフォートでの収集となります.結果2023年10月1日~11日までの172,890アカウントによる1,025,715ポストを収集しました.ただし,これがすべてではないことにご注意ください.
得られたポストをクラスタリングしてみると,大きなクラスタ2つと小さなクラスタ2つにわかれました.
まず,大きなクラスタ3つはそれぞれ,ハマスの攻撃を批判するものと,中立的に情報を伝えるものでした.
一方小さなクラスタの一つはパレスチナ側に立った言及と,今回の紛争に基づく欧米批判でした.
10月11日までの段階では拡散の大半はハマスへの批判と中立的な情報が占めているように思われます.
次に,収集したポストの中からリプライに「フェイク,誤報,デマ」が含まれるポストを抽出しました.
その結果,171のポストへのリプライが抽出されました.そのうち,収集できていたポストは62ありました.
たとえば
という投稿はファクトチェックされすでに否定されたものです.
とはいえ,抽出された情報すべてが必ずしも誤情報であるとは限らないという点にはご注意ください.
これらのポストの拡散については,15,583アカウントによる20,208回の拡散を収集できていました.ちなみに,62ポストの10月11日段階での拡散は少なくとも51,401回はあったことが確認できているので,実際に収集できているデータは半分以下だったようです.
それはさておき,拡散したアカウントはどのような性質を持ったアカウントだったのでしょうか?
まず,拡散したアカウントの偏りを見てみましょう.偏りの指標を計算してみると,偏りは2.04でした.一般に偏りの指標が1.0以下の場合一般的な話題という事ができますので,誤情報とリプライにある情報を拡散したアカウントは若干一般からは偏っていたと言えます.ただし,今回収集したデータで確認された拡散したアカウントの偏り全体も1.84であり,大きな差はありませんでした.
従って,イスラエルパレスチナの問題に興味を持っているアカウント全体と誤情報とリプライにある情報を拡散したアカウントの間で偏りの大きな違いはないと言えるでしょう.
次に,誤情報とリプライにある情報を拡散したアカウントのプロフィールを確認してみましょう.拡散したアカウントのワードクラウドは以下の通りです.
これを観ると,それほど大きな特徴があるわけではないように見えます.比較のために,今回収集した全データに含まれるアカウントのプロフィールのワードクラウドは以下の通りです.
こちらを見る限り,あまり違いは無いように見えます.
従って,誤情報とリプライにある情報を拡散したアカウントは特別なアカウントではなく,イスラエルパレスチナの問題に興味があるアカウント全体とほとんど違いが無いという事が分かります.
誤情報とリプライにあるポストすべてが誤情報と言うわけではありませんが,全体の10%程度の偏りのないアカウントが情報を拡散していたといえることから,今回の件に関しては,誤情報を拡散するアカウントは特別な特徴を持つアカウントではなく,誰でも誤情報を拡散してしまう可能性があるということを意味しているのではないでしょうか.
事実,今回の件では,拡散している情報の中でファクトチェックされているものであっても,ファクトチェックサイトを見ていなければ気づけないものが多いように思いました.
紛争のような情報が錯綜する環境下では,安易な拡散は慎むとともに,自分自身も誤情報を拡散してしまう可能性が高いことを認識し,誤情報を拡散してしまったアカウントを責めない様にしたいものです.
なお,今回の分析はデータ収集が完全ではない,誤情報の判別を簡易的に行っている,といった限界があります.その点にご注意ください.