安倍元総理国葬アンケートで発生した投票合戦の分析
月刊Hanadaが安倍元総理の国葬についてのアンケートをTwitter上で取ったことがTwitter界隈の一部で話題になっているようです.
これを受けて,Twitter上では賛成派反対派がそれぞれ投票合戦を繰り返しているようです.2022年8月22日の段階で残り1日で580,440票の投票があるようです.
では,実際どのようなアカウントから投票されているのでしょうか?残念ながら投票を行ったアカウントを取得することは出来ませんので,投票したアカウントそのものの分析はできません.
そこで,取れるデータからある程度状況を推測するために,アンケートツイートをリツイート(含む引用RT)したアカウントを調べてみることにしました.ツイッターアンケートの場合自分のタイムラインに出たときに回答することが多いと思われますので,おおよそどういったコミュニティがアンケートを広めたのかによって,どのコミュニティのアカウントが投票を行ったかが推定可能だと期待しての分析です.なお,投票したアカウントではないことにご注意ください.
ここで,どのようなアカウントがツイートしているかを見るために,各アカウントの過去のツイート履歴から政治的スタンスを推定するクラスタリングを行ってみました.具体的には,各政党の公式アカウントや党首アカウントのリツイート回数や,各政党に(ポジティブ,ネガティブにそれぞれ)言及したツイートをリツイートしている回数を元に各アカウントを5パターンに分類してみました.
ただし,政治関係のツイートを10回以上ツイートしていないアカウントについては政治的スタンスは十分に取れていないものとして扱いました.
その結果,
1,自民党,維新の会を批判するツイートや共産党応援ツイートをRTするアカウント
2,自民党を応援し,立憲民主,共産党を批判するツイートをRTするアカウント
3,国民民主を応援するツイートをRTするアカウント
4,自民党を批判し,共産党,れいわを応援するツイートを異常な数RTするアカウント
5,維新の会を応援するツイートをRTするアカウント
が抽出されました.
これらをそれぞれ,C01リベラル,C02保守,C03国民民主,C04リベラルボット,C05維新とします.なお,クラスタ4は他のクラスタの20倍近くRTを行っているため,ボットが疑われるということでリベラルボットとしていますが,必ずしもボットであるとは限らないことにはご注意ください.また,クラスタとして抽出されていないタイプのアカウントもありますので,例えば「リベラルはボットを使うが保守は使わない」ということではありません.また,各クラスタの名前は筆者がざっくり決めたものですので,ちょっと違うのではと思っても細かい点はスルーしてもらえると幸いです.
また,どのクラスタにも所属しないアカウントは「不明」として扱っています.不明の中には,過去に10回以上政治的なツイートをしていないアカウントや,比較的新しく作られたアカウントが含まれていると考えられます.
さて,以上のクラスタのアカウント群が先にあげたツイートをRTまたは引用付きRTした数の時系列データを作成してみました.分析対象となったデータは,2022-08-17 06:24:22から2022-08-21 18:45:31までの27,159アカウントによる31,137ツイートです.なお,データ収集はベストエフォートで行っていますので,消されたツイートや鍵垢のツイートは収集できていない点をご了承ください.
拡散の時系列変化
まずはシンプルに各クラスタの1時間ごとのRT数を見てみましょう.
この結果から,当初はC02保守系のアカウントが主に拡散していましたが,8月17日15時くらいから徐々にC01リベラル系アカウントが拡散を始めていることが分かります.また,同時にC02保守系や不明,C04リベラルボットもツイート数を増加させています.
どうやら,最初は保守系のアカウントの間で拡散されていたものが,急激にリベラル系のアカウントの中で拡散されだしたため,保守系のアカウントがさらに拡散したという構図がなんとなく見えます.8月18日以降は保守系,不明系の拡散が続いており,情報拡散については保守系が積極的に行っていることが分かります.なおリベラル系で87.8%,保守系で91.6%のアカウントが1回しかリツイートまたは引用付きリツイートをしていないので,特定のユーザが大量に拡散したとまでは言えなそうです.
ちなみに,C03国民民主とC05維新のアカウントによる拡散はほとんどありません.このあたりから割とクラスタリングはうまくいっていそうな感触がありますね.
ところで,投票結果の時系列を分析している方もいらっしゃいますので,そちらと合わせてみると拡散と投票の関係が見えてきて興味深いです.
保守系の拡散は8月17日中にピークが来ていたのですが,逆転したのは8月19日のようですので,逆転までには結構時間がかかっているようです.
各クラスタの占める割合
次に,全リツイートのうち各クラスタのアカウントが占める割合を求めてみました.なお,これは2022-08-20 18:42:56までのデータでの結果です.
この結果を見ると,保守系の積極的な拡散が目立ちます.リベラル系は当初投票数では勝っていたようですが,拡散という点では保守の方が多そうです.特にC04リベラルボット系が普段のような超大量リツイート力を発揮していないのが興味深いです.
また,過去に政党のツイートを積極的にRTするような政治的なアカウントを中心に分析しているわけですが,その中に含まれない「不明」アカウントがわずか25%程度しかいないのも興味深い点です.ようするに,今回のアンケートは過去に政治的なツイートを多数拡散していたアカウントが拡散しているだけという状況が見て取れます.いや,分かってましたが.少なくとも,一般のユーザがどう考えるかはほぼ捉えられていないアンケートだろうなあと容易に想像つきます.一般の人が興味を持っていれば,もっと「不明」が増えそうなものですからね.
不明アカウントの正体
こうなるとがぜん興味がでてくるのが25%いる不明アカウントは何者なのか,です.
不明アカウントのツイート数を見る限り,概ね保守系の立ち上がりと同期しています.8月17日の段階では保守系だけどクラスタに入るほど政治的ツイートをしていないアカウントが多く含まれていたのではないかと推測していますが,必ずしもそれだけではないでしょう.
関連ツイートを見ていると「操作を行うために新規アカウントを作って投票を行っている」というツイートも散見されましたので,その辺も調べてみましょう.ちなみにこのツイートはリベラル系アカウント,保守系アカウントの双方から見受けられましたので,どちらの陣営でも「相手はズルをしている」と考えているようです.
新規アカウントかどうかはさておき,水増しのためには通常利用とは異なるアカウントを使った投票は可能でしょう.投票そのものは分析できませんが,投票ついでに拡散することも多いと思いますので,普段使いではなさそうなアカウントがどのくらい拡散していたのかを調べてみましょう.
一般に,フォロワー数や過去のツイート数,作成日などから普段使っていないアカウントが利用されていることを見つけることは可能です.
ここでは,まずフォロワー数が10人未満であるアカウントによる情報拡散がどのくらいあったのかを確認してみました.
上図は,各クラスタや不明アカウントの中で,フォロワー数が10未満であるアカウントの割合を示しています.これを観ると,C01リベラルやC02保守よりもフォロワーが10未満のアカウントが圧倒的に多いことが分かります.不明アカウントの15%以上がフォロワー数10未満でした.参考までに,Twitter全体でフォロワー数10未満のアカウントは6.7%程度です.というわけで,どうも不明アカウントも通常のアカウントとは言い難いアカウントが多数混じっているようです.
ちなみに,フォロワー10未満のアカウントが拡散しているのはどういう意図なんでしょうね?いくらリツイートしたところでほとんど広まらないわけですが.
ついでに,新規アカウントによる操作についても見るために,作成後30日以下のアカウントの割合を調べました.その結果がこちら.
この結果から,やはり不明アカウントの中に新しく作られたアカウントが4~7%あり他よりも多く含まれていることが分かりました.ここで,8月21日に急激に新規アカウントが増えたのは気になります.なお,この時期の作成後1か月アカウント率は3.3%程度のため,8月17日は一般的だったが,8月18日以降は30日以内に作られたアカウントの割合が通常より多いと言えそうです.
いずれにせよ,不明アカウントの中には通常使いではないアカウントが一定数含まれているというのは間違いなさそうです.
誰がためのツイッターアンケート
というわけで,アンケートに回答したアカウントは分析できませんが,拡散アカウントの分析から,間接的に今回の月刊hanadaによるツイッターアンケートへのツイッター上の反応を推定してみました.
その結果,当該アンケートを拡散した75%のアカウントが過去に政治的なツイートを行っていることが分かりました.また,そうでないツイートも一般的ではないアカウントも多く含まれていそうなことが分かりました.
アンケートに回答したアカウントも類似した性質を持つ可能性が高いと考えれば,アンケートとして質の良いものではなさそうだということが容易にわかります.
そもそも,多くのツイートでお互いが操作しあっていることを認識しているわけですから,このアンケートの結果どちらが多数派になったところで,「勝った方の陣営が頑張ったね」くらいの意味しかないでしょう.このアンケート結果を月刊Hanadaはどう利用したいんでしょうね.このままいけば賛成派が上回りそうですが,これだけ投票合戦が活発に行われていることが明確なアンケート結果をもって「賛成が多数派でした!」なんて言うのはさすがに正しい解釈とは言えないでしょう.もちろん反対派が多いともこのアンケートをもって言うことはできません.
一方で,世論調査結果では反対が多くなっているようですので,賛成派の方には賛成多数のアンケート結果を見たいという強い要望があり,それを提供しようという事かもしれません.そうであれば,「読者が見たい情報を提供する」というアテンションエコノミー時代にふさわしい記事になりそうです.
また,国葬賛成派(反対派)の方々が自分たちの想いを表明する場が提供されたと考えれば,それはそれで意義深い事とも捉えられるかもしれません.賛成反対ともに数十万アカウント分の熱い想いがあることがそれぞれの陣営で共有できたことは十分に評価できると思います.
いずれにせよ,「アンケート結果が世論であるとは言えない」というだけで,アンケートを行うこと自体には一定の意味はあるでしょう.この結果を月刊hanadaがどのように取り上げていくのか注目したいところです.
ツイッターアンケートは信用できるのか?
今回の件で分かる通り,ツイッターアンケートは操作可能で信用できる正しい結果が得られるものではありません.
社会調査を行うのは非常に難しく,きちんとした手続きを取らなければまっとうな結果を得られないことはよく知られています.新聞社の世論調査などは正しい結果を得るために様々な工夫をしています.各新聞社のページをみたり,世論調査の結果の記事を見れば,どのように調査しているかが書いてあります.例えば,読売新聞ならこちら,朝日新聞ならこちらを読めばだいたい調査方法は分かるかと思います.
これは,新聞社などの世論調査は「正しい世論を知る」という目的のために調査を行っているためです.「正確な世論を知るために何が必要か」という視点で考えると,慎重に調査方法を選定し,調査設計を行う必要があるわけです.
一方,ツイッターアンケートはツイートを見た人が気軽に答えられるものなので,アンケートを行ったアカウントのフォロワーの質に左右されますし,今回のように特定の結果を導き出したい人々によって簡単に操作できてしまいます.つまりその結果は信用できないものである可能性が高く,どのような結果であれその結果に一喜一憂することに意味はありません.エンターテインメントとしては楽しめるけど,その結果が世論や民意であると考えるのはナンセンスな代物です.これはツイッターアンケートだけでなくお手軽なネットアンケートが同じ問題を抱えています.その意味では,こういったアンケートは本当に正しい世論を知りたい場合には使えないわけで,どちらかと言えばお手軽に「都合の良いアンケート結果を作りたい」という場合に使い勝手が良いのではないでしょうか.真実かどうかは二の次で読者を喜ばせる記事を作れるという意味ではソーシャルポルノ的な記事を作る上では有用かもしれません.それ自体を否定するものではありませんが,「これは本当かどうかは分からない結果なことは分かったうえで,皆でこの結果をもとに盛り上がろう」というのであれば問題ありませんが「あのアンケートではこういう結果が出ているのに世論調査では異なる結果が出ている!世論調査は間違っている!」と思ってしまうと妙なことになりそうです.
その意味では,ツイッターアンケートの結果なんてこれっぽっちも信用ならないな,という事が多くの人の目に明らかになったという意味で,今回の一件は非常に有益だったのかもしれません.