2020都知事選はツイッター上でどのように扱われていたか
2020年7月5日東京都知事選が行われ,小池都知事の圧勝で幕を閉じました.
もともと小池都知事有利と言われていましたが,ふたを開けてみれば得票率59.7%ということで,圧勝といってよかったのではないでしょうか.
さて,今回の都知事選,ツイッター上ではどのように扱われていたのでしょうか.
「都知事」を含むツイートを,2020年06月18日~2020年07月04日までの期間で収集しました.
なお,これはベストエフォートで収集していることにご注意ください.
基本分析
総ツイート数は3,807,230ツイート.うち,ツイートは546,781,リツイートが3,260,449でした.全体の85.6%がリツイートでした.
なお,リツイートされたツイートの総数は135,644なので,411,137ツイートは一度もリツイートされることはありませんでした.
リツイートされる確率は24.8%です.
感覚的には,若干よくリツイートされているかな,という感じですね.
また,拡散も含めツイートに参加した総アカウント数は585,306アカウントです.
その中で実際に自分自身でツイートしたアカウントが246,371アカウントありました.
42.1%のアカウントが実際にツイートを投稿していますが,半分以上のアカウントは単に情報を拡散しただけでした.
ツイートしたアカウントは,平均2.2回ツイートしています.
リツイートしたアカウントは,平均9.6回リツイートしています.
では,次に一日ごとのツイート数及びアカウント数の変化を見てみましょう.
投票日(7月5日)に近づくにつれてツイート数,アカウント数ともに増加していることがわかります.
ツイートアカウントの特徴
次に,ツイートやリツイートが特定のアカウントによって行われていたかどうかを分析してみましょう.
まず,大量にツイートやリツイートしたアカウントが存在したかどうかを分析してみます.
最も多くツイートやリツイートを行ったアカウントはどのくらいツイートやリツイートを行ったのでしょうか.
最も多くツイートを行ったアカウントは,877回のツイートを行っていました.
データ取得期間が17日間ありますので,一日平均51.6ツイート.まあ,ちょっとしたヘビーユーザなら十分ありそうなツイート数ですね.
次に,最も多くリツイートを行ったアカウントですが,こちらは2327回のリツイートを行っていました.一日平均だと136.9ツイートです.
ちょっと多い気がしますが,ツイート分析しているとちょいちょい見かけるレベルです.
ちなみに,1000回以上リツイートしたアカウントは30ありました.結構暇人が多いな,世の中.
さて,こういったバースト事象の際に特に重要になるのが「一部の人だけが騒いでいるのではないか」という点です.
そこで,まずどのくらいの人が何リツイート位したのかをグラフで見てみましょう.
横軸がリツイートした回数を,縦軸がその回数リツイートしたアカウント数を示しています.
1回しかリツイートしていないアカウントが219,436あることが読み取れます.いや,細かくて読み取れないけど.
ちなみに,22万アカウントということは,おおよそリツイートした全アカウントの50%くらいに当たります.
つまり,半分くらいのアカウントは一回しかリツイートしていないわけです.では,2回リツイートしたアカウントはどのくらいかというと,65,119になります.急激に減りましたね.
さて,ここからちょっと難しい話になるので面倒な人は飛ばしてください.
このグラフは両方の軸が対数,つまり両対数グラフとなっていますが,それが直線ということは,べき分布になっているということを意味します.今回の場合は,リツイートを2倍行うアカウントは30%程度に減る,という法則が成り立つことを意味します.
一般にこのようなべき分布は自然界でよくみられる法則であり,それが今回も見られたということは,リツイートしたアカウント数は「自然によく見られる分布をしている=あまり人為的な歪みは見られない」といってよいかと思います.
ただし,リツイート数の多いほうは別ですね.リツイート数が多いほうは直線から外れていますので,ここには人の意思が働いているとみてよいでしょう.まあ,一生懸命都知事選関係のツイートをリツイートしていた人たちが一定数いるのは仕方がないことかとは思います.
ここでは,リツイート数の多いアカウントからカウントして,何パーセントのアカウントによって,全リツイートの50%が拡散されたのか,を見てみましょう.
データを確認したところ,ちょうど48リツイートが境目で,48ツイート以上リツイートしたアカウントによるリツイートが全体の50%を占めることがわかりました.そして,48ツイート以上リツイートしたアカウントは12,854あり,すべてのリツイートしたアカウントの約3%にあたります.
つまり,今回収集したツイートにおけるリツイートの50%は3%のアカウントによって行われたものであるといえます.
あなたが目にした「都知事」が入ったリツイート,平均的にはその半分は全体の3%の人が頑張って拡散したものみたいですよ.
候補者ごとの分析
最後に,候補者ごとの言及ツイート数を見てみましょう.
ここでは,都知事+各候補者の苗字が含まれるツイートおよびリツイートを言及ツイートとしてカウントしました.
ただし,小池都知事の場合は現職だったため,選挙と無関係な話題でも小池+都知事で出現しています.
これを見ると,やはり圧倒的に小池都知事が多く登場していることがわかります.
それ以外はおおよそ得票数に準じたツイート数となっていますが,山本氏が宇都宮氏よりツイート数が多い,5位の桜井氏も4位の小野氏よりも多い,など多少の前後はあったようです.
4位と5位の差は,桜井氏が多くツイートされたこともありますが,小野氏があまりツイートされていなかったのではないかという気もしますが.
また,ツイートリツイート比を見ると,後藤氏が25%ツイートということで,圧倒的に多くツイートされている(リツイートされていない?)ということがわかります.
後藤氏といえば,今回の選挙では色々な意味で話題になった方なので,ツイッター上ではかなり直接ツイートされることが多かったということでしょうか.
ちなみに,後藤氏については,一度だけツイートしたアカウントが全体に占める割合が大変高かったです.
後藤氏について言及したアカウントの約80%が一度だけしか言及しませんでした.ほかの候補は大体50%くらいなのに比べると圧倒的ですね,後藤氏は.
この辺も後藤氏の特異性が表れています.
最後に,各候補者の言及ツイート数と得票数の関係を見てみましょう.
もともと小池氏は都知事ということもあり,多めに出てしまうのは仕方がありませんが,おおむねツイート数と得票数は関係しているようです.
相関係数は0.9と非常に強い相関がありました.なお,特異値である小池氏を除いても相関係数は0.7とやはり強い相関関係がありました.
もちろん,これは相関係数ですので「ツイート数が多いから得票数が増えた」のか「得票数が多いような人はツイッターでも言及されやすい」のか,はたまた別の要因(例えば「得票数を伸ばす候補の支持者はツイッターユーザが多い」等)が効いているのかまでは分かりませんが,投票日前日までのツイートの言及数でおおよそ当選できるかどうかは予測できるのではないでしょうか.
ま,予測という点で言えば,世論調査だけでも十分的中率が高いので,何もツイッターを使わなくてもよさそうですが.
というわけで,今回は2020都知事選についてツイッター上でどのように言及されていたかを分析してみました.
割と面白みのない結果しか出なくて,個人的にはションボリです.
その中で輝く活躍を見せてくれた後藤氏に感謝!
次回へ続く
ところで,今回候補者名が入ったツイートについて分析を行ったのですが,あくまでも数をカウントしただけの単純な分析です.
もう少し賢い分析もしてみないといけないですよね.
というわけで,次回は根性マイニング+ネットワーク分析を行った結果をご紹介したいと思います.
特に根性マイニングの結果はなかなか面白い結果になっていますので,ご期待ください.