前回の記事で,2020都知事選がツイッター上でどう扱われていたのかの概略を紹介しました.

今回は,都知事選関連のツイートをもう少し詳細に計算社会科学的視点から分析してみます.

ツイートの分類

分析に利用したデータは以下の通りです.

  • 検索条件:「都知事」を含むツイート
  • 期間:2020年06月18日~2020年07月04日
  • ツイート数:3,807,230
  • オリジナルツイート数:546,781
  • アカウント数:585,306

都知事選関連ツイートの分類

都知事選についてのツイートを集めたとはいえ,その内容は千差万別です.

そこで,見通しをよくするためにこれらのツイートを内容ごとに分類してみたいと思います.

分類には自然言語処理の技術を使う場合も多いですが,ツイートは文字数が140文字と少ないため,必ずしも自然言語処理ではうまく処理できないことも多いのが欠点です.

そこで,リツイートユーザに基づく分類手法を利用しました.ツイートの分類については,こちらの手法の方が良い分類ができることがわかっています

今回は,収集したツイートの中から,リツイート数が多かったツイート上位200ツイートについて,類似情報ごとに分類しました.

手法について簡単に説明すると,リツイートしたユーザが20%以上被っている二つのツイートをリンクでつないでネットワークを作成し,そこから類似情報群を抽出しています.分類手法の詳細についてご興味がある方は,こちらの論文バースト現象におけるトピック分析をご覧ください.

この手法でツイートを分類してみた結果がこちらの図になります.〇がツイート1つに対応し,線で結ばれていると,類似した情報であるということを意味しています.

ツイートの分類(筆者作成)
ツイートの分類(筆者作成)

都知事選のツイートは大きく2つのクラスタ(かたまり)に分割されていることがわかります.ここでは,大きいクラスタをA,小さいクラスタをBとしておきましょうか.

一般に政治系のトピックの場合はたいてい大きく2つに分かれることがわかっているため,今回もほぼ同様の結果になりました.

今回は都知事選では,選挙期間中も小池都知事の優勢が伝えられていましたので,小池都知事派vs反小池都知事派に分かれるであろうことは想像に難くありません.

早速,それぞれのツイート群の代表的なツイートを見てみましょう.

クラスタAのツイート

まず,大きいほうのクラスタ(A)で最もリツイートされたツイートです.

タレントのたかまつななさんのツイートですね.

このような「選挙に行こう」といった呼びかけのツイートがこのクラスタにはよく見られました.

また,それ以外には,

のような,小池都知事への批判ツイートなどが多数含まれていました.

つまり,クラスタAは反小池都知事クラスタと言えそうです.

クラスタBのツイート

では,次にクラスタBに含まれる代表的なツイートについて見てみましょう.

最もリツイートが多かったツイートは一般人の方のツイートでしたので,リンクは割愛しますが,山本氏に対する批判的ツイートでした.

二番目にリツイートが多かったツイートも一般人ですのでリンクは割愛しますが,

桜井誠候補が生活保護申請の間違いを厳しく追及し大阪市側に支給を停止させた

という内容でした.それ以外にも,

マスコミは桜井氏を無視している

といったツイートが見られます.また,それ以外には小池都知事や宇都宮氏に対する批判ツイートなど,得票数が上位だった候補者全方位に対して批判が多いクラスタであることがわかりました.

というわけで,こちらのクラスタは桜井氏を支持する,いわゆる保守系のクラスタであるといえるでしょう.

実際,某有名インフルエンサーK氏のツイートが複数このクラスタには含まれていました.

クラスタまとめ

ということで,二つの大きなクラスタが現れましたが,一つは反小池都知事,もう一つは桜井氏支持のクラスタということがわかりました.

興味深いのは,反小池都知事クラスタには桜井氏を除くほかの候補の支持層が集まっており,桜井氏のクラスタではほかのすべての候補を批判している傾向があるということでしょうか.

政治的志向でいえば,クラスタAがリベラル系,クラスタBが保守系といったところです.

あれ?そうすると小池都知事の支持層はどこにいるんだ?

各ツイートを見ても,小池氏支持のツイートは見当たらなかったため,拡散上位200ツイートの中には小池都知事支持層によるツイートはなかった,つまり大きくは拡散していなかったということになりそうです.

では,拡散しないまでも小池都知事支持のツイートがなかったとは思えません.

小池氏関連のツイート分析

というわけで,都知事+小池が含まれた1,273,617ツイートについて,小池都知事支持層のツイートがどの程度含まれるのか調べてみました.

といっても,100万ツイートを調べるのは困難なため,一部を取り出して調べることにします.

具体的には,ランダムに抽出したツイートを目で見て小池都知事支持なのか,反小池都知事なのかを根性マイニングを使って分析しました.

ちなみに,根性マイニングとは「すべて人の目で見て判断を行う」という根性が必要だけど精度が高いと評判のデータ分析手法です.

今回は,オリジナルツイートからランダムに抽出した146ツイートと,リツイートを含めたツイートからランダムに抽出した133ツイートを根性マイニングしました.

オリジナルツイートの小池都知事に対する態度の内訳は以下の通りでした.

小池氏に言及したツイートの内容内訳(筆者作成)
小池氏に言及したツイートの内容内訳(筆者作成)

こちらを見てわかる通り,「小池」という単語が入っている中でポジティブだったツイートは10%以下で,逆に50%近くが不支持を表明しているツイートでした.他候補者支持を含めると,56.1%が小池氏を支持していないことを表明するツイートでした.

リツイートを含めた場合の小池都知事に対する態度の内訳がこちらです.

小池氏に言及したリツイートの内容内訳(筆者作成)
小池氏に言及したリツイートの内容内訳(筆者作成)

133ツイート見て,小池氏支持のツイートは一件も見つけられませんでした.ちょっと予想外.

他候補支持を含めると,75.9%が小池氏不支持のツイートの拡散でした.

というわけで,ツイッター上では小池都知事に関する言及は多かったものの,支持を表明するものはごく一部に過ぎなかったということがわかりました.

ちなみに,山本氏の内訳はこんな感じです.

山本氏に言及したツイートの内容内訳(筆者作成)
山本氏に言及したツイートの内容内訳(筆者作成)

不支持もありますが,支持を表明するツイートがそれ以上に多いことがわかります.

小池都知事へのオリジナルツイートは114,878件,山本氏へのオリジナルツイートは65,881件でしたが,もし小池都知事への支持ツイートが10%程度,山本氏への支持ツイートが40%程度だとすると,小池都知事への支持ツイートは11,487件,山本氏への支持ツイートは26,352件となり,山本氏への支持ツイートの方が多いということになります.(2020年7月10日修正.)

ということで,山本氏と比較してみても小池都知事の応援ツイートは少なかったといえそうです.

もちろん計算上ですので,実際にはどうかは分かりませんが.

ちなみに,根性マイニングしたツイート数が少ないんじゃないかという批判は甘んじて受け入れます.

もうちょっと多めに見たいところですが,根性マイニングには大変な時間と根性がかかるため,この辺が限界・・・

結論

以上より,候補者別に言及数を見ると小池都知事への言及が一番多かったものの,小池都知事へのツイートは支持を表明したものではなかったし,むしろ不支持の表明が多かったといえそうです.

ツイート言及数と得票率には相関があると前回の記事で書きましたが,やはり相関はあるものの直接的な因果関係ではなさそうです.

むしろ,圧倒的知名度を誇って再選が濃厚だった小池氏をほかの候補者の支持者が批判するという構図だった可能性が高そうです.

にもかかわらず,選挙の結果は小池氏の圧勝(といってもよいくらいの差)でした.

誰だ?ツイッターから社会が見えるなんて言ったのは!?

おそらく今回の都知事選では,小池都知事以外の候補の支持者たちがツイッター上で頑張ったんでしょうね.

少数派の人たちが声を上げることによって,大勢が声を上げているように見えてしまうノイジーマイノリティーという現象があります.今回(に限らないですが),ツイッター上でそういった現象が生じていたのだと思います.さらに,小池都知事有利の報道はありましたので,「多数派なら特に言及もしない」という一種のサイレントマジョリティー現象(欅坂46の曲にあらず)も併せて起きていたのではないでしょうか.

今回データを分析している中に,

マスコミなんて信じるな!真実はSNSを見ればわかる!

という反小池都知事派の威勢のいいツイートを見かけました.もしかするとこの方の周りには反小池都知事派が多く存在し,閉鎖コミュニティの中で信念が高まるエコーチェンバー現象が生じていて,小池都知事支持派はいないと確信したのかも知れません.

もちろん一つのメディアに頼らずに,情報を数多く入手して意思決定を行うことは重要ですが,「真実はSNS上にある」というよりは,

「マスコミが全部正しいとは限らないし,SNSを客観的に見れば真実に近づくことが可能かもしれない」

ぐらいが実際のところかなと思います.

実際,今回の比較的規模の大きい分析を行ったとはいえ,あくまでもツイッターという限られた空間での情報に過ぎません.そのため,データを分析しても小池都知事支持のマジョリティーを捉えることはできませんでした.事前に予測していたら「小池都知事支持層は少ない!」とか間違った結果を出していた可能性もありますね.危ない危ない.

我々が見ることができる範囲なんてごくわずかなので,自分の見える世界が真実だと思い込むのは本当に危険ですね.

自戒を込めて.

2020年7月10日追記:

山本氏のツイート数を間違えて記述していたため,修正いたしました.