Yahoo!ニュース

温泉むすめは萌えているか?炎上のツイート分析

鳥海不二夫東京大学大学院工学系研究科教授
温泉むすめたち(多分)(写真:アフロ)

2021年11月15日のこんなツイートがきっかけで,温泉むすめというコンテンツが炎上しているようです.

温泉むすめのキャラクタ―設定に不適切な表現があったということで問題視されたようです.とはいえ,こういった「不適切な表現」への指摘は,その表現のファンにとっては受け入れがたいもので,反発があって炎上するのはよくある話です.

炎上したのであれば,とりあえずどのように炎上しているのが調べるのが礼儀というものかと思いますので,ツイートを収集して分析をしてみました.

なお,この分析はあくまでもツイッター上での分析であり,温泉むすめというコンテンツの是非について結論を出すものではないことにご注意ください.

3行まとめ

・温泉むすめの炎上は批判派と擁護派,肯定派の3クラスタに分かれ,擁護+肯定系が多く,批判派のアカウントは少なかった

・どのクラスタも偏りが大きい(エコーチェンバー現象が生じている可能性が高い)

・どのクラスタも情報の発信源は少なく,拡散は一部のアカウントの活躍によるところが多かった

どんなツイートがあったのか?

2021年11月10日~21日12時までの間で約70万のツイートがありました.何気に炎上前にも一日1000ツイートくらいはされており,それなりのコンテンツだったことがうかがえます.

さて,炎上後を含めてどのような意見があったのか分析するために拡散数トップ1000ツイートについてネットワーククラスタリングの手法を用いて分類を行いました.

まず,得られたネットワークがこちら.

温泉むすめのツイートネットワーク(著者作成)
温泉むすめのツイートネットワーク(著者作成)

大きく二つに分かれていることが分かります.

さらにこのネットワークに対して,クラスタリングを行った結果,5つのクラスタが見つかりました.その中でも特に大きいクラスタは3つありました.

まず,下の塊が温泉むすめを擁護するツイート群となります.

ちょっとわかりづらいですが,下の塊は左右に分かれています.左側は主に温泉むすめ批判に対する反論や擁護(クラスタC00),右側は主に温泉むすめという取り組みに対して肯定的なツイート群(クラスタC01)でした.右側の塊には,温泉むすめの公式や温泉地の関係者アカウントの発信が多く含まれているようです.

上の塊には基本的には温泉むすめを批判するツイート群(クラスタC02)です.この記事の最初にあげたツイートなどが含まれています.

どんなツイートがどのくらい拡散されたのか

これらRT数が多い3つのクラスタについていつどのくらいツイートがあったのかを分析してみた結果が下図の通りです.

クラスタ別ツイート数(著者作成)
クラスタ別ツイート数(著者作成)

この結果を見ると,温泉むすめに批判的なツイートが最初多数リツイートされていますが,すぐに擁護系や肯定系ツイートがそれを抜いていることが分かります.数的には温泉むすめを批判するツイートよりも,肯定的な方が多いようです.

総数で行くと,

・温泉むすめ批判への反論や擁護系(C00):総ツイート数368,拡散数309,901回,拡散アカウント数95,545

・温泉むすめ肯定系(C01):総ツイート数145,拡散数77,244回,拡散アカウント数28,352

・温泉むすめ批判系(C02):総ツイート数127,拡散数36,222回,拡散アカウント数14,944

です.参考までに.

ところで,この図を見ると,擁護クラスタ(C00)が炎上開始から4日たってもツイートが盛んに行われているのが興味深いです.通常炎上は3日くらいすると収まるものなので,ちょっと不思議な現象です.

と思って,拡散数のデータを見たら,どうやらこのツイートがバズったせいだったみたいです.

おそロシア.というか,やっぱり日本のツイッターはすぐに大喜利に走りますね.

というわけで,流石に燃料が投下されない限り,22日以降は温泉むすめがタイムラインに出てくる回数も激減するだろうなあと予想しています.

一般性の評価(エコーチェンバー度)の比較

次に,一般性の評価を行ってみました.ツイートを行っているユーザ群がツイッター全体に対してどの程度偏っているのかを確認します.もし偏りが大きければ,特定の傾向を持ったアカウント群が主にツイートしているということを意味する指標になります.分かりやすく言えば,エコーチェンバー現象が発生しているような場合に偏りは大きくなると言えるでしょう.

各クラスタの偏り(著者作成)
各クラスタの偏り(著者作成)

ここから,温泉むすめに批判的な集団が最も偏りが大きかったことが分かります.それ以外のクラスタは偏りが低かったかというとそんなこともないとは思いますが.その意味では,温泉むすめの炎上全体がそれほど一般的なものだったとは言えないような気もします.あれ,実はこのデータ分析しても皆たいして興味がないのでは・・?

イノベータはどのくらい?

次に,それぞれのクラスタで影響力のあったアカウントがどのくらいあるのかを調べてみました.オリジナルツイートの発信者とその拡散数をもとに,拡散の半分を担うオリジナルツイートの発信者をイノベータとして,その人数を確認しました.これが少なければ少数から情報が発信され,多ければ多数の人が拡散させるような内容をツイートしていることになります.

イノベータ数の違い(著者作成)
イノベータ数の違い(著者作成)

この結果から,C02の批判系が最も少数の発信者から多数の拡散がなされていることが分かりました.基本的には9アカウントからの発信が全体の拡散数36,222の約半分,17,662回の拡散につながっていたようです(オリジナルツイートの出所が9アカウントという意味で,9アカウントが17,662回も拡散したわけではないのであしからず).

アメリカでは,The Disinformation Dozenといってわずか12アカウントからワクチンに関する誤った情報が拡散したといわれていますが,それと同じようなことが起きていたといえるでしょう.

これ,ただし少数から発信された情報だから良い悪いではないということにご注意ください.日本では,ワクチンに関する誤った情報が29アカウントから広まっていたのに対して,正しい情報は4アカウントから広まっていたということが分かっていますので,「どんな情報でも発信源は少ない」くらいの意味しかないとも言えそうです.

一部のアカウントが頑張っているのか?

炎上は一部の積極的なアカウントによって何度も拡散されることによって,より大きな拡散のように見せかけられることが良くあります.

そこで,全体の50%の拡散が最少で何アカウントで行われていたのかをクラスタ別に確認しました.その結果が下図の通りです.

50%の拡散を行ったアカウントの割合(著者作成)
50%の拡散を行ったアカウントの割合(著者作成)

この結果から,どのクラスタでも10%程度のアカウントによって全体の半分の拡散が行われていたことが分かります.特に温泉むすめ批判に敏感に反応しているクラスタC00は7.5%のアカウントが50%の拡散を担っているということで,過去の分析と比較してもこれはかなり小さい値となります.従って,温泉むすめの擁護は一部のアカウントが特に熱心に行っていると言ってよいでしょう.

とはいえ,じゃあ温泉むすめへの批判派はどうかというと,こちらも10.7%が50%の拡散を担っていますので,こちらも一部のアカウントによる積極的な活動の結果であると言えるかと思います.

いつものことですが,どっちもどっちです.

おわりに

というわけで,界隈で話題になっている気がして炎上分析してみた温泉むすめの件ですが,炎上の規模としては中規模といったところでしょうか.温泉むすめに対して批判派と擁護派,そして関係者がクラスタを作っていたようですが,規模的には批判派は少数派だったようです.ちなみに,少数派が間違っているという意味ではないのでご注意ください.

しかし,少数派がエコーチェンバーの中に入ってしまうとせっかくの主張が外部に伝わりづらくなってしまうのですが,偏りの大きさを見る限り本件でもエコーチェンバー現象が発生しているようにも見えます.主義主張をするのであれば,改善の余地があるのではないかとはいつも思っているんですけどね.なかなか届かないこの想い.

より詳細が気になる方や,ここが違うと思う方はぜひデータを収集して分析していただければと思います.簡単にデータを集めるのであればWeb Tweet Crawlerなどがありますし,最近Twitter社がデータ収集のAPIの利用条件を緩和したようなので,過去のデータまである程度収集できるかと思います.

東京大学大学院工学系研究科教授

2004年東京工業大学大学院理工学研究科機械制御システム工学専攻博士課程修了(博士(工学)),2012年より東京大学大学院工学系研究科准教授,2021年より現職.計算社会科学,人工知能技術の社会応用などの研究に従事.計算社会科学会副会長,情報法制研究所理事,人工知能学会編集委員長.人工知能学会,電子情報通信学会,情報処理学会,日本社会情報学会,AAAI各会員.「科学技術への顕著な貢献2018(ナイスステップな研究者)」

鳥海不二夫の最近の記事