Yahoo!ニュース

IDでもっと便利に新規取得

ログイン

「真実」「最も」「ひどい」フェイクニュースに多用される抽象表現や強調表現 研究

配信

The Guardian

【執筆:David Shariatmadari】  インターネット上ではデータが人類史上最大の爆発を起こしている。情報の生態系は熱帯雨林にも少し似て、密に茂る一方で熾烈な競争が行われ、捕食動物や有毒植物も存在する。  意図的に誤解を与えるように書かれた記事や投稿がウェブサイトやソーシャルメディアで生み出される理由はさまざまだ。選挙や政策に影響を与えようとしているのかもしれないし、国同士のサイバー戦争の形として現れるかもしれない。ある人物に関するステルスマーケティングなのかもしれないし、敵対する相手の信用を失墜させる狙いがあるのかもしれない。もしくは単に、とんでもないうそは注目を集めるという性質を利用して、広告収入を生み出してお金を稼ぐことが目的なのかもしれない。  とは言え、こうしたものに共通している特徴が一つある。フェイクニュースで使われる言葉だ。  重要なのは、フェイクニュースを確実に見極める方法を備えておくことだが、フェイクニュースがそもそも問題なのは、信頼できる体裁に見せかけて伝えられ、受け取り手には、フェイクかそうでないかの違いが必ずしも区別できないからだ。だからこそ、ここ数年、フェイクニュースの言語的特徴を見つける研究が行われてきた。  誤解を招く恐れがあると分析された素材をコンピューターに入力しておくと、使用されている言葉のパターンを特定し、その後、その知識を新しい素材に適用し、疑わしい内容に関して警告する。  こうしたプロジェクトの一つで、カナダのサイモンフレーザー大学でファーテメ・トラビ・アスル博士が率いている研究が最近明らかにしたのは、「フェイクニュースの記事には平均的に(略)セックス、死、不安に関する言葉がよく登場する」ことだ。「過度に感情的」な言葉も頻繁に使われる。対照的に、「本物のニュースは(略)仕事(ビジネス)とお金(経済)に関する言葉が登場する割合が多い」。  別の研究者チームは、さまざまな文法上のカテゴリーとフェイクニュースの関係を分析。意図的に誤解を与えるように書かれた記事の中では、場合によって強調表現がより頻繁にみられると結論付けた。例えば「most(最も)」や「worst(最悪の)」といった最上級形の表現や、「brilliant(素晴らしい)」や「terrible(ひどい)」といった主観的な表現だ。同チームは、プロパガンダの記事には「truth(真実)」や「freedom(自由)」といった抽象的な一般表現が使われる傾向にあり、また興味深いことに、二人称代名詞の「あなた(you)」の使用はフェイクニュースと密接に関係していると主張している。  だが、こうしたアプローチには問題もある。英バーミンガム大学のジャック・グリーブ教授は、必ずしもジャンル別に調整した上での分析ではないと指摘。つまり上記で見られた言葉の違いは単に、形式張ったニュース記事か、もっとくだけたフェイスブックの投稿かの違いによる可能性もあるというわけだ。  この問題を回避するためにグリーブ教授のチームは、記事をねつ造・盗用していたとして2003年に米ニューヨークタイムズ紙を解雇されたジェイソン・ブレア氏が書いた記事の中から、撤回された40本と撤回されなかった41本を比較。これらは一つのジャンルの中で書かれたものだが、それでもグリーブ教授によると、それぞれの伝達の目的(一方は知らせるため、もう一方はだますため)によって、恐らく無意識による微妙な違いが言葉の遣い方に見られたという。  ブレア氏は自分の記事を事実として押し通そうとしていたわけだが、そこには、データの処理、分析を経て初めて明確になったほどの微妙な手掛かりがあった。例えば、撤回されたブレア氏の記事には、「really(本当に)」や「most(最も)」のような強調表現がより多くみられた。撤回されなかった記事に比べると、短い単語が使われ、表現も「情報の濃さ」において弱かった。現在形が不意に出てくることが多く、フルネームを使うよりも「he(彼)」や「she(彼女)」といった三人称代名詞がより使用されていた。これは作り話に典型的な書き方だ。  こうしたことは何を物語るのだろうか? 確かに私たちはまだ、フェイクと事実を見極める絶対的に確実な方法を持ち合わせてはいない。しかしそこには、気を付けるべき何かしらの特徴が存在する。その記事は、そうしたジャンルの記事として想定されるレベルより文体がくだけているだろうか? 最上級形や強調表現が多く含まれている? その記事は主観的な判断を下しているだろうか? 報道記事というより物語のよう?  究極的には、最も難しい部分は人工知能(AI)に頼るしかないのかもしれない。AIなら、フェイクニュースの膨大なデータの中にある「裸眼」では見えない確かな言語的パターンの有無を判断することができるだろう。 デービッド・シャリアトマダリはガーディアン紙編集者で作家。「Don’t Believe A Word: The Surprising Truth About Language(一言たりとも信じてはいけない:言葉の驚くべき真実)」の著者。【翻訳編集】AFPBB News

【関連記事】