本気で匿名性を保つために留意すべきこと

From pixabay https://bit.ly/2HTw5au

私はTorI2Pを始めとする、ネット上での身元を隠す匿名化技術に関心があり、開発したり実際に使ったりもしているが、一方私自身がオンラインで何か情報発信するときは、基本的に実名で通している。それは、幸か不幸か個人的には匿名で書く必要があまりないということもあるが、どちらかと言えば倫理というより自衛の問題である。なまじ匿名だと思うと心理的なガードが下がり、不用意なことを書きがちだからだ。

しかし、権力者の不正を内部告発する場合など、本当に匿名性が必要な局面というのもある。匿名化技術はまさにそういったケースのために開発されているのだが、それでもユーザの素性がばれてしまったことが無いわけではない。ただ私が知る限り、これまで技術的な欠陥のせいで素性が暴かれたというケースはほぼ皆無で、大体はうかつに知り合いに話したら通報されたとか(チェルシー・マニングのケース)、匿名投稿と他のところで実名で書いた投稿の間に何らかのつながりが見いだされたとか(ロス・ウルブリヒトのケース)、サーバの物理的な所在を隠す秘匿サービスのはずがウェブサイトのソースコードにIPアドレスが残っていたとか、ようするに人間側のミスであることが多い。セキュリティが鎖だとすれば最も弱い環は人間、とよく言われるが、全くその通りである。

匿名化技術の詳細については稿を改めてまた書こうと思うが、今回は技術はともかく、書き方や振る舞い方のレベルで、人間が匿名性を保つために留意すべきことは何か、ざっと思いつくことをまとめてみた。

基本はplausible deniability

匿名性を保つには、plausible deniabilityを高めるにはどうしたらよいか、ということを常に考える必要がある。

plausible deniabilityもっともらしい否認と訳されるようで、Wikipediaを見ると私が思っていたのとはやや違った意味で使われることが多いようだが、ここで言うplausible deniabilityというのは単純な話で、「自分以外の人がやった可能性が否定できない」ということだ。

例えばある文章があったとして、その文章はお前が書いたのだろうと疑われたとしても、他人でも書ける内容であり、自分が書いたという決め手がなければ、あなたとその文章の間に関係があることを立証することはできない。もちろん、その情報を知り得たのが世界中であなたしかいないとか、あなた以外の知り得た人々には強力なアリバイがある、という場合にはplausible deniabilityが成立しないので、注意が必要である。そもそも、本当に匿名性を保ちたければ、匿名化技術を使っていると公言すべきではない。それだけで絞り込まれてしまうからだ。

できれば日本語を使わない

日本語はそれなりの数の話者がいるとはいえ、世界的に見ればマイナーな言語である。日本語を使う人はせいぜい1億人強といったところだろうから、日本語を使うだけで70億分の1から1億分の1になってしまう。英語は約20億人が使っているので、英語で書けば1億分の1から20億分の1にできる。英語が下手な人は日本人以外にも多くいるので、匿名性という意味では、下手な英語は日本語よりはマシである。

ダークウェブはいつも快晴

どんな情報も、決め手にはならないかもしれないがヒントにはなる。ゆえに、匿名の情報発信において、自分の実人生については一切言及すべきでないのだが、これは頭では分かっていても実際にはなかなか難しい。例えば「今日は雨が降っていた」というだけで、その日地球上で雨が降らなかった場所にはいなかった、ということが分かってしまう。BitCoinに注目が集まった際には、作者である匿名の人物サトシ・ナカモトのメーリングリストへの投稿時間やコード・コミットの時間帯から、彼が住む地域を探りだそうという研究があったし、Silk Roadの運営者ドレッド・パイレート・ロバーツことロス・ウルブリヒトは、ある政治思想に関するマイナーな著者の本を愛読している、という不用意な書き込みが、その思想にかぶれていた彼が捜査線上に浮上するきっかけの一つとなった。9時から5時に書き込みが少なければ勤め人かもしれないし、夏休みに書き込みが多ければ学生かもしれない。こうした細かい情報を組み合わせることで、案外素性は見当がついてしまうものなのである。

自分が住む国や地域のイベントやニュースはもとより、天気や時間、あいさつ(ついおはようなどと言ってしまうが、日本が朝でも地球上全てが朝というわけではない)、趣味や愛読書などへの言及は要注意だ。天気はいつも快晴、時間はいつも朝、あいさつはいつもこんにちは、愛読書はONE PIECE、とでもあらかじめ設定を考えてから書くよう心がけると良い。ちなみに、私が開発しているあるソフトウェアは、投稿時間をランダムに変更するようにしてある。

もちろん、逆手に取ってあえて偽情報を流すということも可能だが、個人的には、小細工をすると慢心して墓穴を掘ることが多いような気がする。他人はもちろん、自分も過信すべきではない。

変名はランダム文字列

人間の思考は、案外パターンから逃れられないものである。ニックネームを付けるにしても、うっかり自分の趣味や関心と関係あるものにしてしまうということがある。変名が必要なら、完全にランダムな文字列で、できるだけ機械的に決めるのが良い。また、変名を使い回すのは最悪で、できるだけ一回限りの使い捨てにすべきである。

メタデータは忘れず消す

文書形式によっては、作成者や作成時間がメタデータとして残っていることがある。先に出てきたサトシ・ナカモトに関しても、有名なBitCoin論文のPDFメタデータに残っていたタイムゾーン情報から、住んでいる地域を特定しようという試みがあった。画像も、撮影場所や撮影者の情報がEXIFとして残っていることがある。こうしたものを消すウェブサービスなどもあるようだが、誰が運営しているか分からないので、やり方を調べて自分の手で削除したほうがよい。

文体から個性を抜く

ロバート・ガルブレイスと名乗るイギリスのミステリー作家がいた。2014年、この人の正体が実は「ハリー・ポッター」シリーズで有名なJ.K.ローリングだという情報が新聞社に寄せられ、この新聞社に委嘱された研究者がガルブレイスの小説の文体や語彙を計量的に検討したところ、ローリングと同一人物である可能性が極めて高いとされ、結局ローリングも認めるという事件があった。

無くて七癖というが、文章からは知らず知らずのうちに個性がにじみ出てしまうもので、自分しか使わない言い回しや単語が必ずある。それらを計量的に分析し、年齢や学歴など、文章の著者に関する情報を探るのがいわゆる法言語学(forensic linguistics)だが、コンピュータや機械学習の進歩と相まって、近年この分野の進展はめざましい。サンプルさえ十分にあれば、著者は大体分かってしまうようだ。とすれば、plausible deniabilityという意味では、誰でも書ける、無個性な文体を意識的に採用する必要がある。

といっても言うは易く行うは難しで、あくまでコツ程度のことしか私にも言えないのだが、まず重要なのは、できるだけ易しい語彙しか使わないということである。難しい語彙や漢字、フレーズは多くの場合他の人は使わないわけで、特定される可能性が高まる。また、英単語の綴りに英国式と米国式があるように、日本語でもある地域でしか使われていない言葉は多くあるので、特に注意しなければならない。

ことわざや故事成語、専門用語、スラング、そして特に略語は、著者が育った、あるいは今もその中で過ごしている文化と密接に関係するので、できるだけ避けたほうがよい。一文はできるだけ短くし、当て字、体言止め、間接話法、書き間違いなども特徴量となり得るので注意する。句読点や括弧の種類、段落の字下げ、箇条書きの見出しなども、普段使っているものとは変えたほうがよいだろう。具体的には、漢字は常用漢字のみ使い、表記等は自分の好みではなく共同通信社の「記者ハンドブック」に準拠するのが良いかと思う。

伝家の宝刀としての匿名性

私自身は、現在のインターネットには匿名性が足りず、そのことが情報の中央集権化に拍車を掛けてしまっていると感じており、ネットの標準的な仕組みとして、様々な形で匿名化技術を普及させていく必要があると考えている。一方で、匿名性というのは人間を無防備にするものでリスクもあるので、年がら年中匿名で書くのではなく、いわば「伝家の宝刀」として使ってもらいたいという気分もある。

これまで述べてきたように、実際に匿名性を保つのは容易ではなく、本気でやるなら偏執的な配慮が必要だ。ただ、伝家の宝刀である以上、それは優秀な情報機関等の追及にも耐えられるレベルの、真の匿名である必要があると私は思うのである。