論文不正の告発を受けた東京大学(3) 告発通りに図版の誤りはあったが……
昨年の夏、東京大学は研究不正の疑義があるという匿名の告発書を2回にわたって受けた。医学部の5人の教授と分子細胞生物学研究所(以下、分生研)の1人の教授が主宰する合わせて6つの研究室から出た計22本の論文に載っている図版(グラフや写真)に、不自然な点があるというのだ。
この告発を受け、東大の科学研究行動規範委員会は外部有識者を含む2つの部局内調査班(医学部、分生研)を立ち上げて調査を行っていた。調査班の調査内容、およびその内容を受けて委員会が下した裁定に関する記者会見が8月1日に行われた。
分生研調査班の結果では、論文5本から16項目を捏造または改ざんと認定した。東京大学から分生研の調査報告(データ解析結果)が公開されているので、ここではこれ以上のことは触れない。心身ともに負担の大きな検証作業だったろうと推察する。調査班の先生方には、頭の下がる思いである。
ここで取り上げたいのは医学部の調査のほうだ。東大のサイトから入手できる資料は不正はなかったという結論の報告(22報論文に関する調査報告(骨子)しかないが、8月1日の記者会見ではもう少し詳細な資料が配布され、調査班長であった東京医科歯科大学教授の仁科博史氏および東大の副学長で科学研究行動規範委員会委員長の光石衛氏より説明もあった。
結論からいうと、以下のようになる。
0. 告発書で指摘された項目には、オリジナルデータがあった。
1.指摘項目のほぼすべてが不備で、オリジナルデータが正しく図示されたものではなかった。
2.オリジナルデータが正しく図示されていない図版となった過程は、
・ソフトを行き来する間に変わった
・図をトレースしたときの不備
・掲載誌の編集部での作業に生じたもの
3.指摘された図版の不備の1つは、すでに著者が訂正を出しているので調査の対象にしなかった
論文の図版が真正でないことは確認されたので、調査はそれが捏造や改ざんにあたるかどうかが対象になった。告発者がどのようにして図版の不備を見つけたのかは、昨年10月に書いた拙文や「不正疑惑渦中の東大医学部論文および東大分生研論文の告発内容を画像編集フリーソフトで確認する方法」などをご覧になっていただきたい。
1.エラーバーは改ざんだったのか
告発内容には、グラフのエラーバーの不自然さを挙げたものが数多くあった。統計的にあり得ない数字だったり、長さが同一のエラーバーが多数あったり、エラーバーが棒グラフ本体に埋め込まれて本来よりも短くなっていることを疑わせたりなどだ。エラーバーを短くすることは、例えばある薬が「ものすごく効く人もいれば、まったく効かない人もいる」という結果を「ほとんどの人にそれなりに効く」という結果に変えることを意味する。もし、意図的にエラーバーの長さを変えたのであれば、これは改ざんと言えるだろう。エラーバーも含めて3本の棒グラフが(縦方向に伸縮しただけで)複数の図版で同一の例もあり、これは使い回し(実験の捏造)が疑われる。
調査班の報告書と仁科班長の説明によれば、指摘された図版はオリジナルデータを正しく反映したものになっておらず、そうなった理由は、ラボでの図版のつくり方にあるという。
それを説明したのが、配布資料の下のページだ。写真では読みにくいので文字起こしをしよう。
ーーー引用ここからーーーーー
1)オリジナルの数値データを表にまとめる。(物理学の表記法)
生物学および医学では、さらに下記の2)〜4)の手作業を加えることが通常に行われている。
2)オリジナルの数値データをMicrosoft Excelでグラフ化する。
3)2)をコピーして、Microsoft PowerPointやAdobe Illustrator等へペースト(貼り付け)する。
4)3)を基にしてX軸、Y軸、棒グラフ、エラーバーを手作業でトレースする(なぞる)。(生物学および医学の表記法)
以上の手作業はわかりやすさの追求が目的であり、
意図的な操作を加えていなければ(オリジナルデータと発表された図に差があっても)、捏造および改ざんとは言えない。
ーーー引用ここまでーーーーー
論文掲載図版が真正データと異なったのは、コピペする過程で作図者の意図しない改変が生じたり、なぞる過程でのズレによるものだという。東大の医学部で、その頭脳と時間が「なぞる」という単純作業に使われたのかと思うと愕然とするが、調査班の説明ではこうした作業は「生物学および医学の表記法」なのだという(ただし、なぞる作業を「通常」とするのを疑問視する声もある)。
長さがまったく同じエラーバーが複数のデータで使われている点については、エクセルから別のソフトへとコピペする際に生じたものとして、作図過程を再現した図を使って説明された。
どのエラーバーの不自然さに関しても、意図的なものではないので不正とはいえないとの判断だった。
2.ある株のデータ値がほかの2つの株の平均値
入力されたデータそのものが不自然なものもあった。酵母を使った実験で、9種類の株を見ているはずなのに、ある株のデータ値が「別の2つの株の平均値」となっていた。本当に9つの株で実験をしていたのかが疑問視されていた。
これは、データ値を入力したエクセルのシートから、別のシートに数値をコピペしたときに、誤って別の2つの株のデータ値の平均値が入力されたという。記者会見では「まちがってデータが重複したというのならば、まだわかる。しかし、足して2で割るのはわざわざしないとできないのではないか」と尋ねている記者がいたが、その通りだろう。
この論文では、9つの株のデータが載っているはずなのに、実際には7本しか線が描かれていないグラフもあった。これは、ほとんど増殖することがなかったため、作図者が「目視できないデータのグラフ化を省略した」(報告書の8ページ)という。これはさすがに「不適切な行為である」となっているが「しかし、論文のグラフとして9変異体のデータを用いるとしても、論文に掲載されるグラフに目視できる差は生じない。「存在しないデータその他の研究結果等を作成」(捏造)や「研究結果等を真正でないものに加工」(改ざん)には当たらない」(報告書の同ページ)と認定された。
3.「10日おきに死亡するマウス」はデータが四捨五入された
データそのものが不自然な例はまだあった。例えば「10日おきに死亡するマウス」だ。肥満や糖尿病にかかわる2種類のタンパク質の重要性を示すもので、普通のマウスと2種のタンパク質の一方または両方を欠いた遺伝子欠損マウスの寿命を調べる実験だ。普通のマウスが最も長生きし、一方を欠くマウス2種、両方とも欠くマウスの順で短命になっていく。この2種のタンパク質の重要性を示すデータだ。論文に載っている「生存曲線」を見ると、通常のエサでは普通のマウスは800日を過ぎても7割が生き残っているのに、両方を欠いたマウスの生存率は2割強で、明らかに短命になっている。
告発者はこの生存曲線から、マウスの死亡日を割り出した。すると観察期間中に死亡したマウス73匹のうち47匹(64.4%)は700日目、710日目などキリの良い数字の日に亡くなっている。本当に実験が行われているのかを疑われた(詳細は昨年10月の拙文を参照)。
これに関する調査班の説明は、数字を入力したエクセルの表からグラフにするときに一部が四捨五入されたというものだった。もとの数字でのグラフと四捨五入された数字でのグラフでは、見た目の違いはわずかだったので、気がつかなかったという。
会見の場で「誤って四捨五入をしても、1の位がゼロの数字が表の上でずらりと並んでいれば気がつくのではないか」と質問した。文科省のガイドラインには「不正行為は、故意又は研究者としてわきまえるべき基本的な注意義務を著しく怠ったことによる(略)データや調査結果等の捏造、改ざん及び盗用である」とあり、東大の報告書でもまさにこの部分を引用して「規則解釈の参考とした」とある。私の質問は「表を見て気がつかなかったのは、この注意義務を怠ったことにはならないと判断したのか」というものだ。だが、仁科班長のお返事によれば、「そういう表があれば、そう(注意義務を怠った)と判断したかも知れないが」、キリのよい数字が並ぶ表はなく、正しい数字が入力された表があり、ここからグラフにするときに一部が四捨五入されたというものだった。
4.データが1度かたむいて意味が変わる
ミスだとしても、気がついたのではないか?と思えるデータはまだある。糖尿病にかかわる論文に出てくる細胞を使った実験で、開始から2分後にブドウ糖濃度を高くして、細胞の反応(カルシウム濃度)をみている。この論文で重要な役割をもつアディポネクチンを加えた細胞は、ブドウ糖濃度を高めてもそれ以前と同じトレンドを保ったままデータ値はゆっくりと下がっていく。
このグラフは、昨年10月の拙文の後半で紹介したが、エラーバーの歪みから、縦横比を変えた上でデータ値が1度、傾いている(回転している)ことが疑われた。エラーバーの歪みから告発者が割り出した変形の操作を逆にすれば(縦に59%縮小して、1度回転させる)、元の姿に戻すことができるはずで、作図ソフトのイラストレーターを使って筆者が行ったのが下の図だ(水平の目安になるようにX軸Y軸のみ回転させていないものを下にずらして重ねておく)。
いかがだろうか。論文では時間とともに減少することを示すグラフだったが、時間がたってもあまり変化がないことを示すグラフとなる。グラフの印象が変わってしまうのだ。
これも、意図的にやったのであれば捏造になりそうだが、オリジナルデータはあり、意図的ではないという。
調査結果を公開してほしい
今回の記者会見は、端的に言っていろいろと腑に落ちないものがあった。「シロにする」という結論ありきであったという疑念を払拭することができないのだ。
医学部の調査結果は、「告発者の指摘どおりの不備があった」が「オリジナルデータはある」ことが、不正はなかったと判断する大きな根拠となっている。オリジナルデータある(=実験は行われた)ので捏造ではなく、ズレが小さいので意図的な改ざんではない、という理屈だ。
だが、記者会見では「提出された生データが本物であるかどうかは、どうやって確認したのか」という質問さえ出た。「最近になって改ざんされたことがないかなどは」と言葉を重ねて聞かれている。分生研に関してはタイムスタンプの確認や顕微鏡に残っていたデータなどの返答があったが、医学部に関してはこの返事は「実験ノートの古さなどから」というお返事だった。
分生研の調査は、一部ではあるもののオリジナルの図も載っており、論文掲載の図と比較できるようになっている。作図をしたのは誰で、改変したのが誰であるのかも記述がある(不正認定された教授と助教以外は「修士課程の学生」「博士課程の学生」という表現)。その上で、学生は免除し、助教と教授は不正行為があったと裁定された。調査班が規範委員会の判断を、科学コミュニティの方々が見ることができるのだ。
東大の規則によれば、
となっている。
文科省のガイドラインでも同様だが、以下のようなただし書きがついている。
今回のケースは、告発者が指摘した不備(論文の誤り)はあった。ならば「調査結果を公表する」を実行していただきたい。