統計学の罠を知らない研究者の多さ
がん検診率を向上させることは、早期発見につながる。たとえば、胃がんは検診システムが普及している日本では早期がんの状態で見つかる患者が多い。したがって、中国の胃がんの5年生存率と比較すると、日本のそれは数十%も高くなっている。かといって、大腸がん検診を、レントゲンや内視鏡で実施するとなると、医療現場は対応できないのは明白だ。
便に血が混じっているのを調べる潜血検査は、擬陽性率(陽性と診断されたが、検査では腫瘍が見つからなかったケース)が90%を超える。新しいスクリーニング法の確立が急務だ。
新しいスクリーニング技術として、いろいろな方法が提案されているが、血液中のマイクロRNAやアミノ酸変化などを調べる方法には、私は極めて懐疑的だ。
定量的な方法(ある分子が増えたり、減ったりしているのを調べる方法)は限界がある。正常値に幅があることや数字が連続的であるため、どこかで線を引くと、擬陽性が少なくない。もちろん、偽陰性(がんがあるが、検査では陰性となる)もある。すでにがんがあるか、ないのかわかっている条件で、ある分子の量の多寡で分類すると必ず、ある一定の割合でがんと関連しそうなもの(マーカー候補)が見つかる。
統計解析をしてP値が0.05であると意味があると信じて疑わない人が多いが、0.05という数字を反対から見ると、100種類調べると5個くらい関連があると間違って判定される可能性があるということだ。そして、このような可能性のあるマーカーを複数組み合わせると、いかにもがんが確実に診断できそうに見えてくるのである。これをオーバーフィッティング(うまく出来すぎ)と呼ぶ。
私も苦い思いをした経験があるので、偉そうには言えないが、15年以上前から問題が指摘されている、このような統計学の罠を学習していない(勉強していない)研究者が、想像以上に多いのだ。
リキッドバイオプシーの重要性
この点、定性的な測定法(がん細胞だけにしかない性質=DNA変異)を利用する方が白黒が明白だ。もちろん、偽陰性は起こるが、擬陽性は少ない。そこで、リキッドバイオプシーが重要となってくる。
今の技術では正常細胞DNA:がん細胞由来DNAが1000:1の割合であればほぼ確実に見つけられるところまできている。人間には60兆個(60㎏)の細胞があるので、1000分の1だとがん細胞が600億個(60g)にまで増えないと見つけられないのかというとそうではない。
がん細胞は分裂が速いため、日々死んでいく細胞の数も多いので、これより2桁くらい少ない数でも、血液中に混入するがん由来DNAは検出可能と考えられる。現に、ステージ1の大腸がんでも40%で程度で血漿に存在するDNAを調べると遺伝子異常が検出されている。このリキッドバイオプシーの現状と課題については次回詳しく紹介したい。
血液などの体液サンプルを使って診断や治療効果予測を行う技術。患者の負担が小さく、しかも腫瘍の遺伝子(ゲノム)情報を踏まえた適切な治療につながる手法として近年、世界中で研究開発が進められている。
※『中村祐輔のシカゴ便り』(http://yusukenakamura.hatenablog.com/)2017/0323より抜粋して転載