「患者の経験談」を使った嘘について

日本社会には、健康に関わる食品の情報や、癌などの病気治療に関するひどい情報があふれています。そこで良く見られるのが、「患者の経験談」などの少数例の治療成績による効果の紹介です。これらは一見すると信頼できそうですが、ほとんどの場合において、効果を正確には表しておらず、ひどい場合には騙す目的で使われています。

なぜ、少数例の結果では判断できないのでしょうか?その理由は、医療の治療成績のデータが、他のデータとは違う特徴を持つためです。今回は、がんの治療成績の具体的なデータを紹介して、何が特殊で、個別の治療成績がなぜ効果を表さないかについて解説します。癌の治療成績を中心に解説しますが、今回の内容を理解してもらうと、医療情報を理解する上での基礎的な情報リテラシーの一つを身につけられるのではと思います。

ネットにあふれる1例の結果

ネットのがん治療に関した書き込みで、「この治療を受けた方で、余命半年と言われたのに、2年も生きた方がいます」「この治療は全ての方に効果があるのではないですが、5~10%ほどの方に効果を示すことがあります」「うちのおじいちゃんは抗がん剤治療を受けて、たった2ヶ月で亡くなった。あれは効かない」。このような書き込みを見ることが多々ありませんか?これらは、個別症例や、少数の治療成績を強調するという手法で、この類の書き込みや宣伝というのは多数見られます。個人が悪気なく使っている場合もありますが、多くは悪意ある業者が使っている場合が多いです。

このような少数のデータから治療が良い悪いと結論付けられるでしょうか?もちろん、これは大きな間違いです。このような1例のデータや、少数のデータは全体の効果を反映していないからです。でも、一般の方の多くが、それは完璧ではないものの、完全に間違いでもないと思い、その食品が効果があるのではとか、逆に標準治療は効かないのではと懐疑的になってしまったりします。そもそも標準治療は確実な効果を証明されたものですが、なぜ個別症例で効果が見られないということもあるのでしょうか?その大きな原因の一つは、がん治療成績のデータ分布がどのようなものなのか正確に理解していないことが挙げられます。

がん治療成績には、ばらつき(分散)がある

がんの治療成績とはどのようなものなのか、ここに一つの例を示して解説します。ここに載せたグラフは、非小細胞肺癌の患者に対して免疫チェックポイント阻害剤であるオプシーボ(Nivolumab)が大変に効くというのが証明された時のデータです。オプシーボというお薬は非小細胞肺癌に対して、日本でも保険承認になっていますが、その大きな根拠となったデータです。この臨床試験では、それまでの標準治療であった抗がん剤のドセタキセル(Docetaxel)と効果を比べています。

このグラフはオプシーボ群(青線)とドセタキセル群(緑線)の治療成績を比較しています。このグラフの見方ですが、縦軸が生存されている患者さんの割合を示しています。それに対して横軸は月数です。最初の0ヶ月の時点では100%の患者さんが生存されています。月が経つにつれて徐々に線が下に落ちているのは、この時点で亡くなられた人がいることを意味しています。

オプシーボ群は12ヶ月の時点で42%の人が生存しているのに対して、ドセタキセル群は24%のみです。2年近く経過した時点でも、オプシーボ群は30%近く生存していますが、ドセタキセル群は10%のみです。このことより高い有効性が証明されたということになります。

同じ治療でも成績は大きくばらける

ここから本題です。上のグラフを良く見てみると、治療効果があったオプシーボ群でも、40%近くの方は最初の6ヶ月で亡くなられています。最初から最後までのどの期間でも亡くなられた人がいて、どこからの中心部に集中しているわけではありません。ドセタキセル群の方が早くに多くの人が亡くなられていますが、効果の低いこちらの治療でも、逆に10%の人は2年経っても生存されています。

以前の余命宣告の解説ブログでも書きましたが、がん患者を同じ方法で治療した場合でも、その生存期間には大きなばらつきがでます。人というのは体格や年齢、持病など、様々な要素が違います。また、薬への反応も個体差があります。そのため、効かない治療であっても偶然に長く生きる方もいるし、有効な治療であっても残念ながら早くに亡くなってしまう方もいます。

特殊な例は必ず現れる

冒頭で紹介した宣伝文句にあるような、1例だけすごく長い生存年数を得ることは偶然に起こることで、どんな治療でも起こります。また、どんなに効く治療でも患者の状態や、腫瘍の様々な要素によってはあまり効果を示さない人も残念ながらいます。この上の例ではドセタキセルの方が明らかに効かないわけですが、

「ドセタキセルを使って、2年経過時点で元気に生きている人がたくさんいます」

「ドセタキセルは全員には効きませんが、10%の人には良く聞いて長期生存できます」

「オプシーボをして3ヶ月で亡くなったので、あの治療は効かない」

と言ったら嘘を言っているわけではないですが、これは効かない治療が劇的に効くように騙していることになります。

複雑なデータ分布をするがん治療においては、自分の都合に会う一例を紹介したり、少数例の成績を取り上げると、簡単に誤解させることになります。これが事実を歪曲して伝える際に多用されています。

一般の人が思うデータ分布とのギャップ

多くの人がこのような嘘に騙される原因は、一般の人が頭の中で描いているデータ分布曲線が間違っているからです。世の中にあるデータというのは、様々なデータ分布をしていて、今回のように広く複雑な分布をしているものもあれば、もっと単純なものもあります。多くの人は、分布が極端に偏っている単純なものを想像しています。例えば下のようなものです。

この図のようにほとんどの人が同じタイミングで亡くなるような、極端に狭いデータ分布をする場合には、さっきの理解で良いのです。1例や10%のデータでも、どちらが良いのか大体の検討は間違いなくできることになります。

例えば、乾電池の長持ち度合いを比べる実験なら、乾電池間でのばらつきがほとんどないので、得られるデータが一定で、比較対象が3ヶ月持つのに対して、新しい電池が4ヶ月持つのであれば、これは数例の実験でも性能が大きく違うことを、正確に理解することができます家電などの購入では、経験談などの評価でもかなり正確な事実がわかったりします。それは工業製品はかなり均一だからです。人は工業製品ではなく、それぞれが違いのある複雑な個体です。しかし、その家電製品の理解をそのまま医療データの理解に持ち込むと、大きな間違いをおかしてしまうことになります。

なぜ10人程度の患者データでは不十分なのか

一般の方から良く聞かれる質問として、「10人程度の患者に試して良い結果が出たという論文があるのであれば、多少の効果はあると考えて良いので、数百人規模のデータがなくても信用して良いのでは?」と聞かれることがあります。なぜ、10数人程度ではダメなのでしょうか?一つ例を示して解説します。少数の患者を対象にした臨床研究の問題点は、対象サンプルがうまく抽出されていないことにあります。

少数患者の臨床臨床研究では、良い結果を出したいという研究者の意図が患者選択に入ってしまいます。持病など持たずに、体の状態が良く、治療もうまくいきやすい患者が抽出される傾向があります。たった10例程度なので、たくさんいる患者のなかで良い結果がでそうな例を抽出することはできます。そのため、本来は全体の治療成績をうまく表す平均化された10例を抽出したい(下記の上段図)のですが、多くの場合は良い治療成績がでる10例を抽出する(下記の下段図)ことが多くあります。

上の図を見てもらうとわかりますが、ちゃんと平均化された例なら全体と同じ平均予後になりますが、下段図のような抽出をすると平均予後はオプシーボより良くなってしまい、とても効果のある治療と誤認することになります。このような患者選択エラーを統計用語では選択バイアスと呼びます。これが多少なりとも入るため、少数例に対しての研究というのは一般的に参考程度のデータとしてしか見られません。では、証明にはどのような研究が必要になるのでしょうか?

十分な効果があるという結論を得るには?

人への治療成績は複雑な分布をします。そのため、新治療が古い治療と比べて、十分に効果があると結論つけるには、数百人規模の患者データが必要になります。また、患者選択には研究者の恣意が入らないようにすることが求められます。患者自身も医師自身もどちらの治療を行っているかわからないようにして実施する二重盲検試験などが求められます。これらによって偶然に起こりうるものの影響を凌駕する大きな違いが必要です。そして、上のグラフで得られたような2つ線が大きく右にシフトして、どの時期でも多くの生存率を得ている良い成績になっていることが必要になります。実際の証明には、見た目ではなくて、様々な統計的な計算をする必要があるのですが、今回は話が難しくなるので、そこは割愛します。

個別症例の強調は誤解を生む

最近、厚生省がネットでの医療広告で、患者の体験談を出すことを禁止しました。これはまさに今回の話と関連があることです。売り込む側の都合良い1例を取り出して強調することは、受け取り側の大きな誤解を生むためです。患者が治療した際に体験したことをシェアすることは、本来はとても良いことなのですが、悪用する人が多いために残念ながら、医療広告として使うのは禁止の対象となってしまいました。

誤解して欲しくないのは、患者の治療体験談や、患者会の存在はとても貴重です。経験をシェアして、今後の治療を乗り切ることはとても大事なことです。ただ、個別の体験から治療効果を判断するのはできないということだけです。

ネットの医療広告は規制されますが、個人的なSNSを介してなど、この広告手法はでてくる可能性があります。ぜひ、知識武装して根拠のない情報に騙されないようにしてもらえればと思います。また、このような複雑なデータ分布するのは、がんに限らず、人を対象とするあらゆる医療データで見られます。ダイエット、糖尿病、子供の成長、タバコ、ワクチンなんでもそうです。個別症例の強調に気をつけましょう。

治療効果は白黒明確なものではない

この機会にもう一つ知って欲しいのは、「治療効果というのは白黒明確ではなく、確率論的に効果が確認されたもの」であるということです。今回のオプシーボの例では、歴史的な魔法の新薬と言われたオプシーボでさえも、数例の成績で効果を判断できるような私が作った極端な分布のようなことにはなりません。全体でみると明確な違いだけど、少数では判断つきにくいものです。多くの医療というのは、このような確率論的な違いを持つものです。一般の人は、明確な白黒判定を好みますが、そのようなものではないということを知ることも騙されないためには重要なことです。

最後にお伝えしたいこと

今回は医療データの複雑なデータ分布について紹介し、なぜ「患者の経験談」のような少数例の治療成績は効果を正確に表さないかについて解説しました。また、10例程度の少数例での検討では不十分である理由を解説しました。ネットには、この類の話があふれかえっています。ぜひ、知識武装して騙されないように注意をしてください。「それは偶然ではないか」という目で見るだけで、騙されるのを防げるものはいっぱいあります。何百人の大規模な正確な検証がなされているかを慎重に見定めてください。日本人の情報リテラシーがあがり、社会全体が成熟して、本当に人のためになる情報のみがネットに増えることを祈っています。

<更新情報>

2018/8/26「なぜ10人程度の患者データでは不十分なのか」を追記。