横断的診療⑪　ビッグデータから俯瞰する内分泌疾患

日常臨床にひそむ内分泌疾患と最近の話題（Ⅺ）

京都大学大学院医学研究科／白眉センター

井上　浩輔先生

（聞き手槙田　紀子先生）

　槙田　今回のテーマについてですが、私たちにとってAIという言葉は、先に言葉が入ってしまっていて、わかったような気になっています。実際、機械学習や井上先生が専門の因果推論というのは、どのようなことをなさっているのかについてうかがいます。
　井上　近年、機械学習という言葉はどの分野においても非常に流行ってきていて、これは内分泌も含めた医療分野で非常に大きなテーマになっていると思います。今まで実は自分たちがやってきたことも人によっては機械学習の一種であって、回帰例だとLogistic regressionや比較的基本的なモデルも機械学習ではありました。近年になってそこがもう少し複雑なものも扱えるようになってきました。そのモデル自体は前からあったのですが、なぜ今流行っているかというと、やはりデータがたくさん取れるようになってきて、いろいろな人のいろいろな情報が取れるようになってきたからです。そしてそれらは複雑に医療と絡み合っているわけです。例えば運動する人はほかの生活習慣もよかったりとか、こういったものをそれぞれ独立して捉えずに、複合的なかかわりをしっかりと一つのモデルで含めて考える。結果的にあるものを予測するといったところで、機械学習というのが既存の基本的なregressionと呼ばれるような回帰モデルよりも優れているケースがあるために、最近使われるようになってきました。なので、難しいところもあるのですが、機械学習で一番得意とされるものは、やはり予測モデルの構築です。何かを予測するときに機械学習を使うと、より精度の高い予測ができることが一つの特徴として挙げられると思います。これと異なる視点として、私の専門である因果推論というのは、原因と結果を考える学問で機械学習とは全く分けて考えたほうがよいです。例えば病気が起きたときにその病気の原因は何だったのか。この人はタバコを吸っていたからタバコが原因です、というのは短絡的な発想で、もしこの人がタバコを吸っていなかったら病気になっていたのかどうかを、しっかりとモデルを組んで考えていかなければいけない。このモデルをしっかりと構築して、原因と結果の関係をひもとく学問、これが因果推論というもので、私は今、それを内分泌の領域など医療の分野に応用しているということです。
　槙田　ありがとうございます。このシリーズ「日常臨床にひそむ内分泌疾患と最近の話題」の中に井上先生の回をぜひと思ったのは、内分泌の患者さんは希少疾患も多く、一人ひとりの医師の経験、そして患者さんの身体所見をきちんと見せていただいてデータをじっくり見て、診断と治療につなげていくことが私たちにとっての醍醐味で、それが私たちが自慢すべきところだからです。
　井上先生がなさっている仕事は全く相反するところにあるように感じる一方で、絶対そんなことはない、内分泌においてもきっとこういった仕事が何かできるだろうと思っています。井上先生が考える内分泌の領域において、機械学習、因果推論が果たすべき役割について教えていただければと思います。
　井上　本当に先生のおっしゃるとおりで、希少な疾患になってくればくるほど、データサイエンスとして扱いづらくはなってきます。それは特に今までのデータだと単施設であったり、数例、10例、20例の症例からでは解析をしようにもできないということでなかなか難しかったのです。それが例えば、保健所データベースであったり、国全体のデータベースが得られることで、たとえ希少疾患であっても、ある程度のサンプルサイズを確保できるようになってきた。そうすると、今まで見えてこなかったその希少疾患の人たちの特徴のみならず、この集団はどういう人たちをターゲットにして治療を行うのが一番効果が上がるのか、どうしたら合併症を防ぐことができるのか、そういった治験を新しく行うことができます。
　そういった意味でもちろん先生がおっしゃったような目の前の患者さんを診て、そこをしっかりと検討していく治療と並走して、データサイエンスの知見を利用できると考えていますし、先ほどの機械学習がそこで役に立ってくるのです。やはり希少疾患でなかなか今までは原因がわかっていなかったようなものに対し、機械学習モデルを用いて様々な変数、様々な因子を入れ込むことで、どういった因子がこの疾患に問題であったのか、どういう因子が予測能をもっているのかが、新しくわかることになります。これは実は糖尿病や高血圧といったcommonの疾患よりも、機械学習が映えるようなセッティングであるともいえます。
　槙田　なるほど。こういったビッグデータを用いた機械学習や因果推論、データサイエンスでその夢は広がると思うのですが、一方ですべてがよいわけではないと思うのです。限界もあると思うのですが、そのあたり、先生ご自身がぶつかっておられる限界も含めて教えていただけますか。
　井上　今のご指摘は非常に重要で、機械学習や因果推論という言葉が流行ってきたことによって非常に応用しやすくなってきました。そうなると簡単に実装はできるのだけれども、その背景にどういう過程があって、どういう前提を置いていっているのかを理解せずとも、応用できる時代になってきてしまいました。
　槙田　逆にいうと素人でもできてしまうということですか。
　井上　言い方次第ではそうです。それっぽい結果は出てしまう。それをそのまま出してしまうとレビュアーの質もバラバラですし、たとえそこでしっかりとしたレビュアーにあたっても、論文で見えるものは限られていますから、結果的に真実かわからないものがどんどん出てきてしまうことが実際かなり起きています。なので、いかに精度高く、また透明性高く、再現性を持ったデータを提供できるか、結果の開示ができるかは、これからもっともっと重要になってきます。
　そういった意味でも、一つの研究結果が何か社会や臨床にインパクトを与えるというよりは、そこから得られた知見がほかの研究やほかのアプローチでもしっかりと確かめられて、それによって初めてエビデンスとして構築されていくという流れは、これからより重視されるべきなのではないかと思っています。
　槙田　一つの問いの投げかけをして、私たちはこういう結果を出したけれど、それが本当かどうかは皆さんまた検証してください、という感じでしょうか。
　井上　おっしゃるとおりですね。一つは、一般化という視点ですが、これはポピュレーションによって違います。つまり、例えば、日本のポピュレーションで何か結果を出したときに、これがヨーロッパでそのまま通用するわけではない。ただヨーロッパでも同じような結果が出てきたとなると、ある程度人種を超えていえる一つのことなのではないか。例えば、A1cが高いと死亡率が上がるとか、そういう単純な話だと間違いなくそういったことはいえます。
　2つ目の視点としてはアプローチですね。こういう特定のアプローチを使ったら、こんな結果が得られた。でも別のアプローチを使ったらどうだろうか。これを我々は、ロバストネスチェックというのですが、そのアプローチによらず頑健な結果が得られると、よりエビデンスレベルは高くなります。近年、natureにも出ていましたが、トライアンギュレーションといって、様々なアプローチからトライアンギュレートして、この結果はどの角度から見ても確からしいということがわかってくると、今までのエビデンスからさらに一歩踏み込んで提供できる。その論文で書かれていた画は、一つの山頂に対して様々な角度から山登りができるみたいなイメージです。
　槙田　素敵ですね。最後に井上先生が考える将来の目標について教えてください。
　井上　まずは疫学者として臨床医と疫学者、そして基礎研究者のコミュニケーションを円滑にする懸け橋になりたいと思っています。そういった中で、実際にどういうことを目標に掲げて進めていくかなのですが、ここには私は真の個別化医療の実現というのをキーワードに置いています。
　今までの話とちょっと相反するように聞こえるかもしれないですが、データサイエンスとは一般的にポピュレーションの話をします。集団でどういう結果が得られるか、どのような効果があるのかを評価するのですが、個別化医療となってくると先ほど先生がおっしゃったような目の前の患者さんに対して何ができるのか。この人に対しては、どういうテーラーメイドされたアプローチが可能なのか、ということになってきます。ではこの2つをどうやって合わせることができるか。
　そこで私が最近注目しているのが異質性ということなのです。つまり個々によって治療の反応であったり、何か曝露されたときの体のリアクションが異なるというのはすべての臨床医が感じていることだと思うのです。人それぞれ同じ薬を入れても当然反応は変わってくる。ただガイドライン上はこれを使いましょうとか、こういう基準を満たした人にはこれを使いましょうということになっているので、果たしてそれが正しいアプローチなのか、というところに少し疑問を投げかけたいと思っています。
　機械学習や因果推論の手法を用いることで、その辺が近年クリアになってきて、例えば個人レベルの効果や因果効果を求めることで、この人には治療Aは適していないけれども、別の人には適している。逆に適していない人に対しては、どんな治療が最も効果的なのか、またはよりデメリットがあるのかを提供できるようになってきています。この辺は、データサイエンスの力を用いて個人にとって何が適切な治療なのか、というところまで落とし込むのが将来的な目標です。
　槙田　そうすると、その落とし込みのためには必ず情報が必要で、その個人の情報、例えば究極的には遺伝学的な情報も含める必要がきっと出てくると思うのですが、それはそれでハードルが高いですね。
　井上　おっしゃるとおりですね。すごく重要な点で、どこまで粒度を粗くするかというのもトレードオフだと思います。つまり、年齢や性別など非常にシンプルな変数だけだと精度は落ちる。ただ、一般化の可能性というのは非常に増えて誰でも使えるようになると思います。一方で、先生もおっしゃるように遺伝子を使ったり、もしくは少々扱いにくい個人の収入などの社会情報を入れると精度は上がるけれど、今度はなかなか一般化できない、ということになる。
　必ずしも一つの答え、一つのモデルを提供するわけではなく、少し精度が低いけれどみんなが使えるモデルと、もしこんな情報もあったらもっと精度を高くできる、というものを提供することで、幅を持った治療の方針決定ができるかと思っています。
　槙田　なるほど、夢が広がります。そのような時代が来ることを楽しみに待っています。
　井上　ありがとうございます。今の点にも関連して初めの質問にもかかわるのですが、機械学習というものがどんどん流行ってきて、いろいろな研究がされて論文もたくさん出ているという中で、やはり一番のハードルは、どこまでこの結果を現場に応用するか、というところになってきます。ですので、予測モデルが構築できたという論文が出たときに、それが明日の臨床に役立つか。もしくは先ほど申し上げたような個別化医療を助けてくれるような機械学習モデルを作りましたといったときに、それが明日の臨床に役立つか。こういった視点はすごく重要で、明日にはそのまま役立たないかもしれないけれど、5年後、10年後にどういうかたちでこの結果を現場に応用すると、患者およびそれを見ている医師にとって望ましい結果になるのか。
　ここはもう少し我々も議論していかなければならないですし、研究する側、評価する側も慎重にそこを見ていかないといけないと思っています。
　槙田　それは基礎研究との共通点ですね。ありがとうございました。