DeepMindは、分子生物学の大きな謎の一つを解決するために大きな飛躍を遂げ、新たな生物医学革命への扉を開きました。

タンパク質は生命の構成要素であり、私たちが理解していないことが原因でそうなっているのです。それらはシステムの残りの部分と完璧に適合しなければならない分子の歯車であり、だからこそ、それぞれのタンパク質はその機能に密接に関係する独自の三次元構造を持っているのです。その構造がなければ、その特徴的な形がなければ、タンパク質は何もありません。または何もないよりも悪い。これらの分子を形成するアミノ酸鎖のわずかな再配列でさえ、私たちの健康に壊滅的な影響を与える可能性があります。

しかし、これらの構造は大きな謎のままです。タンパク質の空間的な配置が何に依存しているのかを正しく理解することができず、タンパク質のアミノ酸の配列が全く何を教えてくれないのはそのためです(指示があることは50年以上も前から分かっていますが)。分子生物学で言えば、家の設計図を見て、その構造がどのようになるのか予測できないことに相当します。

代替品はありますが、どれも高価で高価で非常に複雑なものばかりです。実用レベルでは地獄です。そのため、1994年から2年に1度、世界中の数十の研究グループが集まり、開発中の予測アルゴリズムをテストするCASP(Critical Assessment of Techniques for Protein Structure Prediction)という大会が開催されています。さて、DeepMindのAlphaFold 2は、これまでのすべての記録を更新し、従来のX線結晶構造解析やMRI分光法に非常に近い精度でタンパク質の構造を予測することに成功しました。 これは何を意味し、何を意味しているのでしょうか?

DeepMindは何をしてきたのか?

2016年(Googleの人工知能研究所「DeepMind」が参加した元年)までは、アルゴリズムが実施している評価で100点満点中、せいぜい40点程度だった。その年のアルファフォールドは60に近かった。今ではわずか2年後には平均87点に達しています。つまり、すでに指で90点に触れているということで、構造を実験的に決定する通常の技術(タンパク質分子内の各原子の位置を他の原子との関係で見る)と同等と考えられる数字です。

CASPのダイナミクスはシンプルです。主催者は、参加者にタンパク質の配列を提供し、その後、X線結晶構造解析やMRI分光法などの伝統的な技術で決定された構造と比較して、その予測を評価する。今年のCASPの最終ラウンドでは、AlphaFold 2は、ほぼ3分の2のタンパク質の形状を、実験室での試験に匹敵する精度で決定しました。

また、主催者によると、残り3分の1の構造予測の精度も非常に高いとのことです(そこまでではありませんが)。DeepMind学習アルゴリズムによる大きな飛躍を見ていると、まだ序の口に過ぎないと思わざるを得ませんが、その結果は感動的です。結局のところ、AlphaFold 2は、実験室では何年もかかるかもしれないことを、数日のうちに行うことができました(そして、私たちがすでに持っているタンパク質の構造に関する情報だけを餌にしています)。

これは何を意味しているのでしょうか?

タンパク質の立体構造は、生物学者や深海の専門家にとっては、単なる転用ではない。その構造を知ることは、がん、神経症、希少疾病、感染症など数千もの病気を理解するための基礎となります。ドラッグデザインの革命的なツールにもなるだろう。COVID-19の試金石は、その表面にある単一のタンパク質、スパイクタンパク質に基づいており、ほとんどのワクチンや治療法はそれに焦点を当てていると考えてください。

さて、それは事実です。これは最初の一歩に過ぎません。印象的だが、たった一つ。私たちは、様々なタンパク質がどのように結合し、どのように他の分子(DNAやRNAなど)と相互作用するのか、そしてその知識を利用して生物医学的な可能性を最大限に引き出すにはどうすればよいのかを解明しなければなりません。AlphaFold2の結果は目を見張るものがあり、50年間閉ざされていた扉を開きました。その背後には、すべてがうまくいけば、新しい生物医学の革命が待っています。

comments powered by Disqus