AlphaFold3(AF3と略称)は、DeepMindチームがタンパク質構造予測分野で発表した最新の成果です。単一のタンパク質配列の構造だけでなく、タンパク質複合体、核酸、または小分子の構造も予測できます。まるで、AF3にタンパク質の「レシピ」を与えると、そのタンパク質の3次元構造を「焼き上げる」ようなものです。

image.png

AF3のアーキテクチャは複雑で巧妙ですが、ご心配なく。一枚の図で概要を理解できます。モデル全体は3つの主要部分に分かれています。

入力準備:タンパク質配列を数値テンソルに変換し、類似の構造を持つ分子を検索します。

表現学習:様々なアテンション機構を利用してこれらの表現を更新します。

構造予測:条件付き拡散モデルを用いてタンパク質構造を予測します。

各ステップは、精緻な絵画を描くようなものです。AF3は層を重ねることで、最終的にタンパク質の3次元構造を表現します。

AF3の世界では、各分子は独自の「言語」を持っています。タンパク質、DNA、RNA、小分子など、AF3はそれらを一連の数値テンソルに変換できます。これは、各分子に独自の「身分証明書」を与えるようなもので、AF3はそれらを識別し処理できます。

image.png

AF3の表現学習部分は、まるで精心込めて振り付けられたダンスのようです。アテンション機構を通して、AF3はモデルの「視線」を分子の様々な部分に移動させ、それらの間の関係を捉えることができます。これには、分子内部の相互作用だけでなく、分子間の相互作用も含まれます。

AF3の構造予測部分では、条件付き拡散モデルが重要な役割を果たします。一連のランダムノイズから始めて、段階的に「ノイズ除去」を行い、最終的にタンパク質の真の構造を復元します。このプロセスは、霧の中から隠された真実を徐々に明らかにするようなものです。

AF3のトレーニングには、様々な損失関数と信頼度スコアが用いられています。これらが共同で作用することで、AF3はより正確に構造を予測し、予測の信頼性を評価できます。これは、AF3に鏡を付けるようなもので、自己反省と改善を可能にします。

参考文献:https://elanapearl.github.io/blog/2024/the-illustrated-alphafold/