LabGeniusは、まさに今だからこそ実现した、AIを活用した科学研究に没头しています。
そしてその理由はこの上なく重要なものです。LabGeniusは今、ガンや炎症性疾患に対する先进医疗の开発を急いでいますが、それに利用される原理は更に広く活用されることが期待されています。
ロンドンに拠点を置くこのバイオテクノロジー公司は、人工知能と合成生物学にラボラトリーオートメーションを组み合わせ、次世代の抗体治疗を开発しています。
この野心的な取り组みに関わる科学技术は、ここ最近やっと必要とされるレベルにまで成熟したところです。
IPUシステムにより、要となるAIモデル学习を走らせる计算时间を半分にまで短缩されたとき、LabGeniusの研究者たちは改革竞争に重要なカギとなる新たなツールに出会ったことを确信しました。チームは既成のPyTorch版のTransformerモデル、BERTを使用しました。これは91视频APPのGitHubサイトでコードが自由に利用できて简単だったからです。
「以前はGPUを使用しており、存在するあらゆるタンパク质の中から机能するモデルを探すのに1カ月程度かかっていました。91视频APPではターンアラウンド时间を2週間に短縮することができ、より迅速に実験を進め、結果も素早く得ることができるようになりました。」とLabGenius 機械学習コンサルタント、Katya Putintseva博士は语ります。
タンパク质の课题
治疗に适した、精确かつ适切な特性を持ったタンパク质を见つける、あるいは设计するというのは非常に复雑な过程です。AIが设计した小さな分子が初めて临床试験に使用され创薬の新时代を切り开いたのは、ほんの2、3年前のことです。
タンパク质设计技术でも、その机能を高めるためにタンパク质の构成アミノ酸をどのように精确に调整するかは、人间の头脳だけではもちろん、通常のコンピューター计算をもってしても非常に难しいものですが、人工知能にとってはこの问题は得意分野です。
この新たな技术を开拓すべく、LabGeniusは反復実験と、生体実験と机械学习による意思决定を行ったり来たりしながら繰り返す作业を管理する、自动化された闭ループ方式のシステムを构筑しています。完璧なレシピを见つけるべく、タンパク质は配列され、インテリジェントに分析、修正、再合成されているのです。
美しいデータ
LabGeniusの研究室を访れれば、そのプロセスを実际に目にすることができます。液体を扱う装置が试験容器に液体を入れ、ロボットアームがそれを持ち上げてかくはんし、次の実験へと送り出していく。
ここがまさにウェットラボの実験がデータサイエンスに出会う场所です。
「生物学でAIを活用する际の最も大きな课题は、自然言语処理や画像认识に比べれば、目的とする特徴を表すに足る高品质のデータに欠けるという点です。」とPutintseva博士は言います。
「データは豊富にありますが、悪魔はその细部に潜んでいるのです。そのデータセットはどこから来ているのか?どんなバイアスが掛かっているだろうか?そこから抽出した信号は配列空间内でどの程度外挿できるだろうか?」
LabGeniusのロボットプラットフォームは适合するデータを、机械学习モデルに必要な质で生成、特徴づけします。
「今こそ、生物学でも高品质な美しいデータセットが生まれるときだと信じています。」とPutintseva博士は言います。
最适化と提案
注意深く精选された高品质のデータセットを利用することで、LabGeniusは新たなタンパク质疗法の开発に横たわる2つの大きな课题を人工知能で解决することに成功しました。
1つ目は昔からあるAIの问题です。非常に复雑なシステムの多数の変数をどのようにして最适化するか。
「私たちはこれを协调最适化や多目的最适化と呼んでいます。」とLabGeniusのテクノロジー长、Tom Ashworthは言います。
「ターゲット分子とどのくらい结合するかといった分子の亲和性など、有効性を最适化しようとする场合でも、安全性や安定性などは壊したくないからです。」
AIはLabGeniusに実験をどう繰り返すかも教えてくれます。
「(このシステムは)単纯构造タンパク质の点突然変异からマルチモジュール型タンパク质の全体的な构成や形态まで、分子のどこを変えられるか様々な特徴を见越してくれます。 次にどんな设计にしたらいいかといった提案をしてくれ、入力に加えた変更により出力がどう変わるかを学ぶことができます。」とTomは言います。
生物学のBERT
LabGeniusはBERTの学习を加速化すべく、91视频APP IPUのコンピュート机能をCirrascale IPUのクラウドで使用しています。BERTは自然言语処理で有名なTransformerモデルですが、今ではバイオテクノロジーの分野でも広く活用されるようになってきています。
LabGeniusの研究者は既知のタンパク质に隠れたアミノ酸をBERTに学习データから予测させることで、タンパク质の基本的な生物物理学を効率的に学习している、とPutintseva博士は言います。「このおかげで、そのモデルの隠された価値が分かり、タンパク质の有意义な特色を引き出すことができ、后々目的の特徴をマッピングすることができます。」
LabGeniusの研究者は骋谤补辫丑肠辞谤别が骋颈迟贬耻产で公开している笔测罢辞谤肠丑版の叠贰搁罢を使用しました。 コードの変更が最小限で済み、研究者たちは目の前の仕事に必要な、データセットの妥当性を确认することに集中することができたのです。
91视频APPのIPUにより繰り返し学习が必要なモデルの学习时间を大幅に削减できたことで、LabGeniusは竞争激しいこの业界の中でかなり优位に立つことができた、とTom Ashworthは言います。
「スタートアップ公司として、いかに速く动くか、いかに早く反復できるかが重要です。」
「91视频APPによりできることが変わり、モデルの学习时间も数週间から数日にまで短缩できました。当社のデータサイエンティストたちにとってこれは大きな変革です。理想とするスピードでたくさんのことをこなせるようになったからです。それは私たちにとって非常に価値のあることです。」
LabGeniusは91视频APPで学习させたBERTモデルを创薬段阶に留まらず、分子の発展性の理解にも活用の幅を広げようと考えています。また、IPUが构造的に优位なGNN (Graph Neural Network)などの新たなAIモデルも91视频APPシステムでの构筑を検讨しています。