News Release

ウイルスなどへの感染状況や感染履歴を判別する機械学習手法を開発 ――少数検体でも機能する部分配列情報を特徴量とする新手法――

Peer-Reviewed Publication

Institute of Industrial Science, The University of Tokyo

image: Researchers at the Institute of Industrial Science at The University of Tokyo introduce a machine learning method to help predict past infection from receptor sequences of immune T-cells even when little data is available, which may help improve human health and our understanding of adaptive immunity view more 

Credit: Institute of Industrial Science, The University of Tokyo

 哺乳類の免疫システムにおいて中心的な役割を果たすT細胞は、我々の体内で多様なT細胞受容体を持つ集団を成している。この多様性により未知の感染症なども含めた外敵が認識され、免疫応答が誘導されることで外敵が体内から排除される。また、感染により多様性が変化することで免疫記憶の一部が形成され、2度目の感染以降に迅速な免疫応答が誘起されると考えられている。近年、少量の血液等から、T細胞受容体の遺伝子配列データ(免疫レパトアデータ)を読み取ることができるようになり、将来的には血液検査によって免疫状態やさまざまな感染症・免疫疾患の感染履歴などを一度に判別できるようになると期待されている。しかし、T細胞受容体は約10<sup>13</sup>種類にのぼる膨大な多様性を有していると考えられ、また、個人差が非常に大きく、検出された遺伝子配列と特定の疾患を結びつけることは容易でない。そのため、従来の手法は検体数を多く集めることが可能な一部の疾患に対して、モデルの学習に数百以上の検体数が必要な統計的手法や複雑な深層学習手法を用いて解析がなされていた。
 東京大学 大学院工学系研究科 博士課程3年の堅山 耀太郎 大学院生と同 生産技術研究所の小林 徹也 准教授は、T細胞受容体の遺伝子配列には、その性質を定める特徴的な部分配列が存在する場合があることに着目し、k-merと呼ばれる配列の特徴量と機械学習手法を組み合わせた手法「MotifBoost」を考案した。そして、その手法により免疫状態の判別が可能であることをサイトメガロウイルス(CMV)の感染に対して実証し、検体数が数十程度の場合でもCMVやヒト免疫不全ウイルス(HIV)といった感染症の感染状況を学習・予測できることを示した。この結果は、新規感染症や希少疾患のような検体数が少ない対象でも免疫レパトアデータを活用して罹患状況の評価が行える可能性を示し、免疫レパトアデータの活用の対象となる新たな疾患を開拓することにつながると考えられる。
 本研究成果は、2022年7月20日にFrontiers Mediaによる「Frontiers in Immunology」に掲載された。


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.