News Release

「タンパク質構造を変化させる遺伝子多型を同定する手法を開発」 ― 選択的スプライシングの複雑性を読み解くことで疾患の病態解明に挑む ―

Peer-Reviewed Publication

Tokyo Medical and Dental University

image: Alternative splicing of CARD9, regulated by Crohn’s disease risk variant (sQTL variant), changes the protein structure. view more 

Credit: Department of Genomic Function and Diversity, TMDU

 東京医科歯科大学難治疾患研究所バイオデータ科学研究部門ゲノム機能多様性分野の高地雄太教授の研究グループは、東京医科歯科大学生体材料工学研究所、東京大学、理化学研究所との共同研究で、GWAS候補領域における原因メカニズムの解明のために、タンパク質構造を変化させる選択的スプライシングを効率的に同定する2つのスプライシングQTL解析手法を開発しました。その研究成果は、国際科学誌Nature Communicationsに、2022年8月24日にオンライン版で発表されました。

【研究の背景】

 遺伝子は、DNA配列からRNAが転写され、それを鋳型にタンパク質が翻訳されます。選択的スプライシングは、RNAの形成の段階で配列の取捨選択を行い、複数の成熟RNAを生み出しますが、タンパク質の多様性をもたらす最も重要なメカニズムです。この選択的スプライシングは、個人の遺伝子配列の違い(遺伝子多型)によって影響を受けることが知られており、そのような遺伝子多型をスプライシングQTLといいます。これらの一部は、免疫・アレルギー疾患、糖尿病などの様々な疾患の主要な病因メカニズムであることが知られています。しかし、選択的スプライシングはこれまでに想定されてきたよりも複雑なイベントであり、タンパク質構造を変えないものも含めると、ヒトゲノムにある約2万個の遺伝子から、数十万種以上に及ぶ成熟RNA(スプライシングアイソフォーム)を生み出すことがわかってきました。これらの中から生物学的に重要なスプライシングを同定し、疾患の病態解明に繋げるためには、何らかの戦略的な工夫が必要と考えられます。

【研究成果の概要】

 スプライシングQTLによって影響をうけるスプライシングアイソフォームの大部分は、非翻訳領域(UTR; untranslated region)のみの変化であり、タンパク質に翻訳されるコーディング配列(CDS; coding sequence)には影響を与えない、すなわちタンパク質構造を変えないことが知られています。そこで研究グループは、同一のCDSを持つスプライシングアイソフォームを統合することで、タンパク質構造に変化を与えるスプライシングQTLのみを効率的に検出する手法、i2-rQTL解析(integrated-isoform ratio QTL解析)を考案しました。この手法で、T細胞、B細胞などの5種類の免疫細胞で、スプライシングQTL解析を行ったところ、各細胞で300~600個のスプライシングQTLを同定することができました。

 これらのi2-rQTL多型はタンパク質の構造変化を起こすことから、そのタンパク質の機能に大きく影響を与えることが考えられます。その結果、タンパク質が機能するパスウェイの下流の遺伝子群の発現に影響を与えると推定されます。実際に、i2-rQTL多型は、タンパク質構造を変えないスプライシングQTL多型と比較して、他の遺伝子群の発現量により大きな影響を与えていることがわかりました。また、これらのi2-rQTL多型の一部は、関節リウマチ、全身性エリテマトーデス、クローン病などの免疫疾患の原因となっていることも明らかになりました。

 もう一つの戦略として、研究グループは、CDS incomplete isoform (CDSI)に注目したスプライシングQTL解析を提案しました。CDSIとは、既知のCDSと異なる配列が断片的ながらデータベースに登録されているスプライシングアイソフォームのことです。これまでのほとんどの研究では注目されずに解析から除外されていましたが、これらの中に生物学的に意味のあるアイソフォームが含まれる可能性を考えました。そこで、第4世代シークエンシング技術を利用した、ロングリードキャプチャーRNAシーケンシングという手法を用いて、疾患と関連すると考えられるCDSIの全長を網羅的に同定しました。全長が明らかになったスプライシングアイソフォームに対して、スプライシングQTL解析を行ったところ、29のスプライシングアイソフォームが、何らかの疾患の原因となっていることが明らかになりました。また、これらの全長が明らかになったもののアミノ酸配列からタンパク質高次構造を予測することで、その機能を推定可能であることも示しました。

【研究成果の意義】

 本研究では、複雑で解釈が難しかった無数のスプライシングイアイソフォームの中から、2つの新しいアプローチを用いて、疾患の原因となっているものに迫ることが可能であることを示しました。また今回の解析手法は、免疫疾患に限らず、全ての疾患に適応できるものです。これまで、GWASという研究手法で、延べ5万を超える遺伝子領域が疾患と関連することが明らかになってきましたが、その2~3割はスプライシングQTLが原因となっているという推計もあるため、本研究で開発した手法は様々な疾患の病態解明を加速させる可能性を秘めています。

 

【用語解説】

※1 スプライシングQTL解析・・・・・・・・一塩基多型(SNP)などの遺伝子多型が選択的スプライシングに影響を与えていることを評価する解析手法のこと。遺伝子多型のジェノタイプとスプライシングアイソフォームの発現量や発現比の相関を、統計学的に検定する。QTL(quantitative trait locus)は、遺伝学用語で、量的形質(身長、遺伝子発現量など)と関係する遺伝子座のこと。

 

※2スプライシングアイソフォーム・・・・・・・・遺伝子は、DNAを鋳型にRNAが転写されるが、このRNA配列はエクソン領域と、スプライシングによって切り出されるイントロン領域に分かれる。エクソン領域のみとなった成熟RNA(メッセンジャーRNA)を鋳型に、タンパク質が翻訳される。選択されるエクソン領域は、RNA分子ごとに異なるが、個々の成熟RNAをスプライシングアイソフォームと定義する。

 

※3ゲノムワイド関連解析(GWAS; genome-wide association study) ・・・・・・・・ゲノム上に存在する約100万個のSNPを遺伝マーカーとして用いて、疾患の原因となっている遺伝子領域を探索する手法。

 


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.