留学中のメンターである Jonathan Pritchard らは,このようなパラドックスを世界に先駆けて報告し,その解釈には遺伝子発現制御ネットワークを介した多くの遺伝子間の相互作用が重要であるという Omnigenic モデルを提唱した 2).この理論モデルは遺伝的研究結果の解釈を容易にするが,これまで実データでの証明がなされていなかった.Omnigenic モデルを実データに応用するには,二つの大きな課題があった.一つ目は,これまで大規模な遺伝子制御ネットワークの構築を可能にするデータセットが不足していたことである.もう一つは,大規模ゲノム解析では遺伝子多型のレベルでの関連が定量化されるが,遺伝子(gene)レベルに結びつけることが容易でない点が挙げられる.今回,一つ目の課題については,Perturb-seq を用いることを計画した.Perturb-seq は,CRISPR技術による遺伝子編集を単細胞 RNA-seq 解析と組み合わせることで,すべての遺伝子が遺伝子発現ネットワークに与える影響を定量化する手法である.二つ目の課題については,Whole Exome Sequencing から得られる Loss of Function (LOF) 多型 burden test を用いることにした.これにより,通常の GWAS では得られない遺伝子レベルでの形質との関連を定量化することができる.自己免疫疾患においては T 細胞に遺伝的リスクが集積することが知られているため,T 細胞における Perturb-seq 実験を計画した.しかし,データの集積には時間がかかること,T 細胞は非均一性が高いことから,まずはセルラインを用いた Perturb-seq の公開データを利用して解析モデルを構築することにした.本報告では解析モデル構築について報告する.実験方法これまで白血病由来の K562 株において,全遺伝子を対象とした大規模な Perturb-seq データが公開されている 3).本データを用いて,各遺伝子 - 遺伝子間の制御ネットワークを推定した.さらに,non-negative matrix factorization 法を適用する事で単一細胞遺伝子発現マトリックスから遺伝子発現プログラムを同定し,プログラムレベルの制御についても定量化した.一方,遺伝子関連解析については,UK biobank whole exome sequence データから,LOF 多型の情報を用いて遺伝子レベルの形質との関連を定量化した.LOF 多型は稀であるが,同一遺伝子における異なる LOF 多型が形質に与える効果量は同等と仮定できる.そのため,全ての LOF 多型を統合して遺伝子レベルで形質との関連解析を行う burden test を行った.burden test を用いる事で同一遺伝子上の LOF 多型の影響を統合して解析する事ができる.一方,LOF burden test は遺伝子サイズの影響を強く受けノイズも多いことがわかっている.今回我々は遺伝子発現などの事前情報を加味し,ベイズ推定法を用いる事で LOF burden test の推定効果量を改善する事に成功し,その情報を用いる事とした.これらの異なる層の情報を,遺伝子を軸にして統合解析する事で形質の遺伝的差異に関わる遺伝子制御ネットワークを同定する事を試みた(図1).K562 株は特に赤血球の形態や量に関わる形質と強く関連する事を heritability enrichment 解析で確認した事から,これらの形質をモデルとして解析を進めた.結果及び考察今回特に K562 細胞株に遺伝的リスクの集積が強かった MCH(mean corpuscular hemoglobin, 赤血― 278 ―
元のページ ../index.html#280