ニュース

疾患発症に関わる日本人の遺伝的特徴の解明 -日本人21万人のゲノム解析により遺伝的変異を検索-

発表概要

理化学研究所(理研)生命医科学研究センター統計解析研究チーム(研究当時)の鎌谷洋一郎チームリーダー(東京大学大学院新領域創成科学研究科)、石垣和慶特別研究員、久保充明副センター長(研究当時)、東京大学の門脇孝名誉教授、山内敏正教授、東京医科歯科大学の稲澤譲治教授らの国際共同研究グループは、バイオバンク・ジャパン[1]のゲノムデータを用いて、東北メディカル・メガバンク計画[2]、JPHC研究[3]、J-MICC研究[4]と共同で日本人約21万人のゲノム解析を行い、27疾患に関わる320の遺伝的変異を同定し、そのうち重要な遺伝的バリアント[5]について、国立がん研究センターバイオバンク[6]、国立長寿医療研究センターバイオバンク[7]ならびにOACIS研究[8]の協力で再現性を確認しました。

本研究成果は、疾患の病態の理解、疾患発症リスクの民族差の理解、個々人の遺伝子情報に基づく個別化医療の発展に貢献すると期待できます。

今回、共同研究グループは、42疾患を対象とした東アジアにおける最大規模のゲノムワイド関連解析(GWAS)[9]を実施し、320の遺伝的変異を同定しました。そのうち25変異は、欧米での研究では検出されなかった新しい変異であり、虚血性心疾患に関連するATG16L2、肺がんに関連するPOT1、ケロイドに関連するPHLDA3などの遺伝子のタンパク質のアミノ酸配列を変える変異が含まれていました。また、このGWASの解析結果と転写因子[10]の結合部位を統合する解析を実施し、疾患発症に関与する転写因子と疾患の378の組み合わせを同定しました。

本研究は、科学雑誌『Nature Genetics』オンライン版(6月8日付:日本時間6月9日)に掲載されました。

 

図. 本研究で同定された疾患感受性遺伝子の一覧(新規領域は赤字で表示)

 

 

研究支援

本研究は、日本医療研究開発機構(AMED)のオーダーメイド医療の実現プログラム「疾患関連遺伝子等の探索を効率化するための遺伝子多型情報の高度化(研究開発代表者:久保充明)」「ゲノム網羅的解析情報を基盤とするオーダーメイドがん医療実現のための開発研究(研究開発代表者:稲澤譲治)」「メタボリック・シンドローム関連疾患の個別化医療実現(研究開発代表者:門脇孝)」による支援を受けて行われました。

 

発表内容

研究の背景

関節リウマチや2型糖尿病、非家族性がんなどの多因子疾患には、無数の遺伝的変異が関与しています。大半の変異の影響は非常に弱いため、それらの変異を効率的に同定するためには、多くの患者検体を対象とした大規模なゲノムワイド関連解析(GWAS)が必要です。

近年、欧米人を中心に大規模なGWASが多く実施され、疾患病因の解明が進んでいます。また、その解析結果は、疾患発症予測(注1-3)や治療層別化[11](注4)などの目的で、臨床現場での実用性が示されつつあります。一方、遺伝的変異の分布には民族差があるため、欧米での解析結果を日本人に応用できる範囲は限定的であることから(注5)、日本でのゲノム医療実装のためには日本人のGWASが必要不可欠であると考えられています。

バイオバンク・ジャパン(BBJ)は、2003年に開始した世界でも最も早くから構築されている大規模バイオバンクの一つで、日本全国12の医療機関とその協力病院から、第一期に約20万人、第二期に約6.7万人のDNAと臨床情報を収集し、第一期については血清サンプルも収集しています。今回、共同研究グループは、日本人における疾患発症に関わる遺伝的変異を同定するため、BBJ第一期のゲノムワイドSNP[12]データを用いて、国内の多数の研究グループと協力し、42の多因子疾患を対象としたGWASを実施しました。

 

注 1) Khera, A. V. et al. Genome-wide polygenic scores for common diseases identify individuals with risk equivalent

 to monogenic mutations. Nat. Genet. 50, 1219–1224 (2018).

注2) Natarajan, P. et al. Polygenic risk score identifies subgroup with higher burden of atherosclerosis and greater relative benefit from statin therapy in the primary prevention setting. Circulation 135, 2091–2101 (2017).

注3) Kullo, I. J. et al. Incorporating a Genetic Risk Score Into Coronary Heart Disease Risk EstimatesCLINICAL PERSPECTIVE. Circulation 133, 1181–1188 (2016).

注4) Marston, N. A. et al. Predicting Benefit From Evolocumab Therapy in Patients With Atherosclerotic Disease Using a Genetic Risk Score: Results From the FOURIER Trial. Circulation 141, 616–623 (2020).

注5) Martin, A. R. et al. Clinical use of current polygenic risk scores may exacerbate health disparities. Nat. Genet. 51, 584–591 (2019).

 

研究手法と成果

共同研究グループは、バイオバンク・ジャパンに含まれる42の各疾患サンプル(表1)をケース群とし、コントロール群にバイオバンク・ジャパンの非類縁疾患のサンプル、東北メディカル・メガバンク機構、いわて東北メディカル・メガバンク機構、日本多施設共同コーホート研究、JPHC研究から提供されたサンプルを含め、合計212,453人の日本人を対象にGWASを実施しました。本研究は、非欧米人における疾患を対象としたGWASでは最大規模のプロジェクトです。

 

表1 本研究でゲノムワイド関連解析(GWAS)の対象とした42の疾患

 

その結果、全体で27疾患の発症に関連する320の遺伝的変異(疾患感受性変異)を同定し、そのうち25変異は欧米人を対象としたGWASでは検出されなかった新しい疾患感受性変異でした。この25の新規変異のアレル頻度[13]は、欧米人よりも東アジア人で高いことが分かりました(図1)。GWASの検出力はアレル頻度に依存するため、これらの新規変異は欧米人を対象としたGWASでは検出されにくいことから、東アジア人におけるゲノム研究の有用性を確認できました。

 

図1 疾患感受性変異のアレル頻度

疾患感受性変異のアレル頻度を東アジア人と欧米人とで比較した。右の既知の変異では、グラフの右上にアレル頻度が集中しており、東アジア人と欧米人とでアレル頻度に差はあまり見られない。一方、左の新規の変異では、欧米人よりも東アジア人でアレル頻度が高い変異(グラフの右上から下に広がっている)が存在する。

 

次に、本研究で同定された疾患感受性変異の生物学的な機能に注目しました。25の新規変異のうち、7変異がタンパク質のアミノ酸配列に影響を与える可能性が示唆されました。この7変異のうち3つは欧米人には存在しない変異であり、欧米人を対象としたGWASでは検出することができない知見です。この3変異が影響する遺伝子は、虚血性心疾患に関連するATG16L2(図2)、肺がんに関連するPOT1、ケロイドに関連するPHLDA3であり、各疾患の病因の解明につながる発見だと考えられます。このうちATG16L2POT1に関しては、大阪急性冠症候群研究(OACIS)、国立長寿医療研究センター(NCGG)バイオバンク、国立がん研究センター(NCC)バイオバンクのサンプルを用いて再現性を確認しました。

 

図2 虚血性心疾患の発症に関与する東アジア人特異的変異

11番染色体上のATG16L2遺伝子のアミノ酸配列を変える遺伝的変異(rs11235604:東アジア人のみに存在)の周辺の虚血性心疾患のGWAS結果。r2:は、連鎖不平衡係数 (集団の中における遺伝子変異間の相関係数。この係数が高いほど遺伝子変異が同じシグナルを反映していることが示唆される)。

上段・中段は、本研究の虚血性心疾患のGWAS結果。コンディショナル解析によりrs11235604の影響を除く前後での結果を示す。rs11235604の影響を除くことで最もP値の低い変異のシグナル(ピンク色の丸)が消失していることから、rs11235604がこの領域のシグナルを説明し得ることが確認された。

下段は、欧米人の虚血性心疾患のGWAS結果。rs11235604は欧米人には存在しない変異なので、この領域には有意なシグナルが観測されていない。

 

また、本研究で同定された疾患感受性変異が遺伝子の発現量に与える影響も評価しました。一般に、遺伝子の発現量に影響を与える変異をeQTL[14]と呼びます。eQTLを解析したところ、脳動脈瘤の発症に関与する変異が、動脈組織においてATP2B1遺伝子の発現量を下げることが示唆されました(図3)。マウスを用いた研究では、血管平滑筋におけるATP2B1遺伝子の発現量の低下は高血圧を引き起こすことが示されています(注6)。よって、この変異は、動脈組織におけるATP2B1遺伝子の発現量を低下させ、血圧を上昇させることで脳動脈瘤の発症に関与すると考えられます。

 

図3 脳動脈瘤発症とATP2B1遺伝子の発現量の関連

上段:本研究の脳動脈瘤のGWAS結果。最も強いシグナル(菱形)はrs11105352で検出された。

下段:動脈組織におけるATP2B1遺伝子に対するeQTL解析結果。最も強いシグナル(四角)はrs2681492で検出された。

12番染色体に存在するrs11105352とrs2681492の両方と相関関係の強い遺伝的変異を紫色で示した。脳動脈瘤のGWASと動脈組織におけるATP2B1遺伝子に対するeQTLの両方のシグナルが共通の遺伝的変異に由来し得ることが示されている。

 

注6)Kobayashi, Y. et al. Mice Lacking Hypertension Candidate Gene ATP2B1 in Vascular Smooth Muscle Cells Show Significant Blood Pressure Elevation. Hypertension 59, 854–860 (2012).

 

最後に、疾患感受性変異の生物学的機能に関する知見をさらに広げるため、細胞の機能調整に重要な役割を担う転写因子に注目しました。2,868のクロマチン免疫沈降シーケンス[15]のデータを独自に解析し、GWASで検出された変異がどの転写因子の結合部位に集積しているかを評価した結果、378の有意な集積が確認されました(FDR[16]< 0.05)。この解析により、疾患発症に関与する転写因子の候補が多く示唆されました。具体的には、関節リウマチ、バセドウ病、アトピー性皮膚炎などの免疫関連疾患とRELA(免疫反応の調整に重要なNF-κB[17]の構成要素)、前立腺がんとAR(男性ホルモン受容体)、2型糖尿病とFOXA2(膵島からのインスリン分泌を制御する)などです(図4)。これらの知見により、疾患感受性変異の生物学的機能を転写因子活性の観点から確認することができました。

 

図4 疾患発症に関与する転写因子

a)2,868個の転写因子結合部位のデータをUMAPにより次元圧縮した結果。UMAPとはトポロジーデータ解析のアイデアに基づき、高次元データを二次元平面に投影する新しい手法である。それをさらにK-means法によりクラスタリングした結果を異なる色で示している。これによって、高次元であり人間には全体像を把握しづらい転写因子結合部位の関係性を可視化した。各クラスター内で最も多い転写因子の遺伝子名を図右に示した。

b)各疾患のGWASで検出された変異の転写因子の結合部位における集積。有意な集積を、aと同じ各クラスター特異的な色で示した(FDR < 0.05)。また、5個の最も有意な転写因子の遺伝子名も示した。

 

今後の期待

本研究結果は疾患発症に関わる生物学的機序の遺伝子、転写因子レベルでの解明に貢献すると考えられます。また、ゲノム研究の対象が欧米人に偏っているという、現在のゲノム研究の大きな問題点の改善にも貢献すると期待できます。

また、全てのGWASの解析結果を、バイオサイエンスデータベースセンター(NBDC、Research ID: hum0014.v17)と理研が独自に構築した日本人集団ゲノム関連解析情報データベース「Jenger」より公開しました。今回の解析結果をもとに多くの研究が展開され、さらなる研究成果につながることも期待できます。

 

論文情報

<タイトル>

Large scale genome-wide association study in a Japanese population identifies novel susceptibility loci across different diseases

<著者名>

Kazuyoshi Ishigaki, Masato Akiyama, Masahiro Kanai, Atsushi Takahashi, Eiryo Kawakami, Hiroki Sugishita, Saori Sakaue, Nana Matoba, Siew-Kee Low, Yukinori Okada, Chikashi Terao, Tiffany Amariuta, Steven Gazal, Yuta Kochi, Momoko Horikoshi, Ken Suzuki, Kaoru Ito, Satoshi Koyama, Kouichi Ozaki, Shumpei Niida, Yasushi Sakata, Yasuhiko Sakata, Takashi Kohno, Kouya Shiraishi, Yukihide Momozawa, Makoto Hirata, Koichi Matsuda, Masashi Ikeda, Nakao Iwata, Shiro Ikegawa, Ikuyo Kou, Toshihiro Tanaka, Hidewaki Nakagawa, Akari Suzuki, Tomomitsu Hirota, Mayumi Tamari, Kazuaki Chayama, Daiki Miki, Masaki Mori, Satoshi Nagayama, Yataro Daigo, Yoshio Miki, Toyomasa Katagiri, Osamu Ogawa, Wataru Obara, Hidemi Ito, Teruhiko Yoshida, Issei Imoto, Takashi Takahashi, Chizu Tanikawa, Takao Suzuki, Nobuaki Sinozaki, Shiro Minami, Hiroki Yamaguchi, Satoshi Asai, Yasuo Takahashi, Ken Yamaji, Kazuhisa Takahashi, Tomoaki Fujioka, Ryo Takata, Hideki Yanai, Akihide Masumoto, Yukihiro Koretsune, Hiromu Kutsumi, Masahiko Higashiyama, Shigeo Murayama, Naoko Minegishi, Kichiya Suzuki, Kozo Tanno, Atsushi Shimizu, Taiki Yamaji, Motoki Iwasaki, Norie Sawada, Hirokazu Uemura, Keitaro Tanaka, Mariko Naito, Makoto Sasaki, Kenji Wakai, Shoichiro Tsugane, Masayuki Yamamoto, Kazuhiko Yamamoto, Yoshinori Murakami, Yusuke Nakamura, Soumya Raychaudhuri, Johji Inazawa, Toshimasa Yamauchi, Takashi Kadowaki, Michiaki Kubo and Yoichiro Kamatani

<雑誌>

Nature Genetics

<DOI>

10.1038/s41588-020-0640-3

 

補足説明

[1] バイオバンク・ジャパン(BBJ)

アジア最大規模の疾患バイオバンクで、東京大学医科学研究所内に設置されている。オーダーメイド医療の実現プログラムの基盤であり、日本人20万人から収集したDNAや血清サンプルを臨床情報とともに厳重に保管し、研究者への試料やデータの提供を行っている。

詳細はhttps://biobankjp.org/を参照。

 

[2] 東北メディカル・メガバンク計画

東日本大震災の被災地を含む地域で長期健康調査を行い、被災地の健康状態の改善および遺伝要因・環境要因を考慮した次世代型医療・予防の確立を目標とした計画。日本医療研究開発機構(AMED)の支援を受け、東北大学東北メディカル・メガバンク機構と岩手医科大学いわて東北メディカル・メガバンク機構が連携して事業を実施している。

詳細は https://www.megabank.tohoku.ac.jp/http://iwate-megabank.org/を参照。

 

[3] JPHC研究(JPHC Study、多目的コホート研究)

「多目的コホートに基づくがん予防など健康の維持・増進に役立つエビデンスの構築に関する研究 (主任研究者 津金昌一郎 国立がん研究センター社会と健康研究センター長)」において、全国11保健所と国立がん研究センター、国立循環器病研究センター、大学、研究機関、医療機関などとの共同研究として行われている。

詳細は http://epi.ncc.go.jp/jphc/ 参照。

 

[4] J-MICC研究(日本多施設共同コーホート研究)

がんなどの生活習慣病に対し、生活習慣に加え、遺伝的体質も考慮した予防対策に必要な基礎データを築くことを目的として、13の大学・がんセンターが共同して実施している大規模追跡調査(中央事務局:名古屋大学)。研究は2005年(一部2004年)に開始され、千葉から沖縄におよぶ地域で約103,000名が参加、現在も追跡調査を継続している。

詳細はhttp://www.jmicc.com/を参照。

 

[5] 遺伝的バリアント

個人間でゲノムDNA配列が違う場所を指す。遺伝的バリアントのうち、代表的なものが一塩基多型(single nucleotide polymorphism;SNP)である。

参考:https://bsd.neuroinf.jp/wiki/遺伝子多型

 

[6] 国立がん研究センター(NCC)バイオバンク

国立がん研究センターでは、中央病院(東京都中央区)・東病院(千葉県柏市)を受診された患者を対象に、検査に使用した血液や組織、手術などで摘出された組織の診療後の残りと、それらに付随する診療情報、診療後の経過の情報の提供・研究への利用をお願いし、これらの試料と情報を整理して保管し、がんなどの医学研究に使用している。本研究においては、肺がん患者の血液検体をゲノム解析に使用した。

詳細はhttps://www.ncc.go.jp/jp/biobank/index.htmlを参照。

 

[7] 国立長寿医療研究センター(NCGG)バイオバンク

国立長寿医療研究センターのメディカルゲノムセンターの所掌事業として運営されているバイオバンク。NCGGバイオバンクは、高齢期に発症する認知症や骨関節疾患などを中心に、サンプルを収集・保管している。

詳細はhttps://www.ncgg.go.jp/mgc/biobank/index.htmlを参照。

 

 

 

[8] OACIS研究(大阪急性冠症候群研究)

阪神地区の25施設で収集された急性心筋梗塞患者を登録した、大阪大学を中心とするプロジェクト。Osaka Acute Coronary Insufficiency Studyの略。

 

[9] ゲノムワイド関連解析(GWAS)

疾患や身長・体重などの量的な形質に影響があるゲノム上のマーカー(遺伝的変異)を、網羅的に検索する手法。2002年に、理研が世界に先駆けて報告を行っており、以降、さまざまな疾患や量的形質に関連するゲノムマーカー同定に貢献している。GWASはGenome-Wide Association Studyの略。

 

[10] 転写因子

DNA上の特定の配列を認識して結合し、RNAの転写の開始に関わる因子。結合部位の遺伝的バリアントは転写因子の結合のしやすさに影響する。

 

[11] 治療層別化

ここでは個々の患者のゲノム情報に応じて治療方針を決定することを指す。オーダーメイド医療の一形態だといえる。

 

[12] SNP

遺伝的バリアントのうち、頻度の高い異なるアレルが二つ以上あるものを、多型polymorphismと呼ぶ。そのうち、一塩基の違いに基づく多型をSNP(一塩基多型)という。集団における個人間の遺伝情報の違いの大半はSNPである。SNP はSingle nucleotide polymorphismの略。

 

[13] アレル頻度

遺伝的バリアントにおける個々の染色体上のDNA配列をアレルといい、集団の中でのアレルの頻度をアレル頻度という。日本人を含む東アジア集団と、欧州系集団、アフリカ系集団との間で、アレル頻度には少しずつ違いが見られる。

 

[14] eQTL

遺伝子の発現量の個人差に関与するゲノム領域。eQTLはexpression Quantitative Trait Locusの略。

 

[15] クロマチン免疫沈降シーケンス

転写因子などのタンパク質がゲノム全体のどの部位に結合するかを同定する手法。特異抗体を用いてDNA結合タンパク質を免疫沈殿させた後に、そのDNA配列をシーケンスする。

 

[16] FDR

統計学的検定を多数実施する場合、P値=0.05の有意水準では多くの偽陽性が生じる。この検定数の影響を考慮して補正された有意性を示す指標。FDRはFalse discovery rateの略。

 

[17] NF-κB

サイトカインなどのさまざまな刺激により活性化され、免疫反応において中心的役割を果たす転写因子の一つ。NF-κB活性化は炎症性疾患、悪性腫瘍などで確認されている。

 

プレスリリース 全文はこちら