ヒトから海洋・土壌までウイルスの多様性を包括的に解析するデータベースVIREを構築 ――ウイルス進化と生態系機能の理解を支援するための地球規模データ基盤――
- ヘッドライン
- 記者発表
東京大学
発表のポイント
◆世界中の公共メタゲノム10万件超を解析し、約170万のウイルスゲノムを収集・整理した「VIRE」データベースを構築しました。
◆既存のウイルスデータベースを凌駕する規模と網羅性を持ち、ウイルスと微生物群集、宿主、機能を横断的に解析できるプラットフォームを提供しました。
◆腸内・環境ウイルスを体系的に収集・公開したことで、ウイルス進化や生態系機能の解明を支援する国際的基盤となることが期待されます。

研究の概要
概要
東京大学大学院新領域創成科学研究科附属生命データサイエンスセンターの西嶋傑特任准教授と、欧州分子生物学研究所(EMBL)のPeer Bork博士らによる研究グループは、世界中の10万件を超えるメタゲノムデータを解析し、約170万のウイルスゲノムを収集・統合した「VIRE」データベースを開発しました。本研究では、最新のウイルス検出技術を用いて、ヒト、海洋、土壌など多様な環境に生息するウイルス(主に細菌に感染するバクテリオファージ)を網羅的に同定し、それらの分類、宿主、遺伝子機能を予測しました。先行研究と比較して、網羅性と解析規模の両面で世界最大であり、ヒトや環境に生息するウイルスの多様性を地球規模で明らかにするための基盤となります。
本成果は、さまざまな環境におけるウイルスの生態的役割や、細菌群集との相互作用の理解を大きく前進させることが期待されます。
発表内容
これまで、地球上のさまざまな環境に多様なウイルスが存在すると考えられてきましたが、その全貌を包括的に理解するための基盤は十分に整っていませんでした。特に、海洋や土壌、ヒト腸内などに生息するウイルスの多くは、細菌に感染する「バクテリオファージ(注1)」と呼ばれるもので、培養が難しいため、その多様性や機能は長らく未解明のままでした。
本研究チームは、地球上のあらゆる環境に存在するウイルスの網羅的解析を目的として、新たに「VIRE(Viral Integrated Resource across Ecosystems)」データベースを開発しました。
本研究では、世界中の10万件を超えるメタゲノムデータ(注2)を解析し、最新の情報解析技術を用いてウイルスゲノムを高精度に検出しました。その結果、約170万の中・高品質なウイルスゲノムを収集・統合することに成功しました。VIREは、ヒト、海洋、土壌、淡水、動植物、極限環境など、多様な生息地に由来するウイルスを一元的に整理し、既存のウイルスデータベースを大きく上回る規模と網羅性を実現しています(図1)。

図1:検出されたウイルスゲノムの数
VIREデータベースに含まれている環境別のウイルスゲノム数を示した棒グラフ
らに、細菌や古細菌に感染するウイルスについては、宿主が持つ防御機構「CRISPRスペーサー配列(注3)」を活用することで、ウイルスが感染する宿主種を高精度に推定しました。また、KEGGやCOGなど遺伝子の働きに関する複数のデータベースを用いた解析により、ウイルスゲノムがコードする多様な遺伝子機能を体系的に明らかにしました。
VIREは、ウイルスの分類・宿主・機能といった多面的な情報を統合的に提供する世界最大規模のデータ基盤であり、ウイルス生態学、微生物進化学、環境科学など幅広い分野におけるデータ駆動型研究を支援します。本成果は、ウイルスの地球規模の多様性理解を大きく前進させ、ウイルスと微生物群集との相互作用の解明や、環境変動・健康・疾病との関連研究の発展に貢献することが期待されます。
〇関連情報:
「VIREデータベース」
https://spire.embl.de/vire/
発表者・研究者等情報
東京大学大学院新領域創成科学研究科附属生命データサイエンスセンター
西嶋 傑 特任准教授
欧州分子生物学研究所(European Molecular Biology Laboratory:EMBL)
Molecular Systems Biology Unit
Anthony Fullam 博士
Michael Kuhn 博士
Peer Bork 博士
アイルランド国立大学 コーク校(University College Cork)
APC Microbiome & School of Medicine
Thomas S.B. Schmidt 博士
論文情報
雑誌名:Nucleic Acid Research
題 名:VIRE: a metagenome-derived, planetary-scale virome resource with environmental context
著者名:Suguru Nishijima*†, Anthony Fullam*, Thomas S.B. Schmidt*, Michael Kuhn, and Peer Bork†(*Equally contributed, †Corresponding author)
DOI: 10.1093/nar/gkaf1225
URL: https://doi.org/10.1093/nar/gkaf1225
研究助成
本研究は、上原記念⽣命科学財団、武田科学振興財団、Research Irelandの支援により実施されました。
用語解説
(注1)バクテリオファージ
細菌に感染するウイルスの総称。ヒトや動植物に感染するウイルスとは異なり、微生物生態系の機能やバランスを制御する重要な存在。
(注2)メタゲノムデータ
環境中のあらゆる生物のDNAを網羅的にシークエンスしたデータ。培養できない微生物やウイルスのゲノム情報も取得することができる。
(注3)CRISPRスペーサー配列
細菌や古細菌がウイルス感染の記録としてDNA中に保持している配列。これを解析することで、どのウイルスが過去にどの宿主に感染したかを推定できる。
お問合せ

