メニューにジャンプコンテンツにジャンプ

トップページ > 企業・研究機関の方へ > 注目研究情報 > 結核菌のゲノムを包括的に解析するオンライン解析システムを構築

結核菌のゲノムを包括的に解析するオンライン解析システムを構築

概要

結核菌は年間、国内で2万人、世界では800万人が罹患する重要な感染症です。また通常の抗結核薬が奏功しない多剤耐性結核の出現も問題となっています。近年の解析で、結核は人類の進化と共に変化を続けており、流行型が存在していることが明らかとなってきました。このため、結核菌の菌株毎の性状や薬剤耐性、そして菌株間の関係を理解することは以前にも増して重要になっています。これまで結核菌株ごとの性状解析はいくつかのタイピング法によって実施されてきました。これらは結核菌株における特定遺伝子の有無や位置を遺伝子増幅やハイブリダイゼーションにより調べることで実施されています。これらのタイピング法は結核菌の専門家でなければ実施できず、また類縁性の高い菌株は識別ができない、という問題を抱えていました。

これらの解析はすべて遺伝情報に基づいていますので、それぞれの実験を実際に実施しなくても、理論的には、各菌株の全ゲノム情報があれば、コンピュータ上で解析可能です。次世代シーケンサの出現により結核菌の全ゲノム情報を取得することは極めて身近になっています。

今回、国立国際医療研究センター研究所 病原微生物学研究室の秋山 徹 特任研究室長と感染症制御研究部の切替 照雄 部長は、ニプロ株式会社と共同で、次世代シーケンサで取得した結核菌全ゲノム情報から、結核菌のタイピングと薬剤耐性の判定、そして菌株の間の関係を自動で解析するオンライン解析システムを構築し、公開いたしました。このオンライン解析システムは、
CASTB(ComprehensiveanalysisserverofMycobacteriumtuberculosiscomplex,キャスティービー)というhttp://castb.ri.ncgm.go.jp/CASTB/(外部リンク)からアクセスできます。独立行政法人 国立国際医療研究センターのトップページ(http://www.ncgm.go.jp)からもアクセス可能です。

以下はCASTBのトップページとなります。

CASTBのトップページ

ゲノムデータアップロード画面

ゲノムデータアップロード画面

解析結果画面

解析結果画面1

解析結果画面4

CASTBでは、現存のあらゆるタイプのシーケンサのデータの標準的なデータ形式に対応しており、データアップロードから解析完了までの時間は約5分です。これまで次世代シーケンサの解析には専門的なITやバイオインフォマティクスの知識が必要でしたが、CASTBではこのような専門性を完全に排除し、シーケンサのデータをアップロードするだけで解析結果が得られます。解析結果は、画面上に表示されると共に、その後の集計などのためにダウンロードできます。CASTBのタイピング解析結果は、従来のタイピング法と一定の互換性があり、これまで行われてきた解析結果とのシームレスな統合が可能です。

結核菌のこのようなオンライン解析サービスは世界で初めてのものであり、今後の結核対策に役立つことが期待されます。

結核菌タイピング法と薬剤耐性結核

結核菌のタイピングは、

  1. スポリゴタイピング(PCR‐ハイブリダイゼーションに基づいて結核菌の系統ごとにユニークな領域を検出する)
  2. VNTR(PCR‐電気泳動分離により結核菌ゲノム内の繰り返し領域の有無を検出)
  3. IS6110タイピング(結核菌ゲノム内に複数存在する挿入配列であるIS6110をゲノムサザンハイブリダイゼーションにより検出)
  4. LSP(long sequence polymorphism)(6系統存在すると考えられている、結核菌の各系統に特異的なゲノム領域をPCRなどにより検出)
  5. 北京型タイピング(現在、広く流行していると考えられる、北京型に存在する配列を特異的な配列をPCRなどにより増幅することで判定、現在では他のマーカーによる判定など複数の変法が存在する)

など複数の方法が存在しています。これらの方法は主に菌株を系統に分けるのに極めて有用です。その一方で、これらの既存のタイピング法は、専門的な知識と装置を必要とする実験が必要であり、結核研究者以外が実施することは容易ではありませんでした。またこれらのタイピング法の解像度は、集団感染事例などの非常に密接に関連した菌株間の関係を解析するのには不十分でした。

結核菌感染症ではほとんどの抗結核薬が利かない多剤耐性結核の出現も問題となっています。結核菌の薬剤耐性獲得は、一般的な薬剤耐性獲得機構で認められるような、外来性の薬剤耐性因子獲得による耐性化ではなく、ほぼ一義的に遺伝子変異により発生します。そのため、各タイピング法の情報と結核菌の薬剤耐性情報はすべて、ゲノム配列内に存在しています。しかしながら、これらの情報を解析するためには、各情報を持った遺伝子を個別に増幅してPCRやサザンハイブリダイゼーションなどにより解析する必要がありました。近年、結核菌には流行系統が存在し、その中には、薬剤耐性化しやすい系統が存在することが指摘されており、結核菌のタイピングと薬剤耐性の監視は重要度を増しています。

次世代シーケンサの出現

これまで遺伝子配列の解析はサンガー法により行われてきました。サンガー法では一つの解析で最大1,000塩基(1kbp)の配列情報を取得することができます。一度に96個の検体を解析する装置を駆使した場合、1日で、約2000kbp(2Mbp)の遺伝子情報を得ることが可能です。しかし、塩基配列解析を実施するためには、解析の標的となる特定の遺伝子情報を持った遺伝子断片を増幅して精製しておく必要がありました。

一方、ここ数年で急速に開発が進んだ次世代シーケンサでは、最大1Tbpの塩基配列情報を数日以内に取得することが可能です。これは前述のサンガー法による解析の約1千万倍です。また解析に際しては特定の遺伝子情報を持った断片を増幅しておくことは必須ではありません。この技術により、結核菌の個別の遺伝子を増幅することなく、結核菌培養物からゲノムを抽出し、全ゲノム情報を解析することが可能となりました。現在では、結核菌全ゲノム配列の解析費用は1万円以下となっており、次世代シーケンサ技術の普及により、さらに安価になると見込まれています。前述のように、結核のタイピングや薬剤耐性の解析に必要な情報は遺伝子情報ですので、結核菌の全ゲノム情報の中にはそれらの情報が含まれています。また全ゲノム情報が利用可能な場合、適当な標準株との比較によって、一塩基レベルでの変異の有無(1塩基多型、SNP)が判定可能となります。結核菌のゲノムは約4,400,000塩基(440万塩基)からなっていますが、このSNPの情報を集積することで、非常に近縁な、例えば、集団感染事例由来株間で、440万塩基の中のたった1個のSNPによっても菌株を識別することが可能であり、これにより、菌株の系統を解析することができます。このような解析に使用するSNPの集合体はSNPコンカテマーと呼ばれます。SNPコンカテマーを用いた細菌の系統解析の手法は、現在最先端の系統解析分野で使用されている先進的で高解像度の手法です。

次世代シーケンサとバイオインフォマティクス

次世代シーケンサによるゲノム配列解析で得られる情報は膨大(ビッグデータの一種)であり、もはや人間が一つ一つ目で見ながら解析することは不可能です。そこで情報処理技術(IT)と統計学的手法を駆使し、高速なコンピュータを利用したバイオインフォマティクスによる処理が必要となります。例えば、膨大な配列情報を一つの分かりやすい配列にまとめ、その中から結核菌の疫学解析に必要な部分を取り出し、他の配列と比較する、という操作が必要になります。これには、専門的な知識や高速なコンピュータなどが必要となり、結核の専門家と云えども解析は容易ではありません。そのため、これらの解析は、バイオインフォマティクスの専門家の協力無しでは実施できませんでした

CASTBの開発

これらの背景のもと、独立行政法人 国立国際医療研究センター研究所 病原微生物学研究室の秋山 徹 特任研究室長と同研究所 感染症制御研究部の切替 照雄 部長は次世代シーケンサで得られた結核菌の全ゲノムデータを自動解析するオンライン解析システムを構築し、公開いたしました。このオンライン解析システムは

CASTB(ComprehensiveanalysisserverofMycobacteriumtuberculosiscomplex,キャスティービー)

と命名され、http:xxxxx.castb.ncgm.go.jpのアドレスからアクセス可能です。国立国際医療研究センターホームページ(http://www.ncgm.go.jp)にリンクがあり、容易にアクセス可能となっています。なおCASTBの利用は当面、アカデミックユースのみになり、利用には登録が必要となります。登録はCASTBのホームページから簡単に申込み可能です。

CASTBで解析可能なデータ

CASTBでは以下のデータが解析可能です。

  1. 次世代シーケンサでの解析により得られたfastqやfastaという標準的な形式の生配列データ
  2. 生配列データをアセンブルした、contigやscaffoldなどのドラフトゲノム配列、そして完全ゲノム配列
  3. 既にCASTB内に登録されている標準株などのゲノム配列データ。

1.の場合、CASTBは配列を自動でde novoアセンブルし、その後の解析を実行します。これらへの対応により現行の次世代シーケンサから得られる配列データはもとより、既知の株についての解析も可能となっています。なお、結核菌は培養に約30日を要する培養が困難な菌であり、そのため、他菌種が検体に混在する場合があります。そこで、CASTBでは予め結核菌以外の菌種が混在しているかどうかを検査し、他菌種の混在が疑われた場合には、警告を行う仕組みが実装されています。

CASTBが実行する解析

CASTBでは以下の解析がバーチャルに実行可能です。それぞれを実行するかどうかは個別に選択可能です。

  1. 一般的な結核菌疫学解析用のタイピング(スポリゴタイピング、VNTR、LSPによるlineage解析、北京型判定(モダン型とアンセストラル型の判定を含む))
  2. 既知の薬剤耐性変異の有無の判定
  3. SNPコンカテマーによる菌株間の系統的関係の詳細な解析。

CASTBの解析に要する時間

結核菌1株のデータのアップロードから全ての解析の実行完了まで、約5分です。菌株数に比例して解析時間は変動します。解析の進行状況は随時確認可能です。解析が終了するとユーザー登録されたメールアドレスに通知される仕組みになっています。解析結果は、解析結果ホームページから個別にダウンロード可能で、それ以降のさらなる解析が容易に実施できるようになっています。

今後の展望

CASTBにより国内はもとより、世界中の結核菌の疫学的解析・薬剤耐性の解析、そして系統解析が飛躍的に身近になります。CASTBは、次世代シーケンサの普及による結核菌解析の促進に大きく貢献すると考えられます。CASTBやそれ以外の研究により得られた新たな疫学的知見や薬剤耐性に関するデータ、そしてユーザーからの要望は随時CASTBに反映される予定です。

支援

本研究は厚生労働省・国際医療開発研究費の支援を受けて実施されました。

本件に関する問い合わせ先

  • 独立行政法人 国立国際医療研究センター研究所 病原微生物学研究室
    特任研究室長 秋山 徹(あきやま とおる)
  • 独立行政法人 国立国際医療研究センター研究所 感染症制御研究部
    部長 切替 照雄(きりかえ てるお)