明治大学の教授陣が社会のあらゆるテーマと向き合う、大学独自の情報発信サイト

生命科学の発展にはデータの活用が欠かせません。- 生物学、農学の専門家にも、データ解析などの能力が求められている時代です。-

明治大学 農学部 生命科学科 准教授 矢野 健太郎

生命科学の発展にはデータの活用が欠かせません

●生命科学の分野でもコンピュータを使った解析技術がますます高度化している。
●大型計算機を使っても処理に何日もかかるデータ量のため、新しい統計手法の確立が急がれている。
●自然言語処理によって、論文情報から信頼性の高い大辞典をつくりたい。

生命科学の進歩が、データ量の増大を招いた

 私の専門はバイオインフォマティクスです。この分野は、生命科学と情報科学の融合領域として、今から20年ほど前に登場しました。その背景にはゲノムの解読が本格化するとともに、扱うデータの量が飛躍的に増えたことが関係しています。もともと生物学者は自分で実験を行い、得られたデータを自ら分析していたわけですが、データの量が膨大になるにつれ、生物学の専門家だけではデータを扱いきれなくなってきました。さらに、得られた大量のデータをもとに、学術的な意味を抽出するためには、データベースの構築や高度な統計処理、データ解析なども行う必要があるため、バイオインフォマティクスの重要性は日増しに高まっています。
 生命科学分野が扱うデータ量の増大にはますます拍車がかかっています。大型計算機を使っても処理できないほどの大規模なデータ解析が求められるようになり、生命科学の分野でも「ビッグデータ」という用語を目にすることが増えました。大規模化するゲノムなどの情報処理を実現するためには、新たな手法が必要となっており、私もその確立に取り組んでいる一人です。

論文情報をコンピュータに読み込ませたい

fl18_img01
「植物の実測値やゲノムDNA配列情報、遺伝子情報に、論文にもとづく知識情報を加え、Web上に巨大な生命科学の辞書をつくりあげることが目標」と語る矢野准教授。
 ところでゲノム配列の解読は、あくまでも塩基配列の解読であり、ゲノム上に位置する数万個以上の遺伝子について、すべてが実在するかを逐一調査しているわけではありません。現時点では、ゲノムのどこにどんな遺伝子があって、どんな働きをしているかをコンピューターで機械的に予測しているだけです。ゲノム解読は生命科学の発展のための大きなマイルストーンではあったけれど、このデータを使って役立つ情報を得るのはこれからの研究次第です。今は真っ白な地図が手に入ったにすぎません。
 ある遺伝子の塩基配列が予測できたとして、その働きを調べるときには、データベースを利用します。しかし、登録されている遺伝子の働きがデータベースに正しく記述されているかは検証されていないことがほとんどです。例えばショウジョウバエの目を形成するのに働いていると報告されていても、それが間違っている可能性は捨てきれません。チェックする体制が今のところないため、最も信頼性の高い論文と照合することが望まれます。
 この論文情報にもとづくデータベース整備では、現在はキュレーターが論文を読んでデータベースに登録する作業をしています。このマニュアル・キュレーションは、精度が高い一方でスピードが遅く人件費がかかります。そこで私の研究室ではコンピュータに論文を読ませ、遺伝子の機能情報を抽出させる-つまり自然言語処理をさせることに取り組んでいます。コンピュータに論文を読ませ、理解してサーバに登録させることができれば、信頼性の高い知識情報データベースの構築という夢が実現します。手法としてはかなり研究が進んでいますが、まだ人間のようにはできないのが現状です。どうすれば難解な論文を理解させ、必要な部分を登録させられるかは、いまのところ大きな課題です。

生命体をシステムとしてとらえる視点

fl18_img02
遺伝子情報を活用し品種改良を効率化する研究にも参加しています。バイオ燃料を低価格で生産することが目的です。
 もうひとつのキーワードはシステムズ・バイオロジー。こちらはさらに新しい研究分野で、生命体をシステムとして理解することを目的としています。以前はゲノムが読めれば生命現象がすべてわかると期待されていた時期もありましたが、塩基配列を読み取っただけでは生命現象の理解にはまったく不十分で、塩基配列の機能や役割、発現したRNAやタンパク質の挙動などを幅広く検討していかなければなりません。わかりやすく言うとシステムはどう動くか、何が遺伝子のスイッチを入れて、切っているのかなど、システムの動的な特性を解明するために、酵素や遺伝子、タンパク質などのパーツを集めて横断的に解析することが研究のテーマです。

イネはなぜイネなのかを知るために

 室内実験のスピードの向上はすさまじく、今では1日でヒトゲノムの40倍のデータを解読できるようになっています。さらに、近年は高速シーケンサーやマイクロアレイと呼ばれる技術を使って、膨大な量の遺伝子発現データが得られるようになりました。
 その反面、実験データが増大しすぎたために、宝の山が目の前にあるのに、掘り起こすツルハシがない状態になっています。大規模な遺伝子の発現パターンの情報をもとに遺伝子を探索する場合、データ規模が大きいために解析ができないことがあります。その場合、解析規模を小さくするために、比較的意味が薄い、すなわち発現量の変動がほとんどない遺伝子群を解析対象から除く操作が広く行われています。もちろん除去せずに網羅的に解析することがベストのため、一般的な予算で買える計算機で、しかも短時間に、ハイスループットで大規模情報を解析できる方法をつくることがもう一つの課題になっています。
 また、得られる結果も大規模なため、そのままでは理解困難なデータの羅列になってしまいます。かといって、扱いやすく処理しようとすれば大型計算機もハングアップするほど膨大な計算が必要です。そこで、研究者にとってハンドリングしやすい統計手法とノートPCでも表示が可能な3Dソフトを開発しました。この手法では、3D空間の中で、近くにある遺伝子は似た発現パターンを示すことを利用し、たとえば、病気の発生や収量に関わる目的の遺伝子を捕まえることができます。
 さらに、発現パターンが似た遺伝子を容易に把握できる遺伝子発現ネットワークの活用によって、重要な遺伝子を探索できます。また、異種間のネットワークを比較・解析できれば、それぞれの種に個性を持たせている遺伝子がつきとめられます。イネはなぜイネなのか、イネにしかないものをゲノムの中からつきとめたいと思っています。

バイオインフォマティクスを担う人材育成も課題

fl18_img03
fl18_img04
矢野准教授が開発した3Dソフトの画像。遺伝子の発現パターンの比較がイメージしやすくなっている。
 伝統的な農学の研究においても、研究者自身がデータの解析を行えることが本来の姿だと私は思います。データ処理を人に預けては、時間の無駄だし、解析した人が意図と異なる結果を導いて、しかも依頼した側もそれに気づけないことさえあるでしょう。それでは生命科学の発展につながりません。ビッグデータの時代の研究者には、情報処理技術と、情報をどのように統合して結論を導くかという生命科学のセンスの両面が求められます。特に、食糧生産は重要な国家戦略であり、生命科学と農学の発展は不可欠です。生命科学と農学が要求するビッグデータ解析を実現するためのバイオインフォマティクス研究の発展を支える教育基盤をつくることも、私たちの重要な仕事だと思っています。

掲載内容は2013年12月時点の情報です。

ビッグデータ時代のビジネス改革の関連記事

データから答えを導く力、統計学 – 統計学は経済や物理、生物、医療、防災など広い分野の研究に役立てられています。 –

2013.12.1

データから答えを導く力、統計学 – 統計学は経済や物理、生物、医療、防災など広い分野の…

  • 明治大学 総合数理学部 現象数理学科 准教授
  • 中村 和幸
もっと速く、もっと効率の良いコンピューティング環境へ。- 目の前のプログラムを速く動かす環境や手法づくりが一貫したテーマ。-

2013.12.1

もっと速く、もっと効率の良いコンピューティング環境へ。- 目の前のプログラムを速く動かす環…

  • 明治大学 総合数理学部 ネットワークデザイン学科 准教授
  • 秋岡 明香
ビッグデータの活用に向けて秘匿化技術の確立に取り組む – ビッグデータの活用には賛成です。ただし安全管理を徹底することが大前提になります。 –

2013.12.1

ビッグデータの活用に向けて秘匿化技術の確立に取り組む – ビッグデータの活用には賛成で…

  • 明治大学 総合数理学部 先端メディアサイエンス学科 教授
  • 菊池 浩明

Meiji.netとは

新着記事

2017.09.20

「改正・個人情報保護法」から、個人情報のビッグデータ化が本格化する

2017.09.13

女性が活躍する未来の農村のために

2017.09.06

使えないロボットはもういらない。できるロボットを世に送り出す

2017.08.30

「共謀罪」法が問題だらけになったのは、オリンピックのせい!?

2017.08.23

GPS捜査をめぐる最高裁判決の意義

人気記事ランキング

1

2014.09.01

緊急提言、人口減少社会に歯止めをかける ―方策は少子化対策、社会…

2

2013.09.01

少子化問題を斬る ―原因は、未婚化・晩婚化・晩産化にあり―

3

2017.09.13

女性が活躍する未来の農村のために

4

2017.03.29

「留学生30万人計画」が抱えている将来的課題とは

5

2016.10.19

スポーツビジネスの功罪を考えると、社会の未来が見える

Meiji.net注目キーワード

【注目!】連載コラム