読売新聞寄稿連載「ドキ★ワク先端科学」から~

第48回:情報科学研究科 計算システムズ生物学研究室 金谷重彦教授 〔2017年5月17日〕
「ビッグデータで食を解く」

金谷重彦教授
金谷重彦教授

 データ・サイエンスという分野が注目を集めています。今世紀初頭に米国の計算機科学者ジム・グレイが提唱した「第4のパラダイム」と呼ばれる科学研究のスタイルで、大量のデータをもとにして、統計的に推論を進めるというものです。

 それでは、第1から第3のパラダイムは、どんなスタイルだったのでしょうか。

 第1は、アリストテレスの時代に始まった三段論法による推論。第2は物理学者らが進めた、観測データを分析して論理や法則を見いだす方法。さらに、計算機を使ったシミュレーションで解決を目指す方法が第3です。

 第4のデータ・サイエンスでは、氾濫する大量のデータ(ビッグデータ)から様々な関係性を見つけ出し、法則性を推論することが可能になりました。科学の分野を超えて幅広い現象を解析し、政策などの意思決定に役立てることを目指しています。

 「いかに健康を維持するか?」というのも、データ・サイエンスの重要な課題です。私たちの研究室では、「食」に関するデータベース「KNApSAcK Family DB」の構築を進めています。これは食用となる生物の代謝物質に注目し、医食同源を目指す食に関わるデータや、生物間の相互作用に関するデータをまとめたものです。

 世界中の人々の食を把握するための、世界の食用生物データベース(図)では、食用となる生物1万2578種をリストアップし、地域ごとの違いを把握することができます。

図1
世界の食用生物データベース。食用となる生物1万2578種について、地域ごとの違いを把握できる

 主食となる穀物は、アジアではコメ、温暖なアジア地域と欧州は小麦、アフリカではキビやソルガム、新大陸ではトウモロコシに大別されます。

 地域ごとに、健康を維持するための工夫があります。例えばコメにはタンパク質が少ないため、他の食材から得る必要があります。小麦には、必須アミノ酸のリジンとイソロイシンが欠けており、これらを補うために、家畜を飼ってチーズなどの乳製品を作るようになりました。

 このようにして、種々の食用生物を組み合わせる知識が増え、現在の「食」の知恵ができ上がったのでしょう。私たちの健康を支える食材と料理の科学は、まさにデータ・サイエンスによって解かれようとしているのです。