ドキ★ワク先端科学
| 教育研究紹介 TOP |

~読売新聞寄稿連載「ドキ★ワク先端科学」から~
第6回:情報科学研究科 笠原正治教授 [2014年7月11日]「データ処理の役割分担」 |
![]() |
みなさんはスマートフォンで知りたいことをよく検索しますよね? このようなキーワード検索は、クラウド・コンピューティングと呼ばれる情報技術によって支えられています。
その仕組みは、サーバと呼ばれるコンピューターをたくさん用意してつないでおき、莫大な量のデータをサーバの数だけ分割して、それぞれのサーバが同時に並列して処理します。インターネットの向こう側にある、たくさんのコンピューターがこのように処理するおかげで速く答えが出せるのです。
このとき問題になるのは、サーバの性能差やマシン自体の故障です。そこで、こうした事態にも柔軟に対応してデータを高速に処理するための仕事の分担の仕方、スケジューリング(段取り)が重要な役割を担っています。
どのようなスケジューリングが効果的でしょうか?
たとえば、4台のサーバで処理を行う場合を考えてみます。図左側の戦略Aはデータを4分割し、4台のサーバで並列処理を行います。図右側の戦略Bでは、まずデータを2分割し、それぞれの分割データをコピーします。そして、計4つになったオリジナルとコピーのデータを各サーバで同時に処理します。
サーバの故障が起こらない場合、戦略Aの方が1台当たりのデータ量が少ないので処理時間が短くなります。ところが、1台のサーバが故障すると、戦略Aでは全体の処理を完了できません。
一方、戦略Bでは2台に同じ処理をさせていますから、1台が故障しても全ての処理を完了することができます。つまり、同じ作業を2台にさせる手間はかかるものの、故障に耐える特性があります。また、サーバの性能に差がある場合は処理時間も短くなる確率が高いこともわかりました。ただ、戦略Bは電気を使いすぎるという欠点があります。
私たちは、地球スケールで高性能かつ高効率に処理を行う将来の大規模情報システムについて研究を行っています。こういったシステムが実現すれば、瞬時に日本語を外国語に翻訳したり、ゲリラ豪雨など災害の予測や分析の精度をより高めたりすることも可能になります。