|
>ホーム >ニュース >News@KEK >この記事 | last update:04/05/27 |
||
実験データの高速ハイウェイ 2004.4.15 |
||||||||||||||||||||||||||||||||||
〜 Belle実験のデータ解析を支えるSuperSINET 〜 |
||||||||||||||||||||||||||||||||||
粒子と反粒子の対称性の謎を探るBelle実験のことはこれまでにも何度かお伝えしてきましました。世界的にも注目を浴びる成果を出し続けるこの実験では、大量の実験データが生じます。今回はBelle実験のデータ解析の技術と、実験データを転送する高速ネットワークSuperSINETについてご紹介しましょう。 高エネルギー物理学がうながしたWWWの発明 以前にもご紹介したように、皆さんが今もご覧になっているWWWのページは、スイスのジュネーブ郊外にある欧州合同原子核研究機関(CERN)での研究開発がきっかけとなって生まれました。 コンピューターネットワークは今でこそ当たり前のように使われていますが、広く使われるようになったのはまだ20年ほど前のことです。そんな歴史の浅いコンピューターネットワークが、今では20世紀において自動車によるモータリゼーションが果たした、あるいはそれ以上に大きな影響を私たちの生活にもたらしつつあります。いまや電子メールを使って仕事を進めたり、いろいろなホームページを見て情報を集めたり、オンラインショッピングをすることができない社会というのは想像もつかないほど、ネットワークは私たちの生活の基盤をささえるまで成長しました。 科学の研究が先端的なネットワークの利用をうながす 現在ではインターネットは家庭におけるブロードバンド環境や携帯電話の普及などがその発展のおもな推進力となっています。しかし、その基盤となる技術は情報科学系の研究者によって考案され、他の分野の研究者がその技術を利用しながら改良していくことで成長してきました。「科学研究の現場で必要とされる技術」は、いわば、新しい技術が孵化するためのゆりかごのようなものです。 国立情報学研究所が運営している学術研究機関のためのネットワーク基盤は、学術情報ネットワーク(SINET)と呼ばれています。2002年からは、光通信技術を用いる世界最高速の研究用のインターネットとして、SuperSINETが運用を開始しました。このSuperSINETは、5つの重点分野を対象として、先端的学術研究機関間の連携を強化するための超高速ネットワークとして整備されました(図1)。この5つの分野とは ・高エネルギー・核融合科学 ・宇宙科学・天文学 ・遺伝子情報解析 ・スーパーコンピュータ等を連動する分散コンピューティング(GRID) ・ナノテクノロジー です。SuperSINETは、これらの分野の国内の主要な研究所を高速道路の幹線(バックボーン)のように接続することで、ネットワークのより先進的で高度な利用をうながすことを目的としています。 KEKは、このうちの高エネルギー・核融合科学分野の中心として、10ギガビット毎秒(10Gbps)の主幹線を持ち、さらに、7つのギガビット専用線や仮想専用線をとおして大学の高エネルギー物理研究室などと直結されています(図2)。 KEKではこの他にも国立情報学研究所が運営している国際学術ネットワークを利用して、アメリカやヨーロッパなど海外の研究機関とも密接にデータのやり取りをしています。また、アジア地域ではAPAN(Asia-Pacific Advanced Network)の枠組みを利用して韓国、台湾、中国なども含めた世界的規模のネットワークを形成しています。 国際協力体制で進められる実験データの解析作業 高エネルギー研究では、実験グループごとに国際的な共同研究となっていて、多くの日本の研究者がそれぞれの研究グループに参加しています。これらの実験グループの中でも、KEKで行なわれているBelle実験は、もっとも大量の実験データを多くの大学とも共同してデータ解析をしており、SuperSINETによるデータ転送が大きな貢献をしています。 図3は、SuperSINETを使って行われているBelle実験グループのデータ転送経路です。Belle実験グループは13の国と地域から400人ほどの研究者が参加している大きな研究グループで、国内だけでも20あまりの大学や研究機関が参加しています。これらの研究機関に所属する研究者が実験データの解析のたびごとにKEKに出張するのは非常に大変なので、いつもはネットワークを使ってKEKにある計算機資源を使ったり、データを転送して自分の所属する機関の計算機資源を使ったりしています。 段階的に行われるデータの解析 Belle実験などの高エネルギー物理学の実験では、実験データを一度に処理するのではなく、段階的に少しずつ解析を進め、大量の実験データをできるかぎり効率良く解析することができるようにしています(図4)。 まず、測定器から収集される「生のデータ」は、電子と陽電子の衝突の事象(図5)ごとに40キロバイトほどの大きさがあり、毎秒300から500個の割合で磁気テープに格納されていきます。1日あたり1テラバイトで、年間では400テラバイトほどになります。本の文字の情報量に換算すると、国会図書館がおよそ2年でいっぱいになるほどの量だといわれています。 生のデータは次に粒子の飛跡を三次元的に再構成するなどの処理を施されて、要約データ(DST: Data Summary Tape)という情報が生成されます。この要約データは年間600テラバイトほどのペースで蓄積されていきます。 この三次元的な再構成が、実験データの処理の中で計算時間をもっとも必要とする部分なので、実験グループのメンバーが何度も同じ計算をしなくてもすむように、生成された要約データはグループ全体で共有されます。 この要約データに含まれるそれぞれの粒子の飛跡のデータから、粒子の放出角度や運動量、さらには他の検出器からの情報も合わせることで、粒子の種類などを識別することができます。この段階まで来ると、Belle測定器の中で生成されたB中間子がどのような崩壊過程をたどったか、などの物理的過程に応じて、解析の手法が細かく分かれてくるので、それぞれの物理的過程を研究するメンバーのために、ミニ要約データ(miniDST)と呼ばれるデータが生成されます(図6)。 このミニ要約データを、世界各地に散らばっている共同研究者がそれぞれの研究機関でさらに解析を行い、研究論文として発表するための準備を行います。現在のデータ転送量は、毎月10テラバイトくらいです。一人の研究者が物理解析に使うデータの量は、おおよそ100ギガバイト〜1000ギガバイト位で、そのような研究者が常時、100名くらいが、KEKや国内外の大学に分散して解析しているのです。 物理の解析では、それぞれの大学などのチームが独立に解析のテーマをもっていて、大学院学生なども参加して研究を行っています。ネットワークが整備される以前は学生は、研究所に長期間滞在してデータ解析をする場合がほとんどでした。しかし、SuperSINETをはじめとするネットワークの急速な普及で、計算機さえあれば世界中どこにいてもできる環境が整いつつあります。また、これらの研究環境を支えるための最先端のネットワーク技術は、今後の超高速ネットワークの実用性を占うよい試金石にもなっています。 大量の実験データと超高速のネットワーク。車の両輪のようにどちらも欠かすことのできない研究環境は、今後もますます発展していくことでしょう。 |
|
※ この記事に関するご意見・ご感想などをお寄せください。 |
copyright(c) 2004, HIGH ENERGY ACCELERATOR RESEARCH ORGANIZATION, KEK 〒305-0801 茨城県つくば市大穂1-1 |