活動報告

2022年6月の活動報告 : コンピューティンググループ

コンピューティンググループが2022年6月の活動報告を行いました。コンピューティンググループは、国外の計算機・ソフトウェア環境の動向を考慮しつつ、国内の素粒子原子核実験における計算機環境の方向性を示し、国内外の機関と協力してその実現に向けた活動を行うため2018年5月に素核研で立ち上がりました。本グループでは、国外の計算機・ソフトウェア環境の最新動向を常に掴みつつ、昨今、加速器の高エネルギー化・高輝度化や検出器の大型化・細密化に伴い増大する取得データを効率よく処理し、物理結果を迅速に引き出すため、具体的にはBelle II 実験用の分散計算モデルの構築・運営、ソフトウェア整備などを中心とした活動をBelle II 計算機グループおよびKEK計算科学センターと共同で行っています。また、Belle II実験のみならず、KEKで実施している実験・計画全体の対外的窓口としてDPHEPやHSFなどの海外の計算機・ソフトウェアコミュニティに参加しています。

 

今回の報告では、コンピューティンググループ発足前の2008年から現在に至るまでの活動を紹介しています。2008年、Belle II 実験における分散計算モデル導入のための活動が始まりました。分散計算モデルは、複数のコンピュータで並行して個々のプログラムを実行し、見かけ上大きな一つのコンピュータで複雑な計算を行うモデルです。当初、スイス・ジュネーブ近郊にある欧州合同原子核研究機関(CERN)のLHCb実験で開発・運用され始めたDIRACというツールをBelle II実験で採用し、Belle II実験用に拡張モジュールなどを整備しました。その後もKEKを中心に海外との大規模MC(モンテカルロ・シミュレーション; ここでは物理解析用の擬似データを作成する手法を意味します。加速器・測定器で得られた実データと大量に作成した擬似データを比較して、未知の現象を探ります)作成テストなどを行い、改良を続けた結果、現在は約60研究機関が計算機資源を提供し、約25kコア相当、16PBのディスク、12PBのテープ領域を有する大規模な分散計算システムとなりました。2021年初旬には、より効率的な分散データ管理が可能となるRucioと呼ばれるソフトウェアも導入し、大量のデータの中から不要なファイルのみを自動消去することなどができるようになりました。

 

他には、Belle II実験で取得したRAWデータ(測定したばかりで物理解析用にデータを補正する前のデータ)を速やかに検出器からオフライン側計算機(KEKCC : 中央計算機システム)に転送し、さらにこのRAWデータのコピーを国外の複数の大規模計算機センターにも分散して保存する作業も行なっています。国外にデータのコピーを分散して保存することで、不慮の災害・事故等でデータが消失することを防いでいます。この作業は現在ではほぼ自動で行うことができるようになりました。

 

詳しくはこちらをどうぞ。

 

ページの先頭へ