研究

"Machikaneyama" PC cluster system

クラスター黎明期から手作りでPCクラスターを構築してシミュレーションに用いてきました.古くなった各ノードは学生さんの事務機として再利用しています.現在各ノードPentium IIIの第3世代,Pentium 4の第4世代,(Dual Core) Athlon FX64x2 4200+の第5世代の合計約100CPUが稼働中です.2007年度の第6世代はDual Quad-core (8コア)Xeon数台で構成する予定です.


下のグラフはDual Quad-core (8コア) Xeon 2.33GHz (E5345), 8GB-memory搭載の機械で,インテルC++コンパイラの並列化オプションを付けて8コア並列計算をした場合のシングルコア計算に対する相対的な処理速度を示したものです.

左はほぼ完全に並列化できる単純な定積分の計算で,横軸は刻みの数(計算のサイズ)です.ほぼ全てのサイズでコア数の8倍に近い速度向上が見られます.あるサイズではコア数倍以上の14倍もの速度向上がみられます.

右の赤のグラフは大自由度(横軸=N=自由度)の非線形常微分方程式のシミュレーションの結果です.N=32, 64, 128の比較的サイズが小さい計算では8コア並列化すると(並列化のオーバーヘッドのコストが大きく)却って遅くなってしまいますが,N=256, 512, 1024, 2048では並列計算による速度向上が見られます.N=1024ではコア数の2倍以上の16.5倍もの速度向上がみられます.緑のグラフは4コア並列計算の結果です.8コア並列計算と同様に,N=256, 512, 1024, 2048では並列計算による速度向上(最大でシングルコアでの計算の3倍程度)がみられます.

grall.png gas84.png


添付ファイル: filegrall.png 1541件 [詳細] filegas84.png 1510件 [詳細]

© Copyright 2013 Kei Tokita, Powered by Pukiwiki.  Last-modified: Sat, 10 Jan 2015 10:57:55 JST (1773d)   リロード   新規 編集 凍結 差分 添付 複製 改名   トップ 一覧 検索 最終更新 バックアップ   ヘルプ   最終更新のRSS