ソリューション
ソフトウェア
その他・お知らせ
本文までスキップする

マルチGPU搭載のRocky DEM 4:ベストなハードウェアはどれ?

 

皆さま、こんにちは。

IDAJの中嶋です。

 

今回は、パーティクルシミュレーター「Rocky DEM」の開発元である、ESSSが公開しているBLOGの内容を翻訳してご紹介します。

 


 

こちらの記事も関連しますので、あわせてご覧ください。

・初のマルチGPUのソルバー機能によってRocky DEM 4が離散要素法の計算スピードにおいて飛躍的な向上を実現 

・複雑な複合動作の離散要素法シミュレーション

 

乗用車かバスか、所有するならどちらでしょうか?

乗員が自分と他数名であれば、乗用車が妥当。街中の移動も簡単に一度で済みます。それに乗用車の方が、購入も運転も安上がりです。

しかし、もしも100人乗せなければならないとしたら?

突如、20回も街を往復するのは高くきますし、バスの方が費用対効果の最も高い選択肢となります。

同様のことが、離散要素法(Discrete Element Method:DEM)のハードウェアの選択においてもあてはまります。シミュレーションに最も適したCPUやGPUデバイスの種類は、問題の大きさと予算によって決まります。そして、今回Rocky DEM 4が、2つ以上のGPU処理に対応するようになったことで、ハードウェアに何を選ぶかがこれまでに増して重要に、そしておそらく分かりにくく(!)なりました。

このブログでは、Rocky DEM 4で利用できるようになったマルチGPU処理について詳しく見ていき、最良のハードウェアを選ぶための参考情報をお届けします。

 

Rocky DEM 4のマルチGPU処理:その仕組み

何百万もの粒子を扱う大規模離散要素法(DEM)シミュレーションでは、膨大な量のハードウェアのメモリを使います。CPUメモリは多大なコストがかかることがあり、また、シミュレーションの性能が激しく異なる可能性があります。1つのCPUまたはGPU(Graphics Processing Unit)にあるメモリの量は限られており、扱える粒子数はいまだにこのメモリによって制限されます。

しかし、Rocky DEM 4のマルチGPUソルバーは、2つ以上のグラフィックカードのメモリを組み合わせて、単一のマザーボード内で効率的に分配、管理することにより、この制限を克服しています。例えば、製薬業界で使用されている商用スケールの高せん断湿潤造粒機は、Rocky DEM 4でマルチGPUソルバーテクノロジーを用いてモデル化され、初めて1,000万以上の粒子のシミュレーションに成功しました(図1)。

 

Rocky DEMによる造粒機のシミュレーションのスナップショット。1,000万個の粒子がそれぞれの並進速度で色付けされている。

図1:Rocky DEMによる造粒機のシミュレーションのスナップショット。1,000万個の粒子がそれぞれの並進速度で色付けされている。

 

適切なハードウェアを選ぶには

必要なハードウェアタイプの選択は主に費用対効果に左右されます。図2は、様々なハードウェアの高速化とコストの比較です。商用スケールのタブレットコーターで、220個の頂点を持つ多面体メッシュの粒子形状である錠剤242,000個を用いて、シミュレーションを実施しました。一秒のシミュレーションを行うのにかかった時間を、様々なハードウェア間で比較しましたが、このケースでは、GTX980sやTitan ZなどのGPUゲームカードの方が、P100sなどのコンピュータカードに比べて明らかにお得です。GPUカードが1枚の場合でさえ、8コアのCPUプロセッサよりも良い結果が出ています。

 

GPUとCPUでのシミュレーションの高速化の比較、および高速化と価格

図2:GPUとCPUでのシミュレーションの高速化の比較、および高速化と価格

 

また、シミュレーションのスケーラビリティとGPU数を比較してみると、粒子数が小さい場合に比べて、粒子数が大きい場合の方がスケーリングが非常に良好であることがわかります(図3)。すべての場合において、少なくとも1つのGPUを追加することでメリットが出せますが、粒子数が多いほど、2つ以上のGPUを追加する方がメリットが大きくなります。

 

商用スケールのタブレットコーターにおける、GPU数ごとの高速化とシミュレーションを行った粒子数

図3:商用スケールのタブレットコーターにおける、GPU数ごとの高速化とシミュレーションを行った粒子数

 

要するに、GPU対CPUの性能について考える場合、乗用車対バスと同じように考えればわかりやすいということです。バスが多くの人々を乗せるのに適しているように、2個かそれ以上のGPU(マルチGPU)を持つソルバーは、CPU1個のみのソルバーに比べて、何百万の粒子のシミュレーションを行うのに適しており、またコスト的にもお得なのです。ただし、粒子数が100万未満の場合は、マルチGPUを使用するメリットはほぼないため、CPUのみの方がコスパが良い可能性があると言えるでしょう。これは、2、3人を乗せるのなら、乗用車の方が良いというのと同じです。

 

Try it out

Rocky DEMのマルチGPUソルバーを用いた場合に、ご自身のシミュレーションがどうなるのかご興味がありましたら、ぜひお問い合わせください。

 

出典:(一部編集して翻訳)Rocky 4 with Multi-GPU: which hardware is best for you?

2017年5月29日公開


 

パーティクルシミュレーター Rocky DEM

 

■オンラインでの技術相談、お打合せ、技術サポートなどを承っています。

本件ならびに本記事で登場する製品やサービスに関しては、下記までお気軽にお問い合わせください。ご連絡をお待ちしています。

株式会社 IDAJ 営業部

Webからのお問い合わせはこちら

E-mail:info@idaj.co.jp

TEL: 045-683-1990