SC24 のまとめ: 専門家が AI サロゲート モデル、FP64 GPU、デジタル ツインに関する洞察を共有
高性能コンピューティングにおけるイノベーション、戦略、運用のバランスに関する経営者の視点。
At SC24スーパーコンピューティングの最高峰のカンファレンス、 Rescale AI が日常のワークフローに統合され続ける中で、主要なハイパフォーマンス コンピューティング (HPC) の洞察を掘り下げるパネル ディスカッションを主催しました。
Rescale の COO Matt McKee が司会を務め、以下の紹介でパネルが始まりました。
- ブランドン・ハウ、モデリングシミュレーション担当副社長 カイロスパワー
- インスパイア・セミコンダクターの最高マーケティング責任者兼社長、ダグ・ノートン氏 HPC プロフェッショナル協会
- グローバルHPC ITインフラストラクチャ責任者、Srikanth Gubbala氏 アプライドマテリアルズ
各パネリストの豊富な経験を活かして、その洞察をシミュレーション コミュニティと共有できることを嬉しく思います。それでは、要約を見てみましょう。
代替データ
パネリストたちはすぐに発言した。合成データの概念は最近のトレンドのように思えるかもしれないが、これらの数学的手法は何十年も前から利用されてきた。 シミュレーションとモデリングにおけるAIリーダーたちは現在、モデルのトレーニング、検証、テストに合成データを活用する傾向が高まっています。
聴衆にとって、誰もが一つの疑問を抱いていただろう。 代替モデルは正確ですか?
カイロスパワーのモデリングシミュレーション担当副社長ブランドン氏は、クリーンな原子炉の開発で同社が直面している研究開発上の課題について次のように語った。「私たちは実際のデータと合成データを取得し、高度な機械学習アルゴリズムを使用してそれらを分類し、何が現実で何がそうでないかを判断し、物理に適合したモデルに当てはめます。 AIとML やっていることを踏まえると、ある程度の現実性を持たせていると言えるでしょう。」
制約がなければ、代替モデルは現実世界のエンジニアリングの課題を正確に表すことができないデータを生成する可能性があり、信頼性が低くなり、実際のアプリケーションへの一般化が難しくなります。代替モデルが、精度、安全性、規制の精査が最も重要である原子力アプリケーションに対して十分に正確で信頼できるものであることが証明されれば、自信を持って他の多くのエンジニアリング領域に適用できることが期待されます。
FP64GPU
SC24の聴衆は、ダグの講演に耳を傾けていたら、重要な洞察をつかんだことでしょう。インスパイア・セミコンダクターのCMOと、 HPC プロフェッショナル協会 彼は、「優れた AI を実現するには、これらの基礎モデルに 64 ビットの倍精度演算が必要です」と強調しました。もっと明確に言えば、CAE アプリケーションには高精度が必要であり、64 ビット浮動小数点 (FP64) GPU だけがこの要求を満たします。これは微妙ですが、重要な違いです。
先進企業は CAE のようなアプリケーション Abaqus、StarCCM+、ANSYS Fluent、LS-DYNA、OpenFOAM など 高精度ソルバーを活用して、正確性と信頼性の高い収束を保証します。 CFDシミュレーション繰り返しソルバーでは小さな数値誤差が蓄積される可能性があることをご存じでしょう。
例えば、OpenFOAMの32ビットから64ビットへの移行は2008年頃から徐々に始まり、CAEベンダーが高精度のNVIDIAを活用しながら継続しています。 GPUGPU 市場は、他の種類の AI アプリケーションやエッジ コンピューティングには有利な低精度のコア タイプで飽和状態にある一方、CAE 向けの FP64 GPU の需要は高まっています。
At Rescale当社は誰よりもこれを理解しており、シミュレーションのニーズに最適なコンピューティング リソースをお客様に提供することに特化しています。 Coretypeポートフォリオの規模変更 NVIDIA Volta V100やTesla P100などのGPUや、AWS Graviton3やGoogle CloudのTau T2Aなどのエネルギー効率に優れたArmベースのプロセッサを活用した最新の高性能コンピューティングソリューションを提供し、幅広いHPCワークロードのパフォーマンスを最適化します。
デジタル双子
次の司会者の質問で、会話はコアタイプからアプリケーションに移りました。原子炉のような重要なシステムでは、リアルタイムの予測監視とメンテナンスはオプションではなく、必須です。ブランドンは、機械学習が彼らのシステムの高度化をどのように進めてきたかについて説得力のある洞察を共有しました。 デジタル双子.
ブランドン氏は、「私たちは施設全体を監視して計測し、予測を検討しています。デジタルツインのパフォーマンスも確認しています。実際に、予測と診断のための機械学習を行っています」と語りました。パネルの後半で、彼は自社がデジタルツイン用に生成している膨大な量のデータについて明らかにしました。続きをお読みください。
デジタルツインはシミュレーションの分野で話題となっている コミュニティ、それがいかに効果的に導入されたかを聞くのは楽しいです カイロスパワー 公共の安全を強化するためです。同様に興味深いのは、精密医療、製造業、その他さまざまな分野で画期的な進歩をもたらす可能性です。
量子コンピューティングとビッグビッグデータ
ビッグ データの複雑さと規模が増すにつれ、量子コンピューティングは、膨大なデータセットから意味のある洞察を引き出す方法に変革をもたらすでしょう。パネリスト全員がその可能性を探求することに熱心でした。ダグ ノートンは、「量子は私たち全員の考え方を変えるでしょう」と述べました。
グローバル HPC IT の責任者である Srikanth 氏もこれに同意し、HPC と量子コンピューティングがシームレスに連携するという自身のビジョンを強調しました。彼は、テスト、IoT エッジ デバイス、その他のソースから発生する組織内の分断されたデータの爆発的な増加について説明しました。将来について議論しながら、彼は「しかし、これらすべてを実現するには、データ管理に重点を置く必要があります」と述べました。
ブランドンも加わり、「私たちは毎月数百テラバイトのデータを生成しています」と述べ、多くのエンジニアリングリーダーが発見していることを謙虚に共有しました。データを生成するのは簡単ですが、すべてのデータソースをまとめて価値を高めるのははるかに困難です。
At Rescale私たちは量子コンピューティングの価値を認識しており、次のようなパートナーを追加しています。 イオンク 1,200以上のターンキーカタログ R&D アプリケーション。パネルでは、3D シリコン チップの開発や抵抗メモリなど、多くの有望な技術について議論されましたが、Rescale は、すべての人にとって最も差し迫った問題に焦点を絞り続けています。 データ管理.
Rescaleは、幅広いデータニーズに対応するデータ管理をサポートする新機能を段階的にリリースしてきました。 メタデータ管理 へ クラウドファイルストレージ システムです。そして私たちは減速するつもりはありません。
組織における AI と既存の HPC のバランス
パネルでは、テクノロジーから焦点を移し、人材と予算についても議論しました。従来のHPCユーザーへのサポートとAIへの投資のバランスをとることも重要なトピックであり、これらの領域間で戦略的にリソースを割り当てる必要性を強調しました。パネリストは、組織が予算上のプレッシャーを管理しながら、AIとHPCの両方を確実に実現する方法について洞察を共有しました。 AIとHPC 取り組みは十分なサポートを受けます。
アプライドマテリアルズのスリカント氏は、 Rescale Compute 明確な使用量ベースのチャージバック システムを実現し、組織が熱、機械、プラズマ、光学アプリケーションにわたる多様なワークロードのコンピューティング コストのバランスをとるのに役立ちます。このコストの透明性により、説明責任が強化され、チーム全体で最適なリソース使用率が確保されます。
結論
この専門家パネルによる議論が皆様にとって洞察に富み、興味深いものとなり、何か新しいことを学んでいただければ幸いです。
さらに詳しく知りたい、SC24 スーパーコンピューティングの専門家が自らの言葉で語るアドバイスを聞きたい方は、以下の SC24 パネル ディスカッション全編をご覧ください。
時には、最も洞察力のある議論は、司会者として私たちが用意した質問からではなく、参加者の好奇心から生まれることもあります。 私たちのコミュニティSC24 では、HPC に関する会話はパネルの質疑応答をはるかに超えて、廊下、即席のミーティング、深夜の議論にまで広がりました。私たちにとって、HPC は単なる話題ではなく、情熱なのです。
私たちを参照してください イベントページ今後のイベントについては、AIとHPCに関するご質問がございましたら、ぜひお問い合わせください。 こちら.
