| |

Rescale, Amazon EC2 Hpc7g 인스턴스에서 Ansys LS-DYNA 및 Ansys Fluent 워크로드 배포 자동화

Rescale은 Arm 기반 HPC 솔버의 비용 대비 성능 최적화를 제공합니다.

이제 본격적으로 Rescale 플랫폼을 통해 Arm 기반 AWS Graviton3E로 구동되는 Amazon EC2 Hpc7g 인스턴스에서 Ansys LS-DYNA 및 Ansys Fluent 워크로드를 실행할 수 있게 되었다는 기쁜 소식을 전합니다.

Amazon EC2 Hpc7g 인스턴스는 긴밀하게 결합된 컴퓨팅 및 네트워크 집약적인 고성능 컴퓨팅(HPC) 워크로드를 위해 특별 제작된 새로운 인스턴스 유형으로, 커스텀 64비트 Arm 기반 프로세서가 포함되어 있습니다. Arm 기반 아키텍처는 일반적으로 더 많은 코어 수와 와트당 성능, 그리고 열 발생이 적고 방열 성능이 향상된 RISC(축소 명령어 집합 컴퓨팅)에 힘입어 에너지 효율이 높은 것으로 알려져 있습니다. 

Rescale의 워크플로우 자동화 기능과 사용자 친화적인 인터페이스를 통해 Ansys 시뮬레이션을 실행하면 클라우드에서 HPC를 관리할 때 종종 직면하는 많은 복잡성 제거에 유익합니다. Rescale은 FedRAMP, ITAR 등의 외부 인증 및 규정 준수 노력, 데이터 암호화, 계정 설정 및 관리 제어 등 고객의 개인 정보 보호 및 데이터 기밀성 보장을 위해 설계된 다양한 조치를 취함으로써 데이터 보안 위험을 완화하고 있습니다. 

쉽게 말해 앞으로는 Rescale을 통해 클라우드 컴퓨팅 리소스의 탄력성을 활용하면서 Hpc7g 인스턴스에서 Ansys LS-DYNA 및 Ansys Fluent 워크로드를 실행하는 데 사용하는 인프라에 대해서만 비용을 지불할 수 있는 옵션이 제공됩니다. 사용자는 연구와 혁신에만 집중할 수 있으며, 복잡하고 안전한 IT 시스템 관리는 Rescale이 지원합니다.

Arm 기반 아키텍처에서 HPC 워크로드 실행의 이점:

  • 비용 : Hpc7g 인스턴스는 컴퓨팅 집약적인 HPC 워크로드를 위해 이전 세대 AWS Graviton 기반 인스턴스에 비해 최대 70% 더 나은 성능과 최대 3배 더 나은 가격 대비 성능을 제공합니다. 
  • 에너지 효율: Arm 프로세서는 에너지 효율적인 성능과 전력 소비 감소를 제공하여 전력 사용량을 줄여줍니다. 이를 통해 기업은 탄소 배출량을 줄여 보다 친환경적인 컴퓨팅 인프라를 구축할 수 있습니다.

Arm 기반 아키텍처에서 HPC 워크로드 실행 시 고려해야 할 사항: 

  • 올바른 하드웨어 선택: Arm 기반 HPC 시스템용 하드웨어를 선택할 때는 서로 호환되고 HPC 워크로드에 최적화된 구성 요소를 선택하는 것이 중요합니다.
  • Arm 프로세서용 소프트웨어 컴파일: Arm 프로세서용으로 사전 컴파일되지 않은 HPC 소프트웨어를 사용하는 경우 직접 컴파일해야 합니다. 이 과정은 복잡할 수 있지만 도움을 받을 수 있는 다양한 리소스가 있습니다.
  • 클라우드 플랫폼의 사용: Rescale과 같은 클라우드 플랫폼을 사용하면 Arm 기반 프로세서에서 HPC 워크로드를 더 쉽게 실행할 수 있습니다. 클라우드 플랫폼은 다양한 Arm 기반 하드웨어 및 소프트웨어에 대한 액세스를 제공하며, HPC 워크로드에 필요한 복잡한 인프라와 소프트웨어 관리 측면에도 이점이 있습니다.

Rescale은 이러한 문제를 해결하는 데 도움을 줄 수 있는 플랫폼을 제공하여 Arm 기반 CPU에서 HPC 워크로드를 보다 쉽게 배포하고 관리할 수 있도록 지원합니다. Rescale 플랫폼에는 다음과 같이 가격 대비 성능 최적화를 위한 다양한 기능이 포함되어 있습니다:

  • 자동화된 프로비저닝 및 관리: Rescale은 Arm 기반 CPU에서 HPC 클러스터를 자동으로 프로비저닝하고 관리할 수 있어 시간과 리소스의 절약이 가능합니다.
  • 최적화된 소프트웨어 스택: Rescale은 성능 향상에 도움이 될 수 있는 Arm 기반 CPU에 사전 최적화된 소프트웨어 스택을 제공합니다.
  • 성능 모니터링 및 분석: Rescale은 HPC 워크로드의 성능을 모니터링하고 분석하는 도구를 제공해 성능 병목 현상을 식별하고 해결하는 데 도움을 줍니다.

Rescale의 HPC 엔지니어링 담당 부사장 Mulyanto Poort(물얀토 푸어트)는 "우리는 더 나은 부동소수점 성능과 더 많은 EFA 대역폭을 갖춘 Amazon EC2 Hpc7g 인스턴스에 대해 기대가 큽니다. Hpc7g 인스턴스의 더 나은 가격 대비 성능과 AWS Graviton 프로세서의 에너지 효율성이 결합되어 전산 유체 역학(CFD) 및 다양한 실제 생산 HPC 워크로드에 어떤 영향을 미칠지 벌써부터 기대됩니다"라고 전하며, "Amazon EC2 Hpc7g 인스턴스의 도입은 고객이 탄소 발자국을 줄이면서 디지털 엔지니어링 노력을 더욱 가속화하는 데 도움이 될 것"이라고 설명했습니다.

Amazon EC2 Hpc7g 인스턴스에서 Ansys LS-DYNA 및 Ansys Fluent의 성능 벤치마킹  

Hpc7g 인스턴스는 현재 Rescale에서 Pectolite 코어타입으로 제공됩니다. AWS Graviton3E 인스턴스의 성능을 보여드릴 수 있도록 업계를 선도하는 두 가지 소프트웨어 패키지 Ansys Fluent와 Ansys LS-DYNA를 비교해 보았습니다. 유의미한 비교를 위해 이 두 가지 Arm 64 빌드 패키지의 성능을 이전 세대 Amazon EC2 C6gn AWS Graviton2 기반 인스턴스(Rescale에서 Palladium 코어타입에 해당)와도 비교했습니다. 

Ansys LS-DYNA는 비선형 구조 해석을 위한 암시적 및 명시적 유한 요소법(FEM) 시뮬레이션 도구로, 이는 완성차 산업에서 구조 설계 및 충돌 시뮬레이션에 가장 널리 쓰이는 시뮬레이션 방법 중 하나입니다. 

Ansys 수석 제품 관리자 Siddharth Shah(싯다르타 샤)는 최근 AWS Hpc7g 인스턴스 제품 페이지를 통해 "Ansys는 ARM 기반 AWS Graviton 프로세서로 구동되는 새로운 Amazon EC2 Hpc7g 인스턴스에서 LS-DYNA 솔버를 지원하게 되어 기쁘게 생각한다. 양사 솔루션을 사용하는 고객은 더 낮은 비용으로 컴퓨팅 성능을 크게 향상시킴과 동시에 에너지를 절약해 지속 가능성 목표를 달성하는 데 도움이 될 것으로 기대할 수 있다"고 말한 바 있습니다.

7만 개의 요소로 구성된 이른바 ‘캐러밴 대 캐러밴’ 테스트 모델을 사용, Pectolite(Amazon EC2 Hpc7g 인스턴스)와 Palladium(Amazon EC2 C6gn 인스턴스) 간의 성능이 크게 개선된 것을 확인한 LS-DYNA의 테스트는 Hpc3.2g 인스턴스에 대한 싯다르타의 생각이 옳았음을 입증합니다. 256코어에서는 반복시간이 40% 가까이 빨라졌습니다. 이러한 FEM 코드는 통상 스케일이 어렵지만, C6gn 인스턴스와 비교 시 병렬 효율성이 6% 정도 증가함으로써 이러한 까다로운 문제도 해결 시간을 단축할 수 있는 Pectolite(Hpc7g 인스턴스)의 능력을 보여주었습니다.

이러한 인스턴스의 성능이 뛰어난 주요 이유 중 하나는 AWS Graviton 3E 기반 EC2 인스턴스가 2세대 AWS Graviton2 기반 인스턴스에 비해 거의 35배 더 높은 부동소수점 성능을 제공하기 때문입니다. 또한 현 세대 Graviton3 인스턴스에 비해 최대 7% 더 빠른 벡터 명령어 세트 계산을 제공합니다. 순수한 컴퓨팅 성능 향상 외에도 Hpc5g 인스턴스는 DDR5 대비 50% 더 높은 메모리 대역폭을 제공하는 DDR4(더블 데이터 레이트 XNUMX) 메모리를 활용하는 최초의 인스턴스 중 하나입니다. 메모리 대역폭의 증가는 이러한 유형의 워크로드에서 CPU 병목 현상을 줄이는 데 도움이 됩니다.

그림 1 :

테스트한 다른 코드는 유체 시뮬레이션, 열전달, 혼합 및 다상 유동을 위한 업계 최고의 CFD 도구인 Ansys Fluent입니다. Ansys Fluent는 항공우주, 에너지, 자동차부터 제조, 제약에 이르기까지 전 세계 다양한 산업 분야에서 활용되고 있습니다. Ansys Fluent와 같이 긴밀하게 결합된 CFD 코드는 실행하기 위해 가장 많은 인프라가 필요한 HPC 워크로드 중 일부입니다.

우리는 F140 차량의 1M 셀 모델을 사용해 Ansys Fluent를 테스트했습니다. 예상대로 소규모 클러스터에서 Hpc7g 인스턴스의 CPU 및 메모리 대역폭이 향상되어 성능이 크게 향상되는 것을 확인할 수 있었습니다. 수천 개의 코어에서 지속적인 성능 향상과 강력한 확장이 이루어졌다는 사실은 매우 인상적이었습니다. Hpc7g 인스턴스는 45개 코어에서 2048%의 병렬 효율을 보이는 C6gn 인스턴스에 비해 75%의 반복속도 향상을 보여줍니다. 이는 Hpc7g 인스턴스가 가장 크고 까다로운, 긴밀하게 결합된 HPC 워크플로우에서도 효율적으로 확장할 수 있음을 보여줍니다.

그림 2 :

클라우드에서 이처럼 인상적인 병렬 확장 성능을 구현할 수 있었던 것은 AWS가 AWS Nitro System을 기반으로 하는 Elastic Fabric Adapter(EFA)를 통해 이룬 발전 덕분입니다. Nitro System은 호스트 머신에서 가상화 기능을 오프로드할 수 있게 했을 뿐만 아니라 SRD(스케일 가능하고 신뢰할 수 있는 데이터그램)와 기본 네트워크 암호화를 사용해 더욱 강력하고 지연 시간이 짧은 네트워킹과 같은 훨씬 더 고급 기능도 가능하게 했습니다.

Rescale의 새로운 Performance Profile 기능으로 벤치마크를 실행하면 직접 확인해 보실 수 있습니다.

Rescale 기반 Amazon EC2 Hpc7g 인스턴스 시작하기

SC23에서 컨설팅 세션을 예약하거나 Rescale 기반 Amazon EC2 Hpc7g 인스턴스의 2주 무료 트라이얼을 활용해보세요.

저자

  • 매트 니어먼

    Matt Nierman(매트 니어먼)은 Rescale의 수석 파트너 개발 매니저로서 Rescale 플랫폼을 구성하는 독립 소프트웨어 공급사들과 전략적 파트너십 개발 업무를 담당하고 있습니다. 매트는 18년 이상 기업용 IT 분야에 몸담았으며, 특히 지난 6년간은 엔지니어링 소프트웨어 도구에 집중하고 있습니다. 매트는 로욜라 대학교 퀸랜 경영대학원에서 MBA를 취득했습니다.

  • 크리스 랭글

    Chris Langel(크리스 랭글)은 Rescale의 선임 HPC 엔지니어링 매니저로 다양한 클라우드 아키텍처에 걸친 CAE 애플리케이션 성능 관련 업무를 맡고 있습니다. 앞서 크리스는 Siemens Gamesa Renewable Energy의 공기역학 그룹에서 풍력 터빈 블레이드의 CFD 분석 및 최적화에 관한 업무를 담당한 바 있습니다. 그는 캘리포니아대학교 데이비스 캠퍼스에서 기계 및 항공우주 공학박사 학위를, 캘리포니아 대학교 버클리 캠퍼스에서 기계공학 학사학위를 취득했습니다.

비슷한 게시물