니켈 또는 철: Rescale 플랫폼에서 CONVERGE™ 작업에 더 나은 것은 무엇입니까?

주행거리계-회색
Convergent Science의 CONVERGE™는 엔진 설계 및 시뮬레이션 분야에서 가장 인기 있는 전산유체설계(CFD) 시뮬레이션 프로그램 중 하나입니다. 병렬 처리 기능은 MPI를 활용하여 멀티코어 및 다수 코어 환경에서 작업 실행 속도를 효과적으로 높입니다. 사용 가능한 모든 핵심 유형을 사용하여 Rescale의 클라우드 시뮬레이션 플랫폼에서 필요에 따라 CONVERGE™ 작업을 실행할 수 있습니다. 이 블로그 게시물에서는 니켈 및 철 HPC 코어 유형의 성능과 비용을 비교하겠습니다. 이것이 Rescale에서 자체 CONVERGE™ 시뮬레이션을 실행하기 위한 핵심 선택 가이드 역할을 할 수 있기를 바랍니다.

테스트 환경

니켈(HPC+) 철(HPC InfiniBand)
어플리케이션 Linux용 CONVERGE™ 2.2 Windows용 CONVERGE™ 2.2
MPI 맛 Linux용 hp-mpi 마이크로소프트 MPI 4.2
코어타입 니켈
계산 6.75 CU 6.75 CU
메모리(GB/코어) 3.8 GB 3.8 GB
스토리지(GB/코어) 32 GB 32 GB
네트워크 10 Gb / s RDMA InfiniBand(40Gb/s)
가격 $0.15(/코어/시간) $0.30(/코어/시간)

표의 처음 두 행은 우리가 선택한 소프트웨어 환경을 나타내고 나머지 행은 하드웨어 사양을 나타냅니다. 대부분의 하드웨어 사양은 Nickel과 Iron이 유사하지만 주목할만한 차이점 중 하나는 네트워크입니다. 니켈의 대역폭은 10Gb/s에 불과한 반면, Iron 코어 유형의 대역폭은 40Gb/s입니다. 이는 여러 노드에서 실행되는 작업에 상당한 이점이며, 이것이 두 코어 유형 간에 50% 가격 차이가 나는 주된 이유라고 생각합니다. .

벤치마킹 작업

우리가 선택한 벤치마크 직업은 Convergent Science에서 제공하는 것입니다. 이것은 축구장의 휘어지는 샷 현상을 모델로 하며, 공중에서 공이 "굴곡"되는 데 필요한 것이 무엇인지 보여주기 위한 것입니다(상세 설명). 시뮬레이션은 0.1초의 시간 간격을 사용하여 축구공의 움직임을 0.001초로 모델링합니다. 모델은 처음에 81,576개의 노드로 구성됩니다.

소규모 클러스터 성능-비용 비교

첫 번째 라운드에서는 두 코어 유형 모두에 대해 각각 16개, 32개, 64개 코어에서 클러스터 성능을 테스트했습니다. 결과는 아래 표에 나와 있습니다.

16 코어 32 코어 64 코어
니켈(HPC+) 타임스) 2611.39 2086.38 1857.28
가격($/시간) 2.40 4.80 9.60
철(HPC InfiniBand) 타임스) 3671.327635 2709.023048 2020.854733
가격($/시간) 4.80 9.60 19.20

표에서 최대 64개의 코어를 포함하는 Nickel 클러스터가 Iron보다 성능이 더 좋고 비용도 저렴하다는 것을 알 수 있습니다. 따라서 소규모 클러스터에서 소규모 작업을 실행해야 하는 경우 니켈이 더 나은 선택일 수 있습니다.

중형 클러스터 성능-비용 비교

두 번째 라운드에서는 두 코어 유형 모두에 대해 128개 및 256개 코어 클러스터에서 중간 규모 클러스터 성능을 테스트했습니다. 그리고 그 결과는 아래 표에 나와 있습니다.

128 코어 256 코어
니켈(HPC+) 타임스) 2973.34 /
가격($/시간) 19.20 38.40
철(HPC InfiniBand) 타임스) 1434.00 1277.43
가격($/시간) 38.40 76.80

코어 수가 128개에 도달하면 니켈 클러스터의 런타임이 급격히 증가한 것을 확인할 수 있습니다. 256개 코어 클러스터의 경우 128개 코어의 경우보다 시간이 더 오래 걸리는 것을 확인하고 작업을 종료했습니다. 이는 통신 오버헤드와 느린 상호 연결로 인해 발생합니다. 반면에 Iron 클러스터의 성능은 관련 코어 수에 따라 꾸준히 증가합니다. 따라서 Iron은 128개 이상의 코어에서 실행될 때 Nickel 클러스터보다 성능이 뛰어납니다.

결론
위 그래프에서 코어가 64개 미만인 클러스터의 경우 CONVERGE™ 작업의 경우 Nickel이 더 빠른 반면, 코어가 128개 이상인 중간 규모 클러스터의 경우 Iron이 더 나은 선택임을 알 수 있습니다. 더 중요한 것은 작업을 더 빠르게 실행하면 주문형 라이센스 비용을 더 많이 절약할 수 있다는 것입니다.

비슷한 게시물