올바른 HPC 클라우드 아키텍처 선택의 중요성에 대한 기사의 소셜 카드입니다.
| | | |

요구 사항에 적합한 HPC 클라우드 아키텍처 찾기

고성능 클라우드 서비스의 급속한 확장과 칩 아키텍처의 전문화로 인해 조직은 옵션이 늘어나지만 복잡성도 증가하고 있습니다.

지금은 디지털 R&D에 있어서 정말 놀라운 시기입니다. 온프레미스 데이터 센터의 오래된 제약은 클라우드 기반 슈퍼컴퓨팅 서비스의 사실상 무제한의 탄력적인 용량으로 대체되고 있습니다. 더 이상 연구원과 엔지니어는 제한적이고 매우 가치 있는 리소스에 액세스하기 위해 줄을 서서 기다릴 필요가 없습니다.

하지만 이는 선택의 여지가 많다는 의미이기도 합니다. 어떤 클라우드 제공업체를 이용해야 할까요? 단일 클라우드여야 할까요, 아니면 멀티 클라우드여야 할까요? 어떤 고성능 컴퓨팅(HPC) 서비스가 우리에게 가장 적합합니까? 어떤 칩 아키텍처를 사용해야 합니까?

그리고 중요한 것은 HPC 클라우드 서비스와 이를 지원하는 칩 아키텍처가 빠르게 발전하고 있다는 것입니다. 칩의 종류와 수가 폭발적으로 늘어나고 있습니다. 이는 HPC 사용자에게 수많은 옵션을 제공하지만 상당한 복잡성을 야기하기도 합니다.

좋은 뉴스? Rescale은 칩 선택 문제를 단순화하기 위해 성능 프로필을 만들었습니다. 이러한 추세와 Rescale이 어떻게 도움이 될 수 있는지 자세히 살펴보겠습니다.

HPC의 새로운 시대

HPC 클라우드 서비스는 실제 물리학의 복잡한 모델과 시뮬레이션을 실행하기 위한 디지털 R&D의 급속한 성장에 힘입어 지난 XNUMX년 동안 수요가 급증했습니다. HPC는 복잡한 컴퓨팅 문제를 해결하기 위해 전략적으로 풀링된 컴퓨팅, 애플리케이션, 스토리지 및 네트워킹 리소스의 에코시스템을 포함합니다.

클라우드 기술은 HPC 혁명의 최전선에 있으며, 업계 전반의 조직이 기존 데이터 센터 환경이 제공할 수 있는 것보다 뛰어난 데이터 처리 능력을 활용할 수 있도록 지원합니다. 클라우드의 HPC는 R&D 프로그램의 디지털 혁신을 추진하려는 조직에 전례 없는 수준의 성능, 효율성 및 유연성을 제공합니다.

최근 몇 년 동안 클라우드 채택이 기하급수적으로 증가했으며, 기업은 IT 예산의 30% 이상을 클라우드 인프라에 지출했습니다. 이러한 성장에는 그럴 만한 이유가 있습니다. 클라우드는 공유 리소스에 대한 온디맨드 액세스, 고가의 사내 서버 장비 제거로 인한 비용 절감 등 비교할 수 없는 이점을 제공합니다.

특수 칩의 성장

클라우드 기반 HPC 서비스의 확장과 함께 특수 칩의 엄청난 성장은 R&D를 위한 고성능 컴퓨팅을 변화시켜 특정 워크로드에 맞게 조정된 슈퍼컴퓨팅 성능을 제공하고 있습니다. 특수 칩은 범용 중앙 처리 장치(CPU)의 비효율성을 해결하는 것을 목표로 합니다. .

이러한 새로운 칩은 GPU(그래픽 처리 장치), FPGA(필드 프로그래밍 가능 게이트 어레이), ASIC(주문형 집적 회로) 등 다양한 형태로 제공됩니다. 인공 지능(AI), 기계 학습(ML), 빅 데이터 분석과 같은 특정 작업을 위한 계산을 가속화하도록 설계되었습니다.

특수 칩의 확산이 성능을 주도하고 있습니다. 무어의 법칙은 지난 XNUMX년 동안 평평해졌습니다. 이는 기존 칩이 컴퓨터 산업 초기만큼 빠르게 성능이 향상되지 않았다는 것을 의미합니다.

그 결과, 시장은 속도, 비용, 에너지 효율성 측면에서 새로운 효율성을 얻기 위해 전문적인 반도체 컴퓨팅 아키텍처로 전환하고 있습니다. 칩 아키텍처의 다양성이 폭발적으로 증가하고 있습니다. 특수 칩의 수는 지난 1,000년 동안 10% 증가했습니다. 예를 들어 2020년에는 400개 이상의 새로운 칩 유형(코어 유형 및 인스턴스)이 시장에 출시되었습니다. 현재 1,450개 이상의 다양한 칩 유형(코어 유형 및 인스턴스)이 있으며 이는 가속화되고 있습니다.

무어의 법칙이 무너지면서 업계는 특수 칩으로 전환했습니다.
데이터 집약적인 R&D 컴퓨팅 작업의 성능을 향상합니다.

이러한 놀라운 성장은 Arm 아키텍처의 급속한 채택과 칩 제조 방식에 대한 새로운 패러다임에 의해 촉진됩니다. AWS, Microsoft, Google과 같은 회사는 모두 클라우드 운영을 지원하기 위해 자체 칩을 만들었습니다.

중요한 점은 이러한 특수 칩이 특정 컴퓨팅 작업을 위해 설계되었다는 것입니다. 한 칩은 병렬 작업에 탁월한 반면 다른 칩은 단일 스레드, 데이터 집약적인 계산 작업에 가장 빠른 속도를 제공할 수 있습니다. 그리고 이들 중 어느 것도 모든 작업과 모든 작업 부하에 대한 최선의 선택이 될 수 없습니다.

예를 들어, 전산 유체 역학 (CFD) 또는 유한요소해석 (FEA) 시뮬레이션, 어떤 소프트웨어를 실행할 예정입니까? 그들은 다르게 작동할 것입니다. 도입하는 각 변수는 주어진 작업에 최적의 성능을 제공하는 다른 칩을 생성하게 됩니다.

이러한 장단점을 자세히 살펴보겠습니다. 올바른 칩 선택 올바른 응용 프로그램과 계산 작업을 수행하는 것은 실제로 성능, 비용 및 에너지 효율성에 큰 차이를 만듭니다.

R&D 컴퓨팅 요구 사항에 적합한 칩 아키텍처 선택

살펴볼 첫 번째 사용 사례는 시뮬레이션 실행 시간을 최적화하는 것입니다. 올바른 하드웨어를 선택함으로써 사용자는 시뮬레이션에 필요한 리소스를 할당하여 새로운 계약을 성사하기 위해 새로운 장비를 설계하는 자동차 부품 제조업체와 같이 시간이 중요한 요소일 때 시뮬레이션을 더 빠르게 실행할 수 있습니다.

또는 시뮬레이션 비용 절감을 고려할 수도 있습니다. 올바른 하드웨어를 선택함으로써 사용자는 시뮬레이션을 실행하는 데 필요한 소프트웨어 라이센스 시간을 최소화할 수 있으므로 시뮬레이션 실행에 드는 전체 비용을 줄일 수 있습니다.

이는 예산이 제한된 경우 특히 유용할 수 있습니다. 오늘날과 같은 경제 시대에 조직은 그 어느 때보다 비용에 더 민감해야 합니다. 클라우드 비용을 제어하려면 더 빠른 하드웨어로 총 사용 시간을 줄이는 것이 매우 유리할 수 있습니다.

세 번째 사용 사례는 스케일링 시뮬레이션입니다. 시뮬레이션이 확장되면 하드웨어에 따라 성능이 달라집니다. 특히 여러 클러스터에서 실행해야 하거나 더 많은 메모리가 필요한 사용 사례에서는 더욱 그렇습니다.

이 세 가지 사용 사례는 고성능 컴퓨팅에 대해 가능한 모든 R&D 사용 사례 중 극히 일부에 불과합니다. 그리고 대부분의 상황에서는 이 세 가지 요구 사항이 모두 혼합됩니다.

가장 빠르거나 가장 저렴하거나 가장 큰 규모만을 원하는 것은 아닙니다. 그리고 종종 이는 비용 대비 성능의 균형에 관한 것입니다. 어떤 클라우드 서비스의 칩이 혁신 노력을 가속화하는 데 가장 도움이 될까요?

효과적인 벤치마킹을 방해하는 장애물

모든 HPC 아키텍처의 성능, 비용, 에너지 효율성 및 확장성을 이해하는 것이 중요합니다. 이러한 이해를 얻기 위해 조직은 전통적으로 특정 하드웨어를 벤치마킹하고 애플리케이션에서 테스트할 수 있었습니다. 그러나 오늘날 새로운 칩이 시장에 빠르게 출시되면서 조직이 벤치마킹 속도를 따라잡기가 어려워지고 있습니다.

칩 시장은 빠르게 다양화되고 있다.

그리고 벤치마킹도 쉽지 않습니다. HPC 벤치마킹을 시작하는 데는 시간이 많이 걸리는 프로세스가 될 수 있습니다. 벤치마크를 설정하고 실행하려면 상당한 노력이 필요합니다. 이는 이를 수행하는 데 필요한 전문 지식이나 리소스가 부족한 조직의 경우 특히 어려울 수 있습니다.

오늘날 테스트할 최고의 하드웨어를 식별하는 것은 어렵습니다. 그리고 시스템 속성이 다르거나 CPU 메모리 스토리지나 네트워크가 다른 다양한 칩을 사용하고 싶을 수도 있습니다. 최신의 최고의 칩 유형이 출시되는 대로 따라가지 못한다면 뒤쳐질 수 있습니다.

또한 성능 문제의 근본 원인을 식별하는 것이 복잡할 수 있으므로 벤치마킹 결과를 분석하고 해석하는 것도 어렵습니다.

성능 프로필: 언제나 올바른 칩

따라서 R&D 작업에 적합한 HPC 하드웨어를 선택하는 데 벤치마킹이 중요하다면 조직은 무엇을 할 수 있습니까? 정답은 성능 프로필 재조정.

성능 프로필은 조직이 자신의 요구 사항에 가장 적합한 칩 유형을 즉시 알 수 있는 방법을 자동화합니다.

성능 프로필을 통해 조직은 특정 애플리케이션 및 컴퓨팅 작업에 대한 자체 성능 인텔리전스를 설정할 수 있습니다.

성능 프로필을 사용하면 올바른 코어 유형이나 필요한 코어 수를 선택할 때 더 이상 추측에 의존할 필요가 없습니다.

대신 성능 프로필을 사용하면 성능 맵을 사용하여 시뮬레이션을 위한 최적의 하드웨어 리소스 조합을 결정할 수 있습니다.

성능 프로필 맵

성능 프로필은 모든 하드웨어 아키텍처의 강점과 약점을 이해하는 데 필요한 모든 비교 데이터를 제공합니다. 그런 다음 전략적 요구 사항에 맞는 결정을 내릴 수 있습니다. 사용 사례에서 본 것처럼 고객마다 다르며 실제로 진행 중인 프로젝트에 따라 다릅니다.

성능 프로필을 사용하면 소프트웨어 및 모델의 실제 벤치마크를 기반으로 정보에 입각한 결정을 내릴 수 있으며 칩 유형, 클러스터 크기, 애플리케이션 유형 및 컴퓨팅 작업 간에 변수를 격리할 수 있습니다. 성능 프로필을 사용하면 어떤 HPC 인프라가 실제로 R&D 요구 사항에 맞게 작동하는지 알 수 있습니다.

청정 에너지 스타트업인 Kairos Power를 포함하여 많은 고객들이 이미 Rescale Performance Profiles의 혜택을 누리고 있습니다.

Kairos의 수석 유체 역학 엔지니어인 Brian Jackson은 "성능 프로필은 우리에게 매우 귀중한 기능이었습니다."라고 말했습니다. “우리 팀은 성능 프로필을 사용하여 우리가 사용해 온 칩 아키텍처에 비해 속도 대비 비용이 30% 향상된 두 가지 하드웨어 아키텍처를 발견했습니다. 앞으로 우리는 이러한 새로운 코어 유형을 활용할 것이며 이 새로운 Rescale 기능을 계속 사용하여 성능과 가치를 최적화할 것입니다.”

디지털 R&D 및 고성능 컴퓨팅을 위한 이 새로운 시대에는 클라우드 서비스 제공업체로부터 올바른 하드웨어 아키텍처를 선택하는 것이 무엇보다 중요합니다. 올바른 선택은 비용, 성능, 규모 및 지속 가능성에 큰 영향을 미칩니다. 잘못하면 혁신 노력이 느려지는 동시에 비용이 많이 들 수 있습니다. Rescale Performance Profiles로 현명하게 선택하세요.

Rescale Performance Profiles가 귀하의 조직이 R&D 요구 사항에 적합한 HPC 아키텍처를 선택하는 데 어떻게 도움이 되는지 자세히 알고 싶으십니까?웨비나 보기 “클라우드에서 워크로드 비용 및 성능 최적화” 나에 대한 자세한 내용은 성능 프로파일.

저자

  • 에릭 로그네

    그는 Rescale 플랫폼에서 시각화, 워크플로우, 협업, 성능 인텔리전스 및 ID 관리를 관리합니다. Rescale 이전에 Erik은 LiveRamp에서 데이터 마켓플레이스와 플랫폼 통합 제품을 운영했습니다. 경력 초기에는 Lockheed Martin의 위성 사업부에서 엔지니어로 근무했습니다.

비슷한 게시물