| | | IT/HPC 관리

Rescale Maturity Index: 클라우드 및 멀티클라우드 운영의 안정성을 극대화하는 인텔리전스

클라우드 하드웨어의 성숙도는 비용, 성능, 안정성에 영향을 미칩니다. Rescale Maturity Index는 컴퓨팅 중심 혁신을 위한 경쟁 우위입니다.

오늘날 기술 분석가와 공급업체는 다중 클라우드 전략 벤더 종속에 대한 우려를 제기함으로써 일반적으로 언급되는 이유로는 비용 효율성, 비즈니스 연속성, 전반적인 운영 탄력성 등이 있습니다. 그러나 많은 기업은 유연성과 다양한 아키텍처 선택이라는 가장 큰 이점 중 하나를 놓치고 있을 수 있습니다.

현대 과학 연구, 엔지니어링, 제품 연구개발 에 따라 고성능 컴퓨팅, 특히 데이터 및 컴퓨팅 집약적인 애플리케이션을 구동하는 고성능의 특수 하드웨어입니다. 이러한 R&D 맥락에서 최신 칩 아키텍처로 전환할 수 있는 유연성을 갖는 것이 우수한 제품을 시장에 먼저 출시하는 열쇠가 될 수 있습니다. 탄력성과 연속성은 실제로 클라우드 및 멀티 클라우드 전략의 큰 이점이지만, 점점 더 많은 조직이 멀티 아키텍처 유연성의 중요한 가치를 깨닫고 있습니다. 

클라우드 서비스 제공 업체 (CSP)는 이제 놀라운 속도로 새로운 컴퓨팅 칩 아키텍처를 도입하고 있습니다. 일반적으로 다음과 같은 하드웨어 공급업체와의 파트너십을 통해 인텔, AMD, 팔 및 NVIDIA, CSP는 분기마다 새롭고 더 나은 칩 아키텍처를 발표하고 있습니다. 또한 클라우드 제공업체는 자체 컴퓨터 칩을 만들기 시작하여 선택할 수 있는 칩의 종류가 더욱 다양해졌습니다. 

멀티클라우드, 멀티아키텍처의 약속과 도전 

최신 기술을 적극적이고 지속적으로 채택하는 기업의 경우 애플리케이션 성능 향상과 비용 절감이 주요 경쟁 우위가 될 수 있습니다. 이제 모든 클라우드 제공업체가 다양한 아키텍처 옵션을 제공하므로 이 접근 방식은 멀티 클라우드 및 단일 클라우드 운영 모두에 점점 더 관련성이 높아지고 있습니다. 

그러나 대부분의 조직은 효과적인 아키텍처 채택의 복잡성으로 인해 지속적인 아키텍처 채택을 달성하는 데 어려움을 겪고 있습니다. 그 이면에는 새로운 아키텍처의 온보딩, 테스트 및 배포에 여러 단계가 있지만, 가장 큰 장애물은 사용 가능한 점점 더 다양한 하드웨어 옵션 중에서 선택하는 방법을 모른다는 것입니다. 

대부분의 경우 조직은 벤치마킹을 실시하다 최상의 하드웨어 구성을 결정하기 위해 새로운 소프트웨어를 온보딩할 때. 벤치마킹은 해당 시점의 소규모 아키텍처 집합의 성능을 측정하는 데 유용하지만 새로운 아키텍처의 지속적인 릴리스나 그 규모 및 지역적 가용성을 고려하지 않습니다. 

성숙도 인텔리전스: Rescale이 고객이 클라우드 투자에서 더 많은 것을 얻을 수 있도록 돕는 방법

칩 선택이 폭증하는 가운데 주어진 워크로드에 가장 적합한 하드웨어 및 소프트웨어 구성을 선택하는 것이 그 어느 때보다 중요합니다. 성숙도(클라우드의 특정 아키텍처 또는 하드웨어 구성의 안정성과 규모를 측정하는 기준)는 특히 최신 및 최고의 아키텍처를 활용하고 최고의 비용 성능 가능한. 성숙도를 고려하지 않으면 클라우드 인프라 및 소프트웨어 라이선스에 대한 과도한 지출이 발생할 수 있습니다. 일부 조직에서는 성숙도 추적의 이점을 깨닫기 시작했지만, 다른 조직에서는 어디서부터 시작해야 할지 확신하지 못했습니다.

Rescale을 사용하면 조직은 당사의 하이퍼스케일 및 전문 CSP 네트워크에서 세계 최대 규모의 아키텍처 선택에 액세스할 수 있습니다. 선택의 폭이 넓기 때문에 애플리케이션 요구 사항에 적합한 아키텍처를 선택하는 것이 중요합니다. 성숙도를 철저히 이해하면 고객이 클라우드 운영에서 더 많은 가치를 얻을 수 있습니다. 내부적으로 Rescale은 각 CSP 및 지역 전반에 걸쳐 각 아키텍처의 생산 준비 상태, 서비스 수준 보증 및 용량의 종합 점수인 성숙도 지수를 통해 이러한 문제를 추적합니다. Rescale은 새로운 칩이 시장에 출시되고 오래된 칩이 사용되지 않음에 따라 이 지수를 지속적으로 유지합니다.

성숙도가 컴퓨팅 인텔리전스의 광범위한 프레임워크에 어떻게 적용되는지

Rescale의 성숙도 지수는 조직에 클라우드 제공업체와 아키텍처 옵션을 비교할 수 있는 일관된 프레임워크를 제공하지만 이는 더 광범위한 인텔리전스 프레임워크의 일부입니다. 리스케일의 인텔리전트 컴퓨팅 프레임워크 성숙도, 성능, 비용, 지속가능성이라는 XNUMX가지 복합 지표로 구성됩니다. 특정 고객의 목표에 따라 이 인텔리전스를 사용하여 결정을 내리고 이를 달성하기 위한 정책을 설정할 수 있습니다. 

지능형 컴퓨팅 프레임워크 재조정 성숙도, 성능, 비용, 지속가능성의 4가지 지표로 구성

이 인텔리전스 프레임워크는 Rescale에서 각 아키텍처 구성의 점수를 매기고 권장하는 방법을 관리합니다. 이러한 구성을 Rescale이라고 합니다. 코어타입, 점수를 매기기 전에 최적의 애플리케이션 성능을 위해 사전 구성, 벤치마킹 및 조정합니다. 점수를 매긴 후, Rescale의 독점 컴퓨팅 추천 엔진(CRE)은 이러한 인텔리전스를 활용하여 사용자가 새로운 소프트웨어를 설정하거나 새로운 아키텍처가 출시될 때 가장 적합한 아키텍처 구성을 추천합니다. 

하드웨어에서 올바른 데이터를 찾는 것이 왜 그렇게 어려운가요?

칩 제조업체가 AMD의 EPYC Genoa, Intel Icelake 또는 NVIDIA H100과 같은 새로운 아키텍처를 출시할 때 일반적으로 특정 지역의 단일 클라우드 공급자로 시작합니다. 일반적인 시나리오는 클라우드 공급자 A가 프로세스 초기에 칩 제조업체와 긴밀히 협력했기 때문에 다른 클라우드 공급자보다 앞서 새로운 칩 유형을 채택하는 것입니다. 또한 클라우드 공급자 A는 미국 단일 지역에 이 서비스를 도입한 후 18개월 후에 유럽으로, XNUMX개월 후에 일본으로 확장했습니다. 따라서 새로운 칩 유형을 사용하는 클라우드 서비스 제공의 성숙도는 일반적으로 지역에 따라 일관되지 않습니다. 

그러나 Rescale 고객은 Rescale 플랫폼에서 이 정보에 실시간으로 액세스할 수 있습니다. 또한 리스케일은 정성적인 성능, 성숙도, 역량에 대한 철저한 평가를 수행합니다. 이를 통해 사용자는 다양한 클라우드 서비스 제공업체의 제품을 비교할 수 있습니다. Rescale은 새로운 아키텍처가 시장에 출시되는 즉시 이를 이해하기 위해 상당한 노력을 투자합니다. 이는 다음에 대한 인텔리전스를 통해 자동화되고 향상됩니다. 클라우드 인프라 플랫폼의 사용 패턴 전반에 걸쳐 수집하는 애플리케이션 요구 사항입니다. 

Rescale의 장점: 고객에게 최첨단 기술을 더 빠르게 제공

리스케일의 HPC 하드웨어 소프트웨어 전문가는 강력한 자동화와 업계 경험을 활용하여 모든 관련 아키텍처에 대한 철저한 평가를 수행합니다. 대부분의 조직에서는 동일한 프로세스에 비용이 많이 들며 전략적 프로젝트와 혁신 노력에서 자원을 전환하는 초기 작업(및 지속적인 작업)에 수개월이 소요됩니다. Rescale의 성숙도 평가 프로세스의 XNUMX단계를 살펴보겠습니다.

인프라 제품이 대중에게 광범위하게 제공되기 전에 Rescale은 이미 고객이 사용할 수 있는 새로운 아키텍처를 온보딩, 평가 및 준비하기 위해 노력하고 있습니다. 이러한 노력에는 다음이 포함됩니다.

  • HPC에 가장 적합한 새로운 아키텍처 결정 AI및 기타 R&D 애플리케이션.
  • CSP에서 인프라에 대한 조기/미리 보기 액세스를 요청합니다.
  • 내부 테스트와 마이크로 벤치마크를 실행하여 아키텍처 성능이 제조업체의 광고 사양을 충족하는지 확인합니다.
  • 애플리케이션별 벤치마크 및 튜닝을 실행하고 운영 체제, 소프트웨어 버전 및 기타 변수와 같은 여러 변수를 철저히 평가합니다. MPI 최상의 성능을 보장하는 버전입니다. 이 단계에서 Rescale은 종종 CSP, 소프트웨어 및 하드웨어 공급업체와 직접 협력합니다. Rescale 고객은 이러한 새로운 서비스에 대한 초기 베타 액세스 권한을 가질 수도 있습니다.

내부 평가가 완료되면 새로운 아키텍처가 일반 고객에게 출시됩니다. 성숙도를 측정하는 Rescale의 지속적인 활동은 다음과 같습니다. 

  • GA 아키텍처가 Rescale의 고유한 서비스 수준 보증(SLA)을 충족하는지 확인합니다. SLA는 제출된 작업이 성공적으로 완료(높은 기준)되도록 보장합니다. 이는 아키텍처가 사용 가능하고 소프트웨어 요구 사항을 충족할 만큼 안정적이어야 함을 의미합니다. 
  • 다양한 지역에서 광범위하게 사용할 수 있는 적절한 규모(용량)를 보장합니다. 컴퓨팅과 더 큰 워크로드 실행에 대한 수요가 증가함에 따라 Rescale을 사용하면 조직은 수십만 개의 코어와 수백만 개의 작업에 걸쳐 병렬 컴퓨팅을 수행할 수 있습니다. 

Coretypes가 고객에게 출시된 후에도 Rescale은 다음을 통해 아키텍처의 가용성과 안정성을 계속 모니터링합니다.

  • Rescale 이외의 서비스 문제에 대해 글로벌 클라우드 인프라 네트워크를 모니터링합니다.
  • 최적의 가치를 제공하지 않거나, 안정성 문제가 있거나, 더 이상 지원되지 않는 노후화된 아키텍처를 단계적으로 폐지(더 이상 사용하지 않음)합니다. 

“우리는 고객의 특정 R&D 워크로드에 대해 동급 최고의 성능과 효율성을 제공하는 데 열정을 쏟고 있습니다. 우리는 지속적으로 새로운 아키텍처를 평가, 테스트 및 조정하고 고객을 위한 사전 기반 작업을 수행하고 있습니다. Rescale 플랫폼의 자동화 및 인텔리전스와 결합된 당사의 사내 HPC 전문 지식은 고객이 최고의 가치를 얻을 수 있도록 보장합니다. HPC 투자로부터. "

– Radhika Gundavelli, Rescale HPC 엔지니어링 관리자

Rescale 성숙도 지수에 따른 고객 결과

컴퓨팅 환경이 얼마나 역동적일 수 있는지 설명하기 위해 Rescale의 성숙도 지수가 고객이 R&D 노력을 지원하기 위해 HPC 인프라에 대해 최선의 결정을 내리는 데 어떻게 도움이 되었는지에 대한 몇 가지 예를 소개합니다.

  • A 생명 과학 유전체학 분석 및 진단을 수행하는 실험실이 전 세계적으로 존재하는 고객은 비용에 매우 민감하면서도 빠른 결과를 얻는 데 집중해야 했습니다. 맞춤형 애플리케이션 요구 사항을 기반으로 Rescale은 새로운 솔루션을 식별할 수 있었습니다. Arm 아키텍처 향상된 신뢰성과 비용 성능을 제공하여 비용을 낮추고 신뢰성을 높게 유지하는 데 도움이 됩니다. 
  • An 항공 우주 제조업체는 작동을 위해 더 많은 전력이 필요했습니다. 전산 유체 역학 (CFD) 분석. Rescale의 평가에 따라 회사는 여러 클라우드에 걸쳐 대규모로 AMD EPYC Milan 프로세서로 전환했으며, 이는 더 높은 안정성, 더 낮은 비용(약 20% 절감) 및 더 높은 성능을 모두 제공했습니다. 이러한 새로운 아키텍처의 확장 및 병렬 효율성을 통해 제조업체는 1000개 이상의 코어에서 각 CFD 작업을 실행할 수 있으므로 새로운 설계를 개발하고 테스트하는 능력이 크게 향상됩니다. 또한 Rescale의 지능형 자동화를 통해 고객은 수요가 많은 Milan 프로세서를 사용할 수 없을 때 AMD EPYC Rome 프로세서로 원활하게 전환할 수 있습니다. (Rescale 고객은 Coretype 세트 기능을 통해 이 기능을 활성화할 수 있습니다).
  • 한 자동차 제조업체가 다음으로 전환하는 것을 조사했습니다. GPU 대신 CPU 전산유체역학(CFD) 솔버를 실행합니다. GPU 가속은 기존의 많은 CAE(컴퓨터 지원 엔지니어링) 소프트웨어를 최대 10배까지 가속화할 수 있는 잠재력을 가지고 있습니다. 이 고객의 경우 스위치를 통해 비용 대비 성능이 약 30% 향상되었으며 R&D 주기도 크게 단축되었습니다. GPU에 대한 전 세계적인 수요와 조직의 엄격한 지리적 규정 준수 요구 사항에도 불구하고 Rescale은 요구 사항을 충족하는 클라우드 서비스 제공업체와 칩 아키텍처를 찾을 수 있었습니다.

이제 알았으니 다음에는 무엇을 달성할 것인가?

여기까지 오셨다면 아마도 하드웨어 성능에 대한 우리의 열정과 더 중요하게는 이것이 업계 혁신에 어떤 의미를 갖는지 공유하실 것입니다.

칩 성능 및 성숙도에 대한 모든 정보는 새롭거나 복잡할 수 있지만 이 메시지는 여러분을 위한 것입니다. 우리는 클라우드가 혁신을 더 간단하고 빠르게 만들어야 한다고 믿습니다. 이것이 바로 우리가 다음을 포함하여 고성능 컴퓨팅의 중요한 측면을 자동화하는 이유입니다. 하드웨어 인프라 성숙도 평가. 스프레드시트를 시작하거나 여러 비즈니스 분석가의 도움을 받을 필요가 없습니다. 저희가 도와드리겠습니다.

새로운 최첨단 아키텍처 대안이 궁금하거나 클라우드 비용을 절약하고 싶다면 몇 가지 권장 사항을 기꺼이 제공해 드리겠습니다. HPC 전문가에게 문의하세요. 우리는 귀하의 컴퓨팅 목표에 대해 듣고 우리가 어떻게 도울 수 있는지 논의하기를 기대합니다.

저자

  • 개릿 밴리

    Garrett VanLee(개릿 밴리)는 Rescale의 제품 마케팅을 이끌며 산업 분야 전반의 혁신을 위해 고객들과 긴밀히 협력하고 있습니다. 그는 고객 성공 사례와 연구 혁신 및 Rescale 소속 엔지니어, 과학자, IT 전문가들의 모범 사례를 공유하며 다른 조직을 돕는 데서 큰 보람을 찾습니다. 개릿은 현재 슈퍼컴퓨팅, HPCAI 시뮬레이션 모델의 융합과 해당 동향이 과학 및 산업 분야의 혁신적 발견을 어떻게 주도하고 있는지에 집중하고 있습니다.

비슷한 게시물