클라우드 HPC 플랫폼을 활용한 제작 복제

소프트웨어 및 하드웨어의 성능 향상에 따라 시뮬레이션을 활용하여 제품 개발 비용 및 기간을 단축할 수 있으나 기업의 규모와 무관하게 연산 자원은 한정적이며 R&D 또한 이런 제약조건에 맞추어 진행되는 경우가 많다. Rescale의 클라우드 HPC 플랫폼을 활용하면 제약조건을 뛰어넘어 다양한 조건에서의 시뮬레이션을 신속하게 수행할 수 있다.
Rescale 플랫폼 소개
Rescale의 ScaleX는 Public 클라우드의 연산 자원을 기반으로 제품 검증에 사용되는 다양한 소프트웨어가 설치되어 있으며 효율적으로 비용을 관리할 수 있도록 다양한 관리자 기능까지 제공하는 플랫폼으로 기업에서 필요한 HPC의 모든 것을 포함하고 있다.

▲Rescale ScaleX 플랫폼은 기업의 HPC 운용에 필요한 A to Z를 단일 플랫폼으로 제공

먼저 소프트웨어의 경우 대부분의 기업들은 제품 개발 시 다양한 소프트웨어를 사용하므로 상용 소프트웨어 외에도 오픈소스를 포함하여 600개 이상의 소프트웨어가 설치되어 있으며(개별 버전을 포함하면 약 10,000개) 사용자는 필요한 버전을 선택하여 사용할 수 있다. 아울러 최신 버전 혹은 기존에 설치되지 않은 소프트웨어의 경우 고객 요청에 따라 설치 가능하며, Rescale 자체적으로 기술지원을 통하여 오픈소스 및 인하우스 코드 또한 사용을 원할 경우 플랫폼에 통합할 수 있다.
다음으로 ScaleX 플랫폼의 강점인 하드웨어의 경우 멀티 클라우드를 지향하며 AWS, Azure, Google, Oracle 등 여러 클라우드 업체와 파트너십을 바탕으로 다양한 코어 타입(서버 유형)을 제공한다. 코어 타입들은 CPU clock speed, Memory/core, Storage/core, Interconnect를 기준으로 분류되며 추가로 고성능 GPU를 탑재한 코어 타입까지 포함하면 78개이며, 사용자는 진행하려는 시뮬레이션에 적합한코어 타입을 선택하여 사용할 수 있다.
아래 그림은 CFD 소프트웨어 중 하나인 STAR-CCM+의 벤치마크 테스트 사례이며, LeMans 1억 격자 모델을 Rescale 플랫폼에서 제공하는 5개의 코어 타입으로 코어 수에 따른 연산 성능 향상 효과를 평가한 결과이다.

▲Rescale 플랫폼 코어 타입별 코어 수에 따른 STAR-CCM+ 연산 성능 향상 효과

노드간 Interconnect 속도가 빠른 Carbon의 경우 1,000 코어 이상에서도 Scalability가 일정하게 유지되나, Interconnect 속도가 낮은 Onyx및 Ferrite같은 경우 각각 100, 400코어 부근부터 노드간 통신 지연에 따라 코어 수 증가에 따른 연산 속도 향상 속도가 저하되며, Emerald와 Luna는 중간 수준의 Interconnect 속도를 가지고 있어 800 코어 부근까지는 비교적 일정하게 Scalability가 유지되는 것을 확인할 수 있다.
다만 이런 경향성은 시뮬레이션 모델의 크기 및 소프트웨어의 병렬 처리 성능에 따라 달라질 수 있으므로 실제 현업에서 사용하는 모델로 성능 평가를 진행하여 최적의 코어 타입 및 적정 코어 수를 선정하는 과정이 필요하며, Rescale에서는 이런 과정에 대한 벤치마크 테스트 및 컨설팅을 제공하여 고객이 연산 비용을 효율적으로 사용할 수 있도록 지원하고 있다.
코어 타입의 특성에 따른 연산 성능 향상 효과 외에도 전산 자원을 신속하게 교체할 수 있다는 점 또한 Rescale 플랫폼에서 제공하는 장점 중 하나이다.

▲Rescale ScaleX 플랫폼을 활용하여 구형 아키텍쳐를 최신 아키텍쳐로 신속하게 전환

클라우드 업체는 2~3년 주기로 발표되는 최신 아키텍쳐의 클러스터를 지속적으로 도입하며, 클라우드 업체에 신규 클러스터가 도입되면 한 달 이내로 ScaleX 플랫폼에 통합되어 추가적인 계약 변경없이 최신 아키텍쳐를 사용할 수 있다. 이는 국내의 많은 기업들이 전산 장비 교체 주기를 5년으로 책정하거나 부분 전환 방식으로 교체하는 상황을 고려할 때 별도의 HPC 구성을 위한 복잡한 과정을 거치치 않고 신속하게 최신 아키텍쳐로 전환함으로써 보다 빠르게 시뮬레이션 업무를 수행할 수 있음을 의미한다.
Workflow 개선을 위한API 활용
앞서 Rescale 플랫폼 소개에서 워크로드에 적합한 코어 타입을 선정함으로써 시뮬레이션 속도를 향상시킬 수 있는 사례에 대하여 소개하였으며, 이어서 Rescale 플랫폼에서 제공하는 API를 활용하여 Workflow 개선을 통한 시뮬레이션 가속화 사례에 대하여 소개하고자 한다.
사용자의 요청에 따라 계산 노드를 생성하는 HPC 클라우드의 특성상 시뮬레이션 Workflow가 여러 단계로 나누어지거나Workflow 단계별 특성에 따라 멀티 코어의 활용이 제한되는 등 복잡해지는 경우 사용자 또한 시뮬레이션 수행에 필요한 작업에 소요되는 시간이 증가하게 되며 생산성 또한 저하되게 된다. 이를 보완하고자 사용자가 직접 웹 서버에 접속하여 파일을 업로드 및 다운로드하거나 작업의 생성 및 관리 등 Rescale 플랫폼에서 제공하는 기능들을 API로 구현해 놓았으며, 사용자는 이를 활용하여 여러 단계로 구성된 Workflow를 단순화하거나 보다 간편하게 비용 효율적인 시뮬레이션 Workflow를 구성할 수 있다.

▲Rescale 표준 아키텍쳐

본격적으로 API 활용 사례를 소개하기에 앞서 사용자가 Rescale 플랫폼을 활용하는 방식은 총 3가지로 가장 일반적인 경우는 웹페이지에서 직접 interactive하게 작업을 하거나, CLI 및 API를 활용하여 시뮬레이션과 관련된 모든 작업을 스크립트를 활용하여 자동화할 수 있다. CLI의 경우 API와 활용 목적은 동일하나 API의 기능을 간소화하여 응용프로그램 형태로 제공하는 방식으로 간단한 명령어를 사용하여 복잡한 Workflow를 구성하는데 한계가 있다. 마지막으로API의 경우 Python 혹은 curl을 활용할 수 있으나 데이터 전처리, 시뮬레이션 결과의 후처리 편의성 등을 고려하여Python 스크립트로 작성하는 경우가 많다.
활용 사례로 소개할 내용은 API를 활용하여 ANSYS HFSS 시뮬레이션의 Workflow의 일부 단계를 통합하여 비용 효율적인 방식으로 재구성한 사례이며 테스트 모델 및 1차 성능 비교 결과는 아래와 같다.

▲ANSYS HFSS 2-Step 시뮬레이션 모델

▲ANSYS HFSS on-prem vs Rescale 성능 비교 결과

테스트 모델을 활용하여 동일한 코어 수로 구성된 단일 노드간 비교 결과 on-premise(고객사 로컬) 대비 시뮬레이션 시간을 약 19% 단축하였으며, 3개의 노드를 사용 시 다중 노드를 활용하여 계산하는 Frequency Sweep 단계를 기존 9시간에서 6시간으로 단축하여 on-premise 대비 약 36% 단축하였다.
다만 HFSS 시뮬레이션 Workflow의 경우 각 단계별로 다음과 같은 특성이 있으며, 작업 생성 시 지정하는 코어 수가 연산 비용과 직결되는 부분임을 고려할 때 Workflow별로 전산 자원의 재구성이 필요하였다.

Initial Meshing: 단일 노드의 단일 코어만 사용
Adaptive Meshing: 단일 노드의 다중 코어 사용
Frequency Sweep: 다중 노드의 다중 코어를 사용하며, HPC 클러스터의 연산 자원을 최대로 활용

위와 같은 특성상 다중 노드를 생성하며 전체 시뮬레이션을 진행할 경우 성능 향상 대비 비용이 크게 소모된다는 점을 고려하여 Initial Meshing 및 Adaptive Meshing은 단일 노드, Frequency Sweep은 다중 노드를 사용하는 2-Step으로 구성한 후 API를 활용하여 작업 생성 및 이전 단계의 결과 파일 가져오기 등 필요한 작업들을 자동화함으로써 사용자 편의성과 비용 효율성을 동시에 향상시켰다.

▲ANSYS HFSS 2-Step 시뮬레이션

▲ANSYS HFSS 2-Step 시뮬레이션 소요 비용 비교

위 표의 Total Cost와 같이 2-Step 시뮬레이션으로 Workflow를 구성 시 3개의 노드로 Full analysis하는 경우 대비 시뮬레이션 시간은 1시간 14분 단축, 시뮬레이션 비용은 84% 절감할 수 있었으며, 수치상으로 나타나는 효과 외에도 사용자가 직접 플랫폼에 파일을 업로드하고 새로운 작업을 생성하는 등 필요한 과정에 소요되는 시간 또한 절감함으로써 전반적으로 시뮬레이션 업무를 가속화할 수 있었다.
Rescale의 ScaleX 플랫폼에 대한 소개와 Workflow 개선 사례 등 클라우드 HPC 플랫폼을 활용한 시뮬레이션 가속화 방안에 대하여 간략하게 공유하였다. 시뮬레이션이 제품 개발 사이클에서 차지하는 비중이 점차 증가하고 있으며, 다중 물리계 시뮬레이션이나 Machine learning 및 Deep learning과의 접목 등 최신 기술을 현업에 적용하기 위해서는 연산 자원의 뒷받침이 필수적이지만, 글로벌 경쟁 심화와 고정 비용의 절감을 동시에 달성해야 하는 기업들의 입장에서 대규모 HPC 시스템의 도입 또한 현실적으로 쉽지 않으므로 연산 자원이 필요한 기간에만 즉각적으로 사용할 수 있는 클라우드 HPC 플랫폼이 대안 중 하나가 될 수 있을 것으로 판단된다.

필자: 김정훈, Rescale Korea의 Solutions Architect로 주로 자동차 산업군 고객들의 HPC cloud 활용을 위한 기술지원을 담당하고 있다. 이메일: junghoon@rescale.com
*이 기사는 캐드앤그래픽스 (CAD&Graphics) 2021년1월호에 실린 기사입니다
> Rescale 문의: info.korea@rescale.com / 070-4735-8118
> 무료체험: kr.rescale.com/signup

쿠키	런닝타임	상품 설명
AWSALBCORS	7 일 동안	이 쿠키는 Amazon Web Services에서 관리하며 로드 밸런싱에 사용됩니다.
쿠키법정보-확인란-광고	1 년	GDPR 쿠키 동의 플러그인에 의해 설정되는 이 쿠키는 "광고" 카테고리의 쿠키에 대한 사용자 동의를 기록하는 데 사용됩니다.
쿠키법정보-확인란-분석	11 개월	이 쿠키는 GDPR 쿠키 동의 플러그인에 의해 설정됩니다. 쿠키는 "Analytics"범주의 쿠키에 대한 사용자 동의를 저장하는 데 사용됩니다.
cookielawinfo 체크박스 기능	11 개월	쿠키는 "기능"범주의 쿠키에 대한 사용자 동의를 기록하기 위해 GDPR 쿠키 동의에 의해 설정됩니다.
cookielawinfo- 확인란 필요	11 개월	이 쿠키는 GDPR 쿠키 동의 플러그인에 의해 설정됩니다. 쿠키는 "필요"범주에서 쿠키에 대한 사용자 동의를 저장하는 데 사용됩니다.
쿠키법정보-체크박스-기타	11 개월	이 쿠키는 GDPR 쿠키 동의 플러그인에 의해 설정됩니다. 쿠키는 "기타"범주의 쿠키에 대한 사용자 동의를 저장하는 데 사용됩니다.
cookielawinfo- 체크 박스 성능	11 개월	이 쿠키는 GDPR 쿠키 동의 플러그인에 의해 설정됩니다. 쿠키는 "성능"범주의 쿠키에 대한 사용자 동의를 저장하는 데 사용됩니다.
seen_cookie_policy	11 개월	쿠키는 GDPR 쿠키 동의 플러그인에 의해 설정되며 사용자가 쿠키 사용에 동의했는지 여부를 저장하는 데 사용됩니다. 개인 데이터는 저장되지 않습니다.

쿠키	런닝타임	상품 설명
__cf_bm	30 분	Cloudflare에서 설정한 이 쿠키는 Cloudflare Bot Management를 지원하는 데 사용됩니다.
쿠키	2년	LinkedIn은 브라우저 ID를 인식하기 위해 LinkedIn 공유 버튼과 광고 태그에서 이 쿠키를 설정합니다.
랭	세션	LinkedIn은 사용자의 언어 설정을 기억하도록 이 쿠키를 설정합니다.
뚜껑	1 일	LinkedIn은 데이터 센터 선택을 용이하게 하기 위해 lidc 쿠키를 설정합니다.
플레이어	1 년	Vimeo는 Vimeo에 삽입된 동영상을 재생할 때 사용자의 기본 설정을 저장하기 위해 이 쿠키를 사용합니다.

쿠키	런닝타임	상품 설명
AWSALB	7 일 동안	AWSALB는 세션을 대상에 매핑하기 위해 Amazon Web Services에서 설정한 애플리케이션 로드 밸런서 쿠키입니다.
동기화_활성	못	이 쿠키는 Vimeo에 의해 설정되며 방문자의 비디오 콘텐츠 선호도에 대한 데이터를 포함하므로 웹사이트는 선호하는 볼륨이나 비디오 품질과 같은 매개변수를 기억합니다.

쿠키	런닝타임	상품 설명
_ga	2년	Google Analytics에 의해 설치된 _ga 쿠키는 방문자, 세션 및 캠페인 데이터를 계산하고 사이트의 분석 보고서를 위해 사이트 사용을 추적합니다. 쿠키는 익명으로 정보를 저장하고 고유 방문자를 식별하기 위해 무작위로 생성된 번호를 할당합니다.
_gat_UA-32985745-1	1 분	웹사이트 소유자가 방문자 행동을 추적하고 사이트 성능을 측정할 수 있도록 Google 애널리틱스 및 Google 태그 관리자에서 설정한 _gat 쿠키의 변형입니다. 이름의 패턴 요소에는 관련된 계정 또는 웹사이트의 고유 ID 번호가 포함됩니다.
_gcl_au	3 개월	Google Tag Manager에서 서비스를 사용하는 웹사이트의 광고 효율성을 실험하기 위해 제공합니다.
_gid	1 일	Google Analytics에서 설치한 _gid 쿠키는 방문자가 웹사이트를 사용하는 방법에 대한 정보를 저장하는 동시에 웹사이트 성능에 대한 분석 보고서를 생성합니다. 수집되는 일부 데이터에는 방문자 수, 출처, 익명으로 방문하는 페이지가 포함됩니다.
동의	2년	YouTube는 포함된 YouTube 비디오를 통해 이 쿠키를 설정하고 익명의 통계 데이터를 등록합니다.
utm_캠페인	과거	Google 광고 서비스는 세션 캠페인 값이 있는 경우 이를 저장하도록 이 쿠키를 설정합니다.
utm_content	과거	이 쿠키는 세션 콘텐츠 값이 있는 경우 저장하는 데 사용됩니다.
utm_source	과거	이 쿠키는 방문자가 원래 웹사이트를 방문한 위치를 기록하는 데 사용됩니다. 이 정보는 웹사이트 운영자가 마케팅 효율성을 파악하는 데 사용됩니다.
utm_term	과거	이 쿠키는 방문자가 원래 웹사이트를 방문한 위치를 기록하는 데 사용됩니다. 이 정보는 웹사이트 운영자가 마케팅 효율성을 파악하는 데 사용됩니다.
VUID	2년	Vimeo는 이 쿠키를 설치하여 웹사이트에 동영상을 임베드하도록 고유 ID를 설정하여 추적 정보를 수집합니다.

쿠키	런닝타임	상품 설명
_fbp	3 개월	이 쿠키는 웹사이트를 방문한 후 Facebook 또는 Facebook 광고로 구동되는 디지털 플랫폼에 광고를 표시하도록 Facebook에 의해 설정됩니다.
_mkto_trk	2년	Marketo가 제공하는 이 쿠키에는 사용자의 사이트 사용을 추적하는 데 사용되는 정보(예: 고유한 사용자 ID)가 있습니다. Marketo가 설정한 쿠키는 Marketo만 읽을 수 있습니다.
fr	3 개월	Facebook은 Facebook 픽셀 또는 Facebook 소셜 플러그인이 있는 사이트에서 웹 전반의 사용자 행동을 추적하여 사용자에게 관련 광고를 표시하도록 이 쿠키를 설정합니다.
IDE	1 년 24 일	Google DoubleClick IDE 쿠키는 사용자가 사용자 프로필에 따라 관련 광고를 제공하기 위해 웹사이트를 사용하는 방법에 대한 정보를 저장하는 데 사용됩니다.
개인화 ID	2년	Twitter는 이 쿠키를 설정하여 소셜 미디어 기능을 통합 및 공유하고 사용자가 추적 및 타겟팅을 위해 웹 사이트를 사용하는 방법에 대한 정보를 저장합니다.
테스트 쿠키	15 분	test_cookie는 doubleclick.net에 의해 설정되며 사용자의 브라우저가 쿠키를 지원하는지 확인하는 데 사용됩니다.
utm_medium	과거	이 쿠키는 방문자가 원래 웹사이트를 방문한 위치를 기록하는 데 사용됩니다. 이 정보는 웹사이트 운영자가 마케팅 효율성을 파악하는 데 사용됩니다.
VISITOR_INFO1_라이브	5 개월 27 일	사용자가 새로운 플레이어 인터페이스를 사용할지 아니면 이전 플레이어 인터페이스를 사용할지를 결정하는 대역폭을 측정하기 위해 YouTube에서 설정한 쿠키입니다.
YS 확장	세션	YSC 쿠키는 Youtube에서 설정하며 Youtube 페이지에 포함된 비디오의 조회수를 추적하는 데 사용됩니다.
yt-원격 연결 장치	못	YouTube는 포함된 YouTube 비디오를 사용하여 사용자의 비디오 기본 설정을 저장하기 위해 이 쿠키를 설정합니다.
yt-원격-기기-id	못	YouTube는 포함된 YouTube 비디오를 사용하여 사용자의 비디오 기본 설정을 저장하기 위해 이 쿠키를 설정합니다.
yt.innertube :: nextId	못	YouTube에서 설정한 이 쿠키는 사용자가 YouTube에서 본 동영상에 대한 데이터를 저장하기 위해 고유 ID를 등록합니다.
yt.innertube :: 요청	못	YouTube에서 설정한 이 쿠키는 사용자가 YouTube에서 본 동영상에 대한 데이터를 저장하기 위해 고유 ID를 등록합니다.

쿠키	런닝타임	상품 설명
_chtbl	세션	가능한 설명이 없습니다.
_dtses	30 분	가능한 설명이 없습니다.
_dtuid	10년	가능한 설명이 없습니다.
BIGipServersj30web-nginx-app_https	세션	설명이 없습니다
이메일	과거	가능한 설명이 없습니다.
gclid	과거	설명이 없습니다
핸들_ip	1 월	가능한 설명이 없습니다.
핸들_랜딩_페이지	1 월	가능한 설명이 없습니다.
handl_original_ref	과거	가능한 설명이 없습니다.
핸들_참조	과거	가능한 설명이 없습니다.
핸들 URL	1 월	가능한 설명이 없습니다.
li_gc	2년	설명이 없습니다
muc_ads	2년	설명이 없습니다
사용자 이름	과거	가능한 설명이 없습니다.

Rescale 플랫폼

살펴보기

HPC & AI 소프트웨어

HPC & AI 아키텍처

규정 준수

에코시스템 통합

가격 정책

서비스형 HPC

인텔리전트 배치

엘라스틱 클라우드 워크스테이션

스토리지 패브릭

Enterprise Management

Multi-Team Management

Performance Management

Software Publisher

디지털 엔지니어링

AI 피직스

지식 관리

Computational Pipelines

비슷한 게시물

뉴스레터 신청