분리 불안: 나는 클러스터에서 멀리 떨어져 있습니다


방해 요소, 소음, 어린이, 방해 요소. 현대적인 경험의 모든 부분이 보일 것입니다. 이곳 Rescale에서도 다른 사람들과 마찬가지로 67일 동안 재택근무를 계속하고 있습니다. 그것이 어려울 수 있는 이유는 백만 가지가 될 수 있습니다. 그러나 우리는 귀하의 업무를 수행하는 데 필요한 클러스터 및 소프트웨어 라이센스에 대한 액세스가 그 중 하나가 되어서는 안 된다고 강력하게 생각합니다.
불행하게도 이것이 대부분의 회사의 현실인 것 같습니다. 실제로 Accenture에 따르면, 기업의 10 %만이 이와 같은 상황에 대한 포괄적인 계획과 리소스를 갖추고 있습니다. 현실은 우리 중 나머지 사람들이 서로 얽혀 있는 분산 작업 환경에 갇혀 있다는 것입니다. 여기에는 우리가 접근할 수 없는 워크스테이션에 묶인 소프트웨어 라이선스, 인력의 10~15%만 지원하도록 설계된 VPN, 느린 네트워크 상호 연결 속도, 손상된 엔지니어링 워크플로, 저전력 홈 컴퓨팅 등 수많은 어려움이 따릅니다.
불행하게도 이는 일반적으로 생산성의 광범위한 저하를 초래합니다. 어려운 거시 경제 상황에서 대부분의 기업은 이러한 하락을 감당할 수 없습니다. 이러한 압력은 심각한 상황을 초래합니다. 분산된 팀이 효율적으로 작업할 수 있는 솔루션이 없으면 회사는 하락세를 겪을 위험이 있습니다.
차세대 과학, 공학, 기술을 가능하게 하기 위해 구축된 인프라는 주로 사무실에서 이루어질 것이라는 가정하에 구축되었습니다. 그렇다면 차세대 인프라는 어떤 모습일까요? 기업들은 새로운 환경을 구현하기 위해 어떻게 투자하고 있나요?
VPN 강화
많은 기업에서는 이미 사람들이 클러스터에 원격으로 액세스하거나 때로는 가상 데스크톱 등에 액세스할 수 있도록 설계된 VPN을 보유하고 있습니다. 문제? 대부분의 회사 한 번에 회사 인력의 아주 작은 부분을 처리하도록 VPN을 구성했습니다.
우리가 이야기를 나눈 많은 회사에서는 수백 개의 동시 연결에 대한 지원을 추가하고 네트워크 I/O를 개선하는 등 VPN 개선 사항을 발표할 계획을 세웠습니다. 그러나 이와 같은 다층적인 프로세스에는 시간이 걸립니다. 그 동안 IT 팀은 그룹이 VPN에 액세스할 수 있는 특정 예약 시간을 할당하는 것을 볼 수 있습니다.

“오전 9시부터 9시 30분과 오후 1시부터 1시 30분까지 클러스터에 액세스하고, 필요한 데이터를 다운로드 또는 업로드하거나 작업을 제출해야 합니다. 해당 기간을 놓치면 다음 단계로 넘어가기 위해 하루를 더 기다려야 합니다. 이는 엄청난 시간 낭비입니다.”라고 인터뷰한 한 엔지니어가 말했습니다.
이는 이 문제를 한 번에 하나씩 해결하기 위한 전략일 수 있지만 일반 엔지니어가 작업 방식의 개선을 보기까지는 몇 달이 걸릴 것입니다.
컴퓨팅 집약적인 작업을 제XNUMX자에게 보내기
생산성을 유지할 만큼 빠른 속도로 네트워크 속도에 대한 액세스를 신속하게 향상시킬 수 없다는 것을 알고 있는 기업은 아웃소싱이라는 또 다른 옵션으로 전환했습니다.
이러한 회사는 데이터 센터에 대한 접근성이 더 좋은 독립 회사를 활용하고 시뮬레이션 및 기타 높은 컴퓨팅 워크로드를 완료하도록 요청합니다. 제XNUMX자가 정확한 소프트웨어, 버전에서 시뮬레이션을 실행할 수 있고 사용 가능한 용량이 있는 경우, 자체 인프라 내에서 그렇게 할 수 없을 때 작업을 실행하기 위한 실행 가능한 옵션이 될 수 있습니다.
그러나 별도의 환경에서 작업하면 몇 가지 위험이 따릅니다. IT 팀은 엄격하고 가시적인 통제 없이 여러 환경을 관리할 때 일반적으로 문제에 직면합니다.
우리 고객 중 한 명이 두 가지 환경에서 작업하는 것에 대해 다음과 같이 말했습니다. “두 사이트는 동일한 소프트웨어의 서로 다른 버전에서 시뮬레이션을 실행했습니다. 각각은 케이블 길이에 대해 약간 다른 계산을 했습니다. 최종 비행기를 조립할 때가 되었을 때 두 버전의 모든 케이블은 약 XNUMX인치 정도 너무 짧았습니다. 이로 인해 프로젝트가 XNUMX년 지연되었습니다.”
신뢰할 수 있는 파트너와 매우 명확한 가시성을 갖춘 아웃소싱은 의미가 있지만 경험상 사람을 통해 환경을 관리하는 것은 큰 지연을 초래할 수 있는 실수가 발생할 가능성이 높은 환경입니다.
퍼블릭 클라우드에 클러스터 배포
앞서 언급한 솔루션의 일정과 위험을 알고 있는 일부 회사는 특정 워크로드를 퍼블릭 클라우드 인프라로 이동하기로 결정했습니다. 이 옵션은 컴퓨팅 규모, 특수 하드웨어 및 연결의 유연성을 제공합니다. 기본적으로 기업은 팀이 요구하는 만큼 많은 리소스를 생성할 수 있는 기회를 갖습니다. 확장 기능이 내장되어 있으며 필요에 따라 제공됩니다.
퍼블릭 클라우드 인스턴스를 구현할 때 기업이 직면하는 주요 과제는 본질적으로 운영입니다. 이 솔루션은 IT, 시스템 통합업체 등에 전적으로 의존합니다. 이것의 설계와 관리는 일반적으로 예상보다 더 큰 사업입니다.
고품질 클라우드 배포를 위해서는 팀과 프로젝트의 개별 예산을 제어, 보고, 관리할 수 있어야 합니다. 라이선스 호스팅 및 작업 할당을 해결해야 합니다. 리소스를 최대화하려면 주어진 작업에 이상적인 하드웨어를 선택하는 것이 현명해야 합니다. 필요하지 않은 클러스터를 지능적으로 종료해야 합니다. IT 부서가 분기 말에 예상치 못한 청구서를 받지 않도록 제한을 두고 구축해야 합니다.
시스템이 이러한 모든 문제를 해결하더라도 규제 요구 사항으로 인해 특정 유형의 정보를 처리할 수 없는 경우가 있습니다. 시스템은 ITAR, FedRAMP 또는 SOC II 규격도 아니므로 민감한 특정 워크로드에는 옵션이 아닙니다.
관리형 플랫폼에 투자
관리형 플랫폼을 통해 기업은 필요에 따라 클라우드 관행의 이점을 누리는 동시에 존재하는 모든 운영 및 규정 준수 문제를 해결할 수 있습니다. 이러한 시스템은 실제로 분산된 팀을 활성화할 목적으로 구축된 것은 아니지만 팀 분산에 상관없이 구축된 유일한 시스템을 나타냅니다.
본질적으로 클라우드 리소스를 기반으로 구축된 액세스는 본질적으로 원격이므로 오늘날 우리가 처한 상황에 강력하게 대처할 수 있으며 상황이 새로운 표준으로 돌아갈 때에도 똑같이 유용합니다.
특히 Rescale은 오늘날 기업이 직면한 과제에 대한 몇 가지 독특한 접근 방식을 제공합니다.

  1. 예산 관리 – Rescale은 팀이 클라우드의 리소스를 셀프 서비스할 수 있도록 구축되었습니다. 이는 수요에 따라 확장이 가능하도록 맞춤화되었음을 의미합니다. 이것이 조직에서 실질적으로 작동하려면 관리자가 특정 경성 예산과 연성 예산을 설정하고, 지출을 할당하고, 경우에 따라 청구를 분할할 수도 있어야 합니다. 이는 Rescale의 기본 기능이며 몇 번의 클릭만으로 리소스 할당이 쉽습니다.
  2. 액세스 관리 – 팀은 시스템에 저장된 클러스터 및 데이터에 액세스할 수 있어야 합니다. Rescale의 사용자 액세스 중앙 집중식 관리는 사람들이 필요한 리소스에 쉽게 액세스할 수 있도록 안전하고 통제된 방식을 제공합니다.
  3. 소프트웨어 라이센스 관리 – 기존 라이선스를 가져오거나 새 라이선스를 구매할 수 있는 옵션(경우에 따라 주문형 라이선스도 포함)을 통해 Rescale은 현재 상황에 관계없이 팀이 시작하고 실행할 수 있도록 다양한 방법을 제공합니다. 이미 2,000개 이상의 소프트웨어 버전이 사용 가능하고 설치되어 있으며 단 하나의 라이센스 키만 있으면 작업을 실행할 수 있습니다. 또한 시스템에서는 버전을 중앙 집중식으로 제어하여 환경 간 버전 불일치를 방지할 수 있습니다.
  4. 보안 및 데이터 관리 – Rescale은 클라우드 HPC와 관련하여 가장 안전한 옵션입니다. ITAR, FedRAMP 및 SOC II를 준수하는 Rescale은 처음부터 견고한 보안으로 구축되었습니다. 해당 시스템은 최첨단 암호화 및 데이터 관리 보호 기능을 사용합니다. 또한 Rescale은 관리자에게 제어권을 부여하여 사용자가 액세스해야 하는 데이터에 대해서만 권한을 갖도록 보장합니다.
  5. 아키텍처 관리 – Rescale은 모든 퍼블릭 클라우드에서 클러스터를 스핀업하고 종료할 수 있을 뿐만 아니라 위치에 관계없이 최고의 하드웨어를 추천할 수 있는 시스템을 개발했습니다. Rescale은 시스템의 모든 코어 유형에 대한 속도와 견고성을 알고 있으며 사용자에게 필요한 최고의 비용, 성능 및 확장성을 제공하는 하드웨어 유형, 즉 수백만 개의 코어, 수백 개의 코어 유형이 고객 요구에 지능적으로 매핑되도록 안내할 수 있습니다.

2020년은 영원히 우리 시스템과 팀이 궁극적인 테스트를 받는 해가 될 것입니다. 시스템에 관한 향후 모든 논의는 기술이 사용자에게 권한을 부여하고 제한하지 않도록 하기 위해 전염병에 대비해야 합니다. 코로나19로 인해 HPC가 어떤 방식으로 변화할 것이라고 생각하시나요?
원격 팀을 최적화하는 방법을 찾고 계십니까? 웹 세미나에 참여하여 실제 엔지니어로부터 자세한 내용을 알아보고 적용 가능한 솔루션을 들어보세요. 세부 사항은 다음과 같습니다.

비슷한 게시물