공항 보안이 온프레미스 HPC와 비슷하다면 어떨까요?

TSA에서 높은 활용도가 작동하지 않는 이유와 HPC에서 작동하지 않는 이유

요약 :

  • 대규모 컴퓨팅 성능의 경우 대규모 자본 자산을 구매하면 최종 사용자의 요구 사항을 마지막에 두는 조직적 인센티브 불일치가 발생할 수 있습니다.
  • 온프레미스 컴퓨팅의 높은 활용률을 달성하는 것은 끔찍한 승리입니다. 이는 승자와 패자를 만들고 주지사를 혁신의 속도로 이끄는 것입니다.
  • 온프레미스 컴퓨팅 활용률이 높은 정보 기술 리더는 민첩성, 혁신 및 "스택 외부" 사고 문화를 장려하기 위해 업무에 대한 클라우드 우회를 구축해야 합니다.
  • 온프레미스 컴퓨팅의 총 소유 비용(TCO)을 계산할 때 사용자 경험, 워크플로 주기 시간, 새로운 요구 사항에 대한 대응 및 기타 요소를 고려해야 합니다.

공항 여행자와 HPC 사용자는 동일한 불만을 가지고 있습니다.
최근 LAX 공항 보안 검색대에 줄을 서 있는 동안 내 뒤의 여행자들은 친숙한 스포츠에 참여하기 시작했습니다. 미국 공항 보안 검색 절차에 대한 더 나은 대안이 있는지 궁금해하는 것이었습니다. 일부 회선이 다른 회선보다 빠른 것으로 판명됨에 따라 불만 사항은 회선 선택부터 전체 시스템의 효율성까지 다양했습니다. 최근 클라우드 컴퓨팅의 미래 사용자와의 여러 회의에서 돌아온 불만 사항은 대기 시간, 용량 제한, 시스템의 불공평함 등 유사했습니다.
온프레미스 컴퓨팅 자산의 높은 활용률은 대용량 컴퓨팅(HPC) 워크로드에 대한 순수한 온프레미스 전략을 유지하기 위한 비용 기반 방어에서 종종 인용됩니다. 주장은 다음과 같습니다. 온프레미스 시스템의 활용률이 높을수록 해당 워크로드를 클라우드로 이동하는 데 드는 비용이 더 커집니다. 이는 불완전한 변수 세트를 비교한 총 소유 비용(TCO) 연구의 결과인 경우가 많습니다.

위의 TCO 비교는 비참할 정도로 불완전하지만 누락된 부분을 제쳐두고 훨씬 더 눈에 띄게 분명한 것은 클라우드 컴퓨팅의 기본 가정인 100% 활용률입니다. 가정의 사용은 이해할 수 있습니다. 자본 투자에는 재정적 정당성이 필요하며 규모에 따라 상세한 NPV 분석이 필요한 경우가 많습니다. 불행하게도 이러한 분석에서 고정 및 자본화된 지출을 가변 및 운영 지출과 비교하는 것은 어렵습니다. Opex를 예측하려면 컴퓨팅 사용량에 대한 자세한 로깅과 과거 행동을 통해 미래 요구 사항을 예측할 수 있다는 가정이 필요합니다. 단순화를 위해 단순히 클라우드 컴퓨팅을 100% 활용한다고 가정하고 계속 진행하는 것이 더 쉽습니다. 그러나 클라우드 컴퓨팅 100% 활용과 온프레미스 자산 100% 활용에 대한 조직적 의미는 매우 다릅니다. 제한된 온프레미스 컴퓨팅 자산을 100% 활용한다는 것은 대기열 시간, 내부 리소스 우선 순위에 대한 지속적인 재평가, 새로운 요구 사항에 대한 느린 반응 시간을 의미합니다. 거대한 클라우드의 특정 부분을 100% 활용하면 이러한 단점이 전혀 없습니다.
이것은 TSA 이야기로 다시 돌아갑니다.
TSA의 악몽
어느 날 특정 공항의 TSA 직원이 특이한 지시를 받았다고 상상해 보십시오. 납세자는 자본화 자산 구매에 매우 민감합니다. 그 결과, 이제 새로 설치된 스캐너의 용량 활용도를 95% 이상 달성하는 것이 기관의 우선순위가 되었습니다. 결과는 어떻게 될까요?
첫째, 95%의 활용률을 위해서는 비행기가 오전 6시에서 자정 사이에만 이착륙한다는 사실에 관계없이 밤 내내 노선을 통과하는 승객 처리가 필요합니다. 둘째, 보안 검색대에 도착한 승객 19명 중 20명은 도착 시간에 관계없이 줄을 서야 합니다. 셋째, 여행 성수기에는 대기 시간이 기하급수적으로 늘어납니다. 넷째, 장기적으로 목표를 달성하기 위해 TSA 요원은 추가 보안 라인을 폐쇄하고 "과잉" 스캐너를 다른 공항으로 측면으로 이전하도록 인센티브를 받게 됩니다. 그 여파의 어딘가에는 높은 이용률 추구에 대한 요구가 종속된 승객이 있습니다. 승객의 심리도 변한다. 승객은 긴 대기열 시간에 대한 계획을 시작하고 예측 가능성이 제한된 시스템을 게임하는 데 생산적인 시간을 할애합니다.
대규모 고정 용량 컴퓨팅 시스템을 구매하는 경우 자산 구매 직후 인센티브 불일치가 시작됩니다. 재무는 자산 수익을 최적화하여 정보 기술 리더가 가장 오랜 시간 동안 가장 높은 수준의 활용도에서 가능한 가장 작은 자산을 사용하도록 압력을 가하기를 원합니다. 한편, 하드웨어 요구 사항은 회사 외부에서 계속해서 다양해지고 발전하여 비즈니스 상황이 현재와 유사할 것 같지 않은 몇 년 전에 회사가 내린 결정을 인위적으로 제약하고 있습니다. 고정 자산의 특성상 회사의 특정 부분의 작업량이 다른 부분보다 우선시되므로 승자와 패자를 만듭니다. 그러나 항공 여행자와 달리 엔지니어, 연구원, 데이터 과학자에게는 시스템을 우회할 수 있는 옵션이 제공될 수 있습니다.
클라우드는 온프레미스에 비해 고유한 장점을 가지고 있습니다. 결과적으로, 클라우드 빅 컴퓨팅은 민첩성, 빠른 혁신 주기, 문제에 대한 새로운 접근 방식을 중시하는 모든 조직에서 자리를 잡았습니다. 사내 리소스는 본질적으로 용량이 제한되어 있으며 시간이 지남에 따라 직원들이 문제에 대한 해결책을 찾는 방법에 대해 심리적 통제자를 배치할 수 있습니다. 예를 들어, 엔지니어는 주요 매개변수에 대한 민감도를 이해하기 위해 설계 연구를 실행하는 대신 단순히 다른 옵션이 없다고 가정하고 부품을 과도하게 설계할 수 있습니다. 클라우드는 대규모 컴퓨팅이 필요한 모든 문제에 대한 만병통치약이 아닙니다. 그러나 정보 기술 리더는 유능한 클라우드 전략만 보유함으로써 혁신 문화를 장려하는 데 자신의 역할을 다할 수 있습니다.
클라우드는 TSA PreCheck 이상의 기능을 하며 활주로를 주행하고 비행기에 탑승합니다.
무료 백서를 다운로드하여 HPC를 클라우드로 이전할 때의 이점에 대해 자세히 알아보세요. Cloud HPC에 대한 동기 및 IT 로드맵

저자

  • Matt McKee
맷 맥키

    최고 운영 책임자(COO) Matt는 Rescale의 글로벌 영업, 운영, 비즈니스 개발 및 기술 제휴 팀을 담당하고 있습니다. Rescale에 합류하기 전에 Matt는 MSC Software 및 Accenture에서 영업, 경영 컨설팅, 시스템 통합을 포함하여 하이테크/소프트웨어 부문에서 다양한 직책을 맡았습니다. Matt는 미 육군 장교로 경력을 시작하여 회사 수준에서 지휘를 맡았습니다. Matt는 West Point의 미국 육군 사관학교에서 학사 학위를, UCLA Anderson School of Management에서 MBA를 취득했습니다.

비슷한 게시물