Google Compute Platform의 MPI 벤치마킹 재방문

gce
XNUMX년 전 우리는 네트워킹 성능을 알아보기 위해 Google의 IaaS 서비스인 Google Compute Engine(GCE)을 방문했고 Ryan은 그 결과를 다음과 같이 게시했습니다. 그의 블로그 게시물. 당시 결론은 GCE 인스턴스가 웹 서비스 호스팅의 일반적인 워크로드에 더 적합하지만 여전히 HPC 애플리케이션을 위한 성능 튜닝 공간이 있다는 것이었습니다. 최근 우리는 최신 제품을 포함하여 GCE 인스턴스를 다시 방문했습니다.

벤치마크 도구
결과를 이전 결과와 어느 정도 비교할 수 있도록 하기 위해 우리는 여전히 다음을 사용하고 있습니다. OSU 마이크로 벤치마크 하지만 최신으로 버전 5.3.2. 그리고 제공되는 모든 벤치마킹 도구 중에서 가장 중요한 두 가지 도구를 선택합니다. 대기 시간 테스트용 osu_latency와 양방향 대역폭 테스트용 osu_bibw입니다.

테스트 환경
운영 체제: Debian GNU/Linux 8(Jessie)
MPI 버전: MPICH3

테스트 인스턴스
VM 인스턴스 간 상호 연결 성능을 테스트하고 있으므로 시작한 VM 인스턴스가 실제로 다른 물리적 호스트에 위치하여 트래픽이 실제로 기본 네트워크를 통과하지만 호스트 시스템의 메모리는 통과하지 않는지 확인하려고 합니다.
그래서 우리는 각 시리즈의 가장 큰 인스턴스를 선택했습니다.
n1-표준-32, n1-highmem-32n-highcpu-32

시험 결과
대기 시간(마이크로초):

인스턴스 유형시험 #1시험 #2시험 #3평균
n1-표준-3245.6847.0348.4647.06
n1-highmem-3243.1743.0836.8741.04
n1-하이 CPU-3247.1148.5148.1747.93

(크기: 0바이트)
양방향 대역폭의 경우: (MB/s)

인스턴스 유형시험 #1시험 #2시험 #3평균
n1-표준-32808.28864.91872.36848.52
n1-highmem-321096.351077.331055.21076.29
n1-하이 CPU-32847.68791.16900.32846.39

(크기: 1,048,576-바이트)

결과 요약
네트워크 지연 시간의 경우 평균은 약 40~45마이크로초로 이전 결과인 약 4마이크로초보다 180배 빠릅니다. 그리고 새로운 지연 시간은 다른 소규모 인스턴스 유형과 상당히 일관됩니다.
대역폭의 경우 비교할 이전 결과가 없지만 모든 GCE 인스턴스 유형 중에서 n1-highmem-32가 1070MB/s에 달하는 최고의 성능을 갖는 것으로 나타났습니다. 이 결과는 GCE의 공식 문서와 일치합니다. https://cloud.google.com/compute/docs/networks-and-firewalls#egress_throughput_caps.

비슷한 게시물