Rescale에 대한 NVIDIA Tesla V100 벤치마크 결과

Rescale은 NVIDIA의 최신, 가장 발전된 GPU를 추가했습니다. 테슬라 V100, ScaleX 플랫폼으로. 이는 최신 Volta 아키텍처를 기반으로 한 NVIDIA 최초의 GPU입니다. 13년 2017월 100일부터 모든 플랫폼 사용자는 ScaleX 표준 배치 워크플로우의 일부로 VXNUMX을 선택할 수 있습니다.
딥러닝에 최적화됨
Rescale의 V100 기반 시스템은 1개, 4개 또는 8개의 V100 GPU와 함께 제공되며 모두 300GB/s NVLink 상호 연결로 연결됩니다. V100 Volta 아키텍처는 딥 러닝 조정 반정밀 Tensor 코어를 갖춘 딥 러닝 워크로드에 최적화되어 있습니다. 이러한 시스템은 다음 그림에서 볼 수 있듯이 이전 세대 P2 시스템보다 100배 이상 빠르게 딥 러닝 모델을 훈련할 수 있습니다. Caffe2 ResNet50 트레이너 벤치마크 결과 :
caffe2-resnet50-v100-결과
(합성 데이터, GPU 배치 크기당 64개)
CUDA 9를 사용하는 TensorFlow는 8개의 V100이 8개의 P100보다 40% 더 나은 성능을 발휘하여 유사한 결과를 달성합니다. TensorFlow의 컨벌루션 신경망 벤치마크 3가지 네트워크 아키텍처 모두에서 테스트되었습니다.

Rescale_tensorflow cnn 벤치마크 그래프

(합성 데이터, GPU 배치 크기당 64개)

지금 V100 GPU를 사용해 보세요!

지금 NVIDIA V100 실행을 시작하려면 복제하고 실행하여 새 하드웨어를 테스트할 수 있는 몇 가지 샘플 작업이 아래에 나와 있습니다. 작업을 복제하는 방법에 대한 지침은 다음을 참조하세요. 여기를 클릭하세요. 물론 그렇게 하려면 Rescale 계정이 필요합니다. 하나를 등록할 수 있습니다. 여기에서 지금 확인해 보세요..

Caffe2 ResNet50 트레이너 벤치마크
Caffe2는 새로운 Tensor 코어에 대한 지원을 통합하고 Volta 아키텍처의 반정밀도 부동 소수점 연산을 최대한 활용하는 최초의 딥 러닝 프레임워크 중 하나입니다. Rescale에서 위에 표시된 동일한 Caffe2 벤치마크를 실행하세요.
Caffe2 ResNet50 4 x V100 작업을 복제하려면 여기를 클릭하세요.

TensorFlow InceptionV3 벤치마크

TensorFlow는 고성능 모델 교육을 제공하는 것으로도 알려져 있습니다. 위에 표시된 것과 동일한 TensorFlow CNN 벤치마크를 Rescale V100에서 실행하여 결과를 직접 비교해 보세요.
InceptionV3 4 x V100 작업을 복제하려면 여기를 클릭하세요..

딥 러닝 킥스타트 프로그램

하드웨어 파트너인 Skyscale과의 공동 프로모션의 일환으로 Deep Learning Kickstart 프로그램 참여를 신청하세요. 이 프로그램은 승인된 지원자에게 GPU 사용에 대한 Rescale 하드웨어 크레딧으로 $1,000-5,000를 수여합니다. 회사를 대표하는 모든 Rescale 사용자가 신청할 수 있습니다. 프로그램 사용자는 NVLinked P100 또는 V100 GPU가 탑재된 시스템에서 실행할 수 있습니다.

저자

  • 마크 휘트니

    Mark Whitney는 Rescale의 엔지니어링 이사입니다. 그의 전문 분야에는 고성능 컴퓨팅 아키텍처, 양자 정보 연구, 클라우드 컴퓨팅이 포함됩니다. 그는 캘리포니아 대학교 버클리 캠퍼스에서 컴퓨터 과학 박사 학위를 취득했습니다.

비슷한 게시물