Rescale에서 Keras를 사용하는 신경망

마크블로그
Rescale은 이제 Theano 기반 Keras를 포함한 다양한 신경망 소프트웨어 패키지 실행을 지원합니다. Keras는 사용자가 신경망을 계층별로 정의하고 훈련하고 검증한 다음 이를 사용하여 새 이미지에 레이블을 지정할 수 있게 해주는 Python 패키지입니다. 이번 포스팅에서는 CNN(컨벌루션 신경망) 기준으로 이미지를 분류합니다. CIFAR10 데이터세트. 그런 다음 이 훈련된 모델을 사용하여 새 이미지를 분류합니다.

우리는 수정된 버전을 사용할 것입니다. Keras CIFAR10 CNN 훈련 예시 수정된 버전의 훈련 스크립트를 단계별로 진행하는 것부터 시작하겠습니다.

CIFAR10 데이터세트

CIFAR10 이미지 분류 데이터 세트를 다운로드할 수 있습니다. 여기에서 지금 확인해 보세요.. 이는 약 60000개의 32×32 픽셀 이미지로 구성되며 각 이미지에는 10개의 카테고리가 제공됩니다. Python 버전의 데이터 세트를 직접 다운로드하거나 Keras의 내장 데이터 세트 다운로더를 사용할 수 있습니다(자세한 내용은 나중에 설명).

다음 코드를 사용하여 이 데이터 세트를 로드합니다.

from keras.datasets import cifar10 from keras.utils import np_utils nb_classes = 10 def load_dataset(): # 훈련 세트와 테스트 세트 간에 섞이고 분할된 데이터 (X_train, y_train), (X_test, y_test) = cifar10.load_data() print ('X_train 모양:', X_train.shape) print(X_train.shape[0], 'train 샘플') print(X_test.shape[0], 'test Samples') # 클래스 벡터를 이진 클래스 행렬로 변환 Y_train = np_utils .to_categorical(y_train, nb_classes) Y_test = np_utils.to_categorical(y_test, nb_classes) X_train = X_train.astype('float32') X_test = X_test.astype('float32') X_train /= 255 X_test /= 255 return X_train, Y_train, X_테스트, Y_테스트

우리는 cifar10 여기에서 데이터 로더를 사용하여 카테고리 레이블을 원-핫 인코딩으로 변환한 다음 8비트 RGB 값을 0-1.0 범위로 스케일링합니다.
XNUMXD덴탈의 엑스트레인 및 X_테스트 출력은 훈련 및 테스트 세트의 모든 이미지에 대한 RGB 픽셀 값의 numpy 행렬입니다. 50000개의 훈련 이미지와 10000개의 테스트 이미지가 있고 각 이미지는 32개의 색상 채널을 가진 32×3 픽셀이므로 각 행렬의 모양은 다음과 같습니다.

엑스트레인	(50000, 3, 32, 32)
Y_트레인	(50000)
X_테스트	(10000, 3, 32, 32)
Y_테스트	(10000)

Y 행렬은 10개 및 50000개 이미지 그룹에 대한 10000개 이미지 클래스 중 하나를 나타내는 순서 값에 해당합니다.

비행기	0
자동차	1
새	2
방법	3
사슴	4
개	5
개구리	6
말	7
발송	8
트럭	9

단순화를 위해 이 예에서는 올바른 크기의 이미지에 대해 더 이상 전처리를 수행하지 않습니다. 실제 이미지 인식 문제에서는 일종의 정규화를 수행합니다. ZCA 미백및/또는 지터링. Keras는 이러한 사전 처리 중 일부를 이미지 데이터 생성기 클래스입니다.
네트워크 정의
다음 단계는 훈련하려는 신경망 아키텍처를 정의하는 것입니다.

from keras.models import Sequential from keras.layers.core import Dense, Dropout, Activation, Flatten from keras.layers.convolutional import Convolution2D, MaxPooling2D def make_network(): model = Sequential() model.add(Convolution2D(32, 3, 3, border_mode='same', input_shape=(img_channels, img_rows, img_cols))) model.add(Activation('relu')) model.add(Convolution2D(32, 3, 3)) model.add(Activation(' relu')) model.add(MaxPooling2D(pool_size=(2, 2))) model.add(Dropout(0.25)) model.add(Convolution2D(64, 3, 3, border_mode='same')) model.add (활성화('relu')) model.add(Convolution2D(64, 3, 3)) model.add(활성화('relu')) model.add(MaxPooling2D(pool_size=(2, 2))) model.add (Dropout(0.25)) model.add(Flatten()) model.add(Dense(512)) model.add(Activation('relu')) model.add(Dropout(0.5)) model.add(Dense(nb_classes )) model.add(Activation('softmax')) 반환 모델

이 네트워크에는 4개의 컨벌루션 레이어와 2개의 Dense 레이어가 있습니다. 추가 레이어를 추가할 수 있고 레이어를 제거하거나 변경할 수 있지만 첫 번째 레이어는 입력 이미지(3, 32, 32)와 크기가 동일해야 하고 마지막 밀집 레이어는 클래스 수와 동일한 수의 출력을 가져야 합니다. 우리는 라벨(10)로 사용하고 있습니다. 마지막 조밀한 층이 다음입니다. 소프트 맥스 출력을 합이 0이 되는 (1, 1) 범위로 압축하는 레이어입니다.

교육 및 테스트
다음으로 네트워크를 훈련하고 테스트합니다.

def train_model(model, X_train, Y_train, X_test, Y_test): sgd = SGD(lr=0.01,decay=1e-6, Momentum=0.9, Nesterov=True) model.compile(loss='categorical_crossentropy',optimizer=sgd) model.fit(X_train, Y_train, nb_epoch=nb_epoch, 배치_크기=batch_size, 유효성 검사_split=0.1, show_accuracy=True, verbose=1) print('테스트 중...') res = model.evaluate(X_test, Y_test, 배치_크기=batch_size , verbose=1, show_accuracy=True) print('테스트 정확도: {0}'.format(res[1]))

여기서 우리가 선택한 확률적 경사하강법 우리의 최적화 방법으로는 교차 엔트로피 손실. 그런 다음 다음을 사용하여 모델을 훈련합니다. 적당한() 방법. 훈련 에포크 수(데이터를 반복하는 횟수)와 배치 크기(네트워크에서 한 번에 평가할 입력 수)를 지정합니다. 배치 크기가 클수록 훈련 중 메모리 사용량이 늘어납니다. 네트워크가 훈련된 후 테스트 데이터 세트와 비교하여 모델을 평가하고 정확도를 인쇄합니다.

모델 저장
마지막으로 훈련된 모델을 나중에 다시 사용할 수 있도록 파일에 저장합니다.

def save_model(모델): model_json = model.to_json() open('cifar10_architecture.json', 'w').write(model_json) model.save_weights('cifar10_weights.h5', overwrite=True)

Keras는 모델 아키텍처 저장(우리의 경우 출력은 무엇입니까?)을 구별합니다. make_network()) 및 훈련된 가중치. 가중치는 HDF5 형식으로 저장됩니다.
Keras는 저장된 모델이 다양한 버전의 Keras 및 Theano에서 호환된다는 것을 보장하지 않습니다. 가능하다면 동일한 버전의 Keras 및 Theano를 사용하여 저장된 모델을 로드하는 것이 좋습니다.

훈련 작업 재조정
이제 내용을 설명했으니 cifar10_cnn.py 우리가 실행할 훈련 스크립트를 사용하면 이미 실행되도록 최적화된 GPU 노드에서 훈련할 Rescale 작업을 생성할 것입니다. NVIDIA GPU. 이 직업은 Rescale에서 공개적으로 사용 가능. 먼저 훈련 스크립트와 CIFAR10 데이터 세트를 업로드합니다.

여기서는 작업이 실행될 때마다 CIFAR 사이트에서 데이터세트를 다시 다운로드하는 것을 방지하기 위해 Keras에서 다운로드한 CIFAR10 이미지의 사전 처리된 버전을 업로드합니다. 이 단계는 선택사항이므로 대신 cifar10_cnn.py 스크립트.
다음으로 Keras를 선택하고 명령줄을 지정합니다.

소프트웨어 선택기에서 Keras를 선택한 다음 Theano 지원 K520 GPU 버전의 Keras를 선택합니다. 명령줄은 우리가 업로드한 데이터 세트를 다시 압축한 다음 아카이브를 기본 Keras 데이터 세트 위치로 이동합니다. ~/.keras/datasets. 그런 다음 훈련 스크립트를 호출합니다. CIFAR10 세트를 직접 업로드하지 않기로 결정한 경우 모든 아카이브 조작 명령을 생략하고 교육 스크립트만 실행할 수 있습니다. 그러면 데이터세트가 작업 클러스터에 자동으로 다운로드됩니다.
마지막 단계에서는 실행하려는 GPU 하드웨어를 선택합니다.

여기서 우리는 다음을 선택했습니다. 옥 코어 유형 및 최소 4 코어 이 유형의 경우. 마지막으로 작업을 제출합니다.
훈련이 시작되기 전에 클러스터를 프로비저닝하고 네트워크를 컴파일하는 데 약 15분이 소요됩니다. 시작되면 다음을 선택하여 진행 상황을 볼 수 있습니다. process_output.log.

작업이 완료되면 훈련된 모델 파일을 사용할 수 있습니다. 지금 보여드리는 것처럼 작업 결과 페이지에서 다운로드하거나 새 작업에서 사용할 수 있습니다.

새 이미지 분류
훈련 작업을 위해 사전 처리된 numpy 형식의 데이터 세트를 사용했습니다. 그렇다면 인터넷에서 실제 이미지를 가져오려면 어떻게 해야 할까요? 그리고 그걸 분류해? 부터 개 및 방법 2개 클래스 중 10개입니다. CIFAR10에 표현된 이미지 중에서 개와 고양이 이미지를 선택합니다. 인터넷을 통해 분류해 보세요.

이미지를 로드하고 축소하는 것부터 시작합니다.

numpy를 np로 가져오기 import scipy.misc def load_and_scale_imgs(): img_names = ['standing-cat.jpg', 'dog-face.jpg'] imgs = [np.transpose(scipy.misc.imresize(scipy.misc.imread) (img_name), (32, 32)), (2, 0, 1)).astype('float32') for img_name in img_name] return np.array(imgs) / 255

우리는 scipy를 사용합니다 읽다 JPG를 로드한 다음 이미지 크기를 32×32 픽셀로 조정합니다. 결과 이미지 텐서의 차원은 (32, 32, 3)이고 색상 차원이 마지막이 아닌 첫 번째가 되기를 원하므로 전치를 취합니다. 마지막으로, 이미지 텐서 목록을 단일 텐서로 결합하고 이전처럼 레벨을 0-1.0 사이로 정규화합니다. 처리 후에는 이미지가 더 작아집니다.

여기서는 원본 이미지의 종횡비도 유지하지 않는 가장 간단한 크기 조정을 수행했습니다. 훈련 이미지에 대해 정규화를 수행했다면 이러한 변환을 이러한 이미지에도 적용하고 싶을 것입니다.

모델 로드 및 라벨링
저장된 모델을 조립하는 과정은 다음과 같은 2단계 프로세스입니다.

keras.models import model_from_json def load_model(model_def_fname, model_weight_fname): model = model_from_json(open(model_def_fname).read()) model.load_weights(model_weight_fname) 반환 모델

이를 종합하면 우리가 로드한 모델을 가져와 호출합니다. 예측_클래스 2개의 이미지에 대한 클래스 서수 값을 얻으려면

if __name__ == '__main__': imgs = load_and_scale_imgs() model = load_model('cifar10_architecture.json', 'cifar10_weights.h5') 예측 = model.predict_classes(imgs) print(예측)

라벨링 작업 재조정
이제 레이블 지정 스크립트를 작업에 넣고 예제 이미지에 레이블을 지정해 보겠습니다. 이 직업은 Rescale에서 공개적으로 사용 가능. 우리가 만든 훈련된 모델을 선택하기 시작합니다. "클라우드 스토리지의 파일 사용"을 선택한 다음 훈련 작업에서 생성된 JSON 및 HDF5 모델 파일을 선택합니다.

그런 다음 새 라벨 지정 스크립트를 업로드하세요. dog_cat.py 그리고 개와 고양이 이미지.

Keras GPU 소프트웨어를 선택하고 라벨링 스크립트를 실행하세요. 이 경우 개와 고양이 이미지는 작업이 실행되는 현재 디렉터리에서 로드되므로 파일을 이동할 필요가 없습니다.

그러면 라벨이 다음 위치에 표시됩니다. process_output.log 작업이 완료되면.

출력은 [3, 5] 에 해당하는 방법 및 개 위의 이미지 클래스 테이블에서.
이것으로 이 튜토리얼을 마치겠습니다. 우리는 Rescale에서 이미지 인식 컨볼루션 신경망을 성공적으로 훈련한 다음 해당 네트워크를 사용하여 추가 이미지에 레이블을 지정했습니다. 곧 다른 게시물에서 더 복잡한 Rescale 워크플로를 사용하여 네트워크 훈련을 최적화하는 방법에 대해 이야기하겠습니다.

마크 휘트니

Mark Whitney는 Rescale의 엔지니어링 이사입니다. 그의 전문 분야에는 고성능 컴퓨팅 아키텍처, 양자 정보 연구, 클라우드 컴퓨팅이 포함됩니다. 그는 캘리포니아 대학교 버클리 캠퍼스에서 컴퓨터 과학 박사 학위를 취득했습니다.

작성글 전체 보기

비슷한 게시물

쿠키	런닝타임	상품 설명
AWSALBCORS	7 일 동안	이 쿠키는 Amazon Web Services에서 관리하며 로드 밸런싱에 사용됩니다.
쿠키법정보-확인란-광고	1 년	GDPR 쿠키 동의 플러그인에 의해 설정되는 이 쿠키는 "광고" 카테고리의 쿠키에 대한 사용자 동의를 기록하는 데 사용됩니다.
쿠키법정보-확인란-분석	11 개월	이 쿠키는 GDPR 쿠키 동의 플러그인에 의해 설정됩니다. 쿠키는 "Analytics"범주의 쿠키에 대한 사용자 동의를 저장하는 데 사용됩니다.
cookielawinfo 체크박스 기능	11 개월	쿠키는 "기능"범주의 쿠키에 대한 사용자 동의를 기록하기 위해 GDPR 쿠키 동의에 의해 설정됩니다.
cookielawinfo- 확인란 필요	11 개월	이 쿠키는 GDPR 쿠키 동의 플러그인에 의해 설정됩니다. 쿠키는 "필요"범주에서 쿠키에 대한 사용자 동의를 저장하는 데 사용됩니다.
쿠키법정보-체크박스-기타	11 개월	이 쿠키는 GDPR 쿠키 동의 플러그인에 의해 설정됩니다. 쿠키는 "기타"범주의 쿠키에 대한 사용자 동의를 저장하는 데 사용됩니다.
cookielawinfo- 체크 박스 성능	11 개월	이 쿠키는 GDPR 쿠키 동의 플러그인에 의해 설정됩니다. 쿠키는 "성능"범주의 쿠키에 대한 사용자 동의를 저장하는 데 사용됩니다.
seen_cookie_policy	11 개월	쿠키는 GDPR 쿠키 동의 플러그인에 의해 설정되며 사용자가 쿠키 사용에 동의했는지 여부를 저장하는 데 사용됩니다. 개인 데이터는 저장되지 않습니다.

쿠키	런닝타임	상품 설명
__cf_bm	30 분	Cloudflare에서 설정한 이 쿠키는 Cloudflare Bot Management를 지원하는 데 사용됩니다.
쿠키	2년	LinkedIn은 브라우저 ID를 인식하기 위해 LinkedIn 공유 버튼과 광고 태그에서 이 쿠키를 설정합니다.
랭	세션	LinkedIn은 사용자의 언어 설정을 기억하도록 이 쿠키를 설정합니다.
뚜껑	1 일	LinkedIn은 데이터 센터 선택을 용이하게 하기 위해 lidc 쿠키를 설정합니다.
플레이어	1 년	Vimeo는 Vimeo에 삽입된 동영상을 재생할 때 사용자의 기본 설정을 저장하기 위해 이 쿠키를 사용합니다.

쿠키	런닝타임	상품 설명
AWSALB	7 일 동안	AWSALB는 세션을 대상에 매핑하기 위해 Amazon Web Services에서 설정한 애플리케이션 로드 밸런서 쿠키입니다.
동기화_활성	못	이 쿠키는 Vimeo에 의해 설정되며 방문자의 비디오 콘텐츠 선호도에 대한 데이터를 포함하므로 웹사이트는 선호하는 볼륨이나 비디오 품질과 같은 매개변수를 기억합니다.

쿠키	런닝타임	상품 설명
_ga	2년	Google Analytics에 의해 설치된 _ga 쿠키는 방문자, 세션 및 캠페인 데이터를 계산하고 사이트의 분석 보고서를 위해 사이트 사용을 추적합니다. 쿠키는 익명으로 정보를 저장하고 고유 방문자를 식별하기 위해 무작위로 생성된 번호를 할당합니다.
_gat_UA-32985745-1	1 분	웹사이트 소유자가 방문자 행동을 추적하고 사이트 성능을 측정할 수 있도록 Google 애널리틱스 및 Google 태그 관리자에서 설정한 _gat 쿠키의 변형입니다. 이름의 패턴 요소에는 관련된 계정 또는 웹사이트의 고유 ID 번호가 포함됩니다.
_gcl_au	3 개월	Google Tag Manager에서 서비스를 사용하는 웹사이트의 광고 효율성을 실험하기 위해 제공합니다.
_gid	1 일	Google Analytics에서 설치한 _gid 쿠키는 방문자가 웹사이트를 사용하는 방법에 대한 정보를 저장하는 동시에 웹사이트 성능에 대한 분석 보고서를 생성합니다. 수집되는 일부 데이터에는 방문자 수, 출처, 익명으로 방문하는 페이지가 포함됩니다.
동의	2년	YouTube는 포함된 YouTube 비디오를 통해 이 쿠키를 설정하고 익명의 통계 데이터를 등록합니다.
utm_캠페인	과거	Google 광고 서비스는 세션 캠페인 값이 있는 경우 이를 저장하도록 이 쿠키를 설정합니다.
utm_content	과거	이 쿠키는 세션 콘텐츠 값이 있는 경우 저장하는 데 사용됩니다.
utm_source	과거	이 쿠키는 방문자가 원래 웹사이트를 방문한 위치를 기록하는 데 사용됩니다. 이 정보는 웹사이트 운영자가 마케팅 효율성을 파악하는 데 사용됩니다.
utm_term	과거	이 쿠키는 방문자가 원래 웹사이트를 방문한 위치를 기록하는 데 사용됩니다. 이 정보는 웹사이트 운영자가 마케팅 효율성을 파악하는 데 사용됩니다.
VUID	2년	Vimeo는 이 쿠키를 설치하여 웹사이트에 동영상을 임베드하도록 고유 ID를 설정하여 추적 정보를 수집합니다.

쿠키	런닝타임	상품 설명
_fbp	3 개월	이 쿠키는 웹사이트를 방문한 후 Facebook 또는 Facebook 광고로 구동되는 디지털 플랫폼에 광고를 표시하도록 Facebook에 의해 설정됩니다.
_mkto_trk	2년	Marketo가 제공하는 이 쿠키에는 사용자의 사이트 사용을 추적하는 데 사용되는 정보(예: 고유한 사용자 ID)가 있습니다. Marketo가 설정한 쿠키는 Marketo만 읽을 수 있습니다.
fr	3 개월	Facebook은 Facebook 픽셀 또는 Facebook 소셜 플러그인이 있는 사이트에서 웹 전반의 사용자 행동을 추적하여 사용자에게 관련 광고를 표시하도록 이 쿠키를 설정합니다.
IDE	1 년 24 일	Google DoubleClick IDE 쿠키는 사용자가 사용자 프로필에 따라 관련 광고를 제공하기 위해 웹사이트를 사용하는 방법에 대한 정보를 저장하는 데 사용됩니다.
개인화 ID	2년	Twitter는 이 쿠키를 설정하여 소셜 미디어 기능을 통합 및 공유하고 사용자가 추적 및 타겟팅을 위해 웹 사이트를 사용하는 방법에 대한 정보를 저장합니다.
테스트 쿠키	15 분	test_cookie는 doubleclick.net에 의해 설정되며 사용자의 브라우저가 쿠키를 지원하는지 확인하는 데 사용됩니다.
utm_medium	과거	이 쿠키는 방문자가 원래 웹사이트를 방문한 위치를 기록하는 데 사용됩니다. 이 정보는 웹사이트 운영자가 마케팅 효율성을 파악하는 데 사용됩니다.
VISITOR_INFO1_라이브	5 개월 27 일	사용자가 새로운 플레이어 인터페이스를 사용할지 아니면 이전 플레이어 인터페이스를 사용할지를 결정하는 대역폭을 측정하기 위해 YouTube에서 설정한 쿠키입니다.
YS 확장	세션	YSC 쿠키는 Youtube에서 설정하며 Youtube 페이지에 포함된 비디오의 조회수를 추적하는 데 사용됩니다.
yt-원격 연결 장치	못	YouTube는 포함된 YouTube 비디오를 사용하여 사용자의 비디오 기본 설정을 저장하기 위해 이 쿠키를 설정합니다.
yt-원격-기기-id	못	YouTube는 포함된 YouTube 비디오를 사용하여 사용자의 비디오 기본 설정을 저장하기 위해 이 쿠키를 설정합니다.
yt.innertube :: nextId	못	YouTube에서 설정한 이 쿠키는 사용자가 YouTube에서 본 동영상에 대한 데이터를 저장하기 위해 고유 ID를 등록합니다.
yt.innertube :: 요청	못	YouTube에서 설정한 이 쿠키는 사용자가 YouTube에서 본 동영상에 대한 데이터를 저장하기 위해 고유 ID를 등록합니다.

쿠키	런닝타임	상품 설명
_chtbl	세션	가능한 설명이 없습니다.
_dtses	30 분	가능한 설명이 없습니다.
_dtuid	10년	가능한 설명이 없습니다.
BIGipServersj30web-nginx-app_https	세션	설명이 없습니다
이메일	과거	가능한 설명이 없습니다.
gclid	과거	설명이 없습니다
핸들_ip	1 월	가능한 설명이 없습니다.
핸들_랜딩_페이지	1 월	가능한 설명이 없습니다.
handl_original_ref	과거	가능한 설명이 없습니다.
핸들_참조	과거	가능한 설명이 없습니다.
핸들 URL	1 월	가능한 설명이 없습니다.
li_gc	2년	설명이 없습니다
muc_ads	2년	설명이 없습니다
사용자 이름	과거	가능한 설명이 없습니다.

Rescale 플랫폼

살펴보기

HPC & AI 소프트웨어

HPC & AI 아키텍처

규정 준수

에코시스템 통합

가격 정책

서비스형 HPC

인텔리전트 배치

엘라스틱 클라우드 워크스테이션

스토리지 패브릭

Enterprise Management

Multi-Team Management

Performance Management

Software Publisher

디지털 엔지니어링

AI Physics

지식 관리

Computational Pipelines

저자