게시된 날짜: Nov 1, 2017
Apache MXNet 버전 0.12가 이제 두 가지 중요한 새 기능인, NVIDIA Volta GPU 및 스파스 텐서에 대한 지원을 제공합니다.
NVIDIA Volta GPU 아키텍처에 대한 지원
MXNet v0.12 릴리스가 NVIDIA Volta V100 GPU를 추가로 지원합니다. 이제 Pascal GPU에서보다 최대 3.5배 빠르게 컨볼루션 신경망을 학습할 수 있습니다. Volta GPU 아키텍처는 혼합 정밀도 학습을 지원하는 텐서 코어를 도입했습니다. 텐서 코어의 혼합 정밀도 덕분에 사용자는 대부분의 네트워크 계층에 FP16과 필요할 때만 정밀도가 더 높은 데이터 유형을 사용하여 정확성을 저해하지 않고 최적의 학습 성과를 달성할 수 있습니다. Volta 텐서 코어를 활용하면 간단한 명령을 전달하여 MXNet에서 FP16 학습을 지원할 수 있습니다.
최근에 새로운 AWS Deep Learning AMI 세트를 발표했습니다. 이 세트에는 Amazon EC2 P3 인스턴스 패밀리의 NVIDIA Volta V100 GPU에 최적화된 MXNet v0.12를 비롯한 다양한 딥 러닝 프레임워크가 사전 설치되어 있습니다. AWS Marketplace에서 클릭 한 번으로 시작할 수 있거나 이 단계별 지침을 따라 노트북에서 처음 시작해 볼 수도 있습니다.
스파스 텐서 지원
MXNet v0.12가 텐서를 효율적으로 저장 및 계산하여 개발자가 저장 및 컴퓨팅에 효율적인 방식으로 희소 행렬 작업을 수행하고 딥 러닝 모델을 더 빠르게 학습할 수 있도록 스파스 텐서를 추가로 지원합니다. 이 릴리스는 두 가지 주요 희소 데이터 형식인 CSR(Compressed Sparse Row)과 RSP(Row Sparse)를 지원합니다. CSR 형식은 각 행에 0이 아닌 요소만 있는 다수의 열로 구성된 행렬을 나타내기 위해 최적화되어 있습니다. RSP 형식은 대부분의 행 조각이 완전히 0인 다수의 행으로 구성된 행렬을 나타내기 위해 최적화되어 있습니다. 이 릴리스는 행렬 내적 및 요소별 연산자 등 가장 일반적으로 사용되는 연산자의 CPU에 대한 희소 지원을 제공합니다. 더 많은 연산자에 대한 희소 지원이 향후 릴리스에 추가될 예정입니다.
이 자습서를 통해 MXNet에서 새로운 희소 연산자를 사용하는 방법을 알아보십시오.