엔비디아 A100 GPU 기반 인스턴스, 마이크로소프트 애저에서 로딩
엔비디아 A100 GPU 기반 인스턴스, 마이크로소프트 애저에서 로딩
  • 김현동
  • 승인 2021.06.03 14:11
  • 댓글 0
이 기사를 공유합니다

[2021년 06월 03일] - 엔비디아는 마이크로소프트가 운영하는 클라우드 서비스 애저 팀과의 협업을 통해 스케일 업(scale-up) 및 스케일 아웃(scale-out) 형태의 AI 플랫폼을 새롭게 설계했다. 엔비디아 암페어(Ampere) 아키텍처 기반 GPU, 그리고 엔비디아 네트워킹 기술과 애저의 고성능 인터커넥트 및 VM 패브릭을 결합하여 누구나 손쉽게 사용 가능한 AI 슈퍼컴퓨팅을 표방하는 서비스다.


AI 및 HPC와 관련된 주요 과제 해결을 앞당기는데 필요한 것은 규모(scale)라는 것은 모두가 동의하는 부분이다. 실제 자연어 처리, 추천 시스템, 헬스케어 연구, 약물 발견 및 에너지와 같은 분야는 가속 컴퓨팅을 통해 비약적인 발전을 이뤄왔다. 추세가 더욱 가속화되기 위해서는 애플리케이션이 실행되는 아키텍처가 유연하고 접근성이 높으며, 스케일 업 및 스케일 아웃 형태가 필요하다.

엔비디아 ND A100 v4 VM은 단일 VM에서 8개의 A100 GPU와 GPU당 200GB/s의 데이터 대역폭을 지원하는 HDR 인피니밴드를 결합해 구현했다. 회사는 VM당 무려 1.6Tb/s에 이르는 인터커넥트 대역폭 구현을 내세웠다. AI 및 HPC 워크로드의 경우에도 동일한 저지연 인피니밴드 패브릭에서 수천 개의 A100 GPU로 확장할 수 있고, 다중 노드 분산 컴퓨팅을 위한 컴퓨팅 및 네트워킹 기능 모두를 지원할 수 있다.

개발 편의도 개선된다. 개발을 간소화하고 개발시간을 단축할 수 있도록 즉시 사용 가능한 GPU 최적화 애플리케이션 프레임워크와 컨테이너, 사전 훈련된 모델, 라이브러리, SDK, 헬름 차트(Helm chart)로 구성된 엔비디아 NGC 카탈로그가 제공된다. 또한, 관리형 서비스인 애저 쿠버네티스 서비스(Azure Kubernetes Service)를 통해 컨테이너형 애플리케이션을 배포하고 관리할 수 있다.


By 김현동 에디터 Hyundong.Kim@weeklypost.kr
보도자료 및 취재문의  PRESS@weeklypost.kr
〈저작권자ⓒ 위클리포스트, 무단전재 및 재배포 금지〉



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.