테슬라 차량 자율주행 H/W … 8개 엔비디아 A100 텐서 코어 기반 1.8 엑사플롭 성능
테슬라 차량 자율주행 H/W … 8개 엔비디아 A100 텐서 코어 기반 1.8 엑사플롭 성능
  • 김현동
  • 승인 2021.06.24 19:18
  • 댓글 0
이 기사를 공유합니다

[2021년 06월 24일] - 테슬라 AI 담당 수석 디렉터 안드레아 카르파티(Andrej Karpathy)는 미 현지시간 6월 19일부터 25일까지 온라인으로 진행되는 비전 컨퍼런스 CVPR 2021에서 오토파일럿 및 자율주행 기능을 위한 심층 신경망(DNN) 훈련 용 슈퍼컴퓨터를 공개했다. 해당 클러스터는 8개의 엔비디아 A100 텐서(Tensor) 코어 GPU(총 5,760 GPU)의 720개 노드를 활용하여 총 1.8 엑사플롭(exaflops) 성능을 구현한다.


안드레아 카르파티 디렉터는 “이 슈퍼컴퓨터는 정말 획기적이다. 실제로, 플롭 측면에서 보면 해당 슈퍼컴퓨터는 세계 5위라 할 수 있다”고 설명했다. 같은 날 엔비디아는 테슬라(Tesla)가 오토파일럿 및 자율주행 기능을 위해 엔비디아 GPU를 활용하고 있다고 밝혔다.

이는 자동차 산업에 전례없는 수준의 컴퓨팅 기술이 적용되면서 가능해진 흐름이다. 테슬라는 자율자행차 엔지니어가 작업을 보다 효율적으로 수행하는 플랫폼을 오랫동안 찾아왔다. 엔비디아 A100 GPU는 규모에 상관없이 가속화를 제공한다. 엔비디아 암페어(Ampere) 아키텍처를 기반으로 하는 A100 GPU는 이전 세대보다 최대 20배 향상된 성능과 요구에 따라 최대 7개의 독립된 GPU 인스턴스로 분할 가능하다.

이렇게 구축한 처리 클러스터는 자율주행에 대한 수직적 통합 접근방식의 일환으로, 이미 도로에서 주행중인 1백만 대 이상의 자동차 데이터를 기반으로 기능을 개선하고 진화 중이다.

예컨대 ‘그림자 모드’로 구동되는 테슬라의 DNN은 실제로 차량을 제어하지 않아도 주행하는 동안 조용히 감지 및 예측을 수행한다. 이 과정에 발생한 예측과 모든 실수 또는 잘못된 식별 같은 인스턴스를 활용해 복잡하고 다양한 시나리오의 훈련 데이터세트를 생성하여 DNN을 개선해왔다.

데이터만 초당 36 프레임으로 녹화된 약 10초 길이의 1백만 개의 클립이 수집되어 총 1.5 페타바이트(PB)에 이른다. 엄청난 양의 데이터가 쌓이면, DNN이 오류 없이 작동할 때까지 데이터센터에서 시나리오를 반복해서 실행된다. 차량으로 다시 전송되고 프로세스가 다시 시작되는 과정이다.

안드레아 카르파티 디렉터는 “현재 구축하고 있는 DNN 스트럭처는 20명의 엔지니어로 구성된 팀이 단일 네트워크에서 동시에 작업할 수 있도록 하며, 병렬 개발을 위한 다양한 기능을 격리시킬 수 있다”고 설명했다. 이 DNN은 이전의 가능했던 반복작업보다 훨씬 빠른 속도로 훈련 데이터세트를 통해 구동된다.

이어 “컴퓨터 비전은 우리가 하는 일의 핵심으로, 오토파일럿을 가능케 한다. 이를 위해 거대한 신경망을 훈련시키고 많은 실험을 해야 한다. 이것이 바로 우리가 컴퓨팅에 상당한 투자를 하고 있는 이유”라고 덧붙였다.


By 김현동 에디터 Hyundong.Kim@weeklypost.kr
보도자료 및 취재문의  PRESS@weeklypost.kr
〈저작권자ⓒ 위클리포스트, 무단전재 및 재배포 금지〉


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.