미래 난제 해결 병렬 프로세싱! 그래프코어(Graphcore) 한국 진출
미래 난제 해결 병렬 프로세싱! 그래프코어(Graphcore) 한국 진출
  • 김현동
  • 승인 2020.02.05 23:30
  • 댓글 0
이 기사를 공유합니다

“향후 10년 동안 발생할 문제 해결?” 핵심은 IPU

[취재현장] 미래 난제 해결 병렬 프로세싱! 그래프코어(Graphcore) 한국 진출




[2020년 02월 05일] - “어떻게 다르다는 거죠?” 장내 분위기는 이 한 줄로 갈음하겠습니다. 엔비디아가 AI로 오랜 시간 투자한 내용을 업계 관계자라면 모를 리 없죠. 활동 영역이 미묘하게 겹치기에 현장 기자 반응 또한 알 수 없다는 반응이 다분했습니다. 물론 현장에서 반복해서 들린 딥러닝, AI, 신약개발, 우주 등 단어만 들으면 떠올리는 그것은 머지않은 시기에 마주할 ‘미래’입니다. 2020년을 4차 산업 혁명의 실체가 등장하는 시기라고 하더군요. 그래서 이를 풀어내는 기술이 바로 미래를 여는 핵심 출구인 셈이죠. 삼성전자가 투자자로 알려졌는데, 시장을 리드하지 못하면 뒤처지는 것이 자명한 현실에서 미래 먹거리를 굳이 마다할 이유가 없겠습니다.

AI 반도체 대표기업이라 주장하고 한국 시장에 진출한 그래프코어 이야기입니다.

이 회사가 내세운 것은 메모리 일체형 프로세서인 콜로서스(Colossus) IPU(지능 처리 장치:Intelligence Processing Unit)입니다. 이론상 데이터 처리 속도를 최대 100배까지 높일 수 있다고 주장합니다. 핵심은 독자설계죠. 콜로서스(Colossus) IPU(지능 처리 장치:Intelligence Processing Unit)는 기존 중앙처리장치(CPU)나 GPU와 달리 프로세서에 직접 메모리를 배치했습니다.

덕분에 학습 및 추론 모델을 메모리에 올려 연산하는데요. 아무래도 일체형 설계로 CPU, D램, GPU 간 지연을 최소화했기에 속도는 당연히 빨라졌겠죠. 자연어처리(NLP)까지 가능하도록 설계해 의료, 신약개발 등에 무게가 실리고 있습니다. 1,200개 이상의 병렬 코어로 150W에서 125 TFLOPS의 연산속도를 갖췄습니다.


CPU, GPU가 아닌 IPU를 내세운 것도 다릅니다. 첫 상용 제품은 지난 2018년에 출시된 16㎚ PCI 고속 카드 C2입니다. TSMC 위탁 생산한 16코어 팩과 236억 개의 트랜지스터로 구성한 메모리 중심적 병렬 프로세서는 단일 칩 1,216 IPU 기준 코어당 최대 100G FLOPS 이상으로 45TB/s의 메모리 대역폭을 갖춘 300MB 용량 메모리와 짝을 이루며 최대 7,000개 이상의 프로그램을 병렬로 실행하는 능력도 갖췄습니다. 쉽게 말해서 괴물입니다.

개발사의 주장을 빌려 표현하자면 연산 성능(카드당 2배 이상 향상), 엣지에서의 전송속도 지연을 최소화하고(실시간 애플리케이션에서 탁월), 기계 학습 소요 시간을 줄이고, 전력 효율적으로 메모리를 사용합니다. 또한 학습과 추론에 동일한 HW 및 SW를 사용하기에 유연성이 우수하며, 엣지부터 클라우드까지 최근 시류까지 모두 대응한다네요. 제조사의 어깨에 한층 힘이 실릴 만 합니다.

이번에 한국에 진출하면서 사령탑에 오른 강민우 지사장은 “그래프코어 IPU는 기존에 경험해보지 못한 빠른 학습과 추론을 위한 속도를 보장한다. AI 프로젝트를 진행하는 공공 기관을 비롯하여 주요 기업과 연구소에서 사용하는 데이터센터에 공급할 것이다”라며, “국내 기업 고객들의 변화하는 수요에 맞춰 공격적으로 시장을 개척하고, 최적의 제품과 서비스 제공을 위해 조직 확대 및 지원에 적극적으로 나설 것이다”라고 속내를 드러냈습니다.

참고로 강 지사장은 오버랜드와 데이터 도메인, 블랙아이옵스, 퓨어스토리지, 루브릭, 엑사그리드 등의 다국적 기업 지사장을 거쳐 그래프코어에 안착했습니다. IT 전반의 고객 지원과 영업 분야에서 높게 평가받는 인재인데요. 약 20년 이상 업계 경쟁력을 발판으로 국내 진출에 가장 적임자로 발탁됐다고 합니다.

그렇다면 어떠한 회사이길래 시작부터 남다른 계획에 포부까지 남다른 걸까요?

대중에게는 생소하지만, GPU 머신러닝 분야에서는 이미 기술력 하나로 남다른 입지를 자랑합니다. 지난 2016년 영국 브리스톨에서 나이젤 툰(Nigel Toon) 최고경영자(CEO)와 사이먼 놀스(Simon Knowles) 최고기술책임자(CTO)가 창업했습니다. 창업 이유가 좀 독특한데요 ‘AI 시대와 머신러닝에 특화한 반도체의 필요성’이랍니다. 당장의 결실이 아닌 미래를 위한 투자인데 현재 미국과 유럽, 한국, 일본을 비롯해 전 세계에 지사를 둔 것은 물론 알만한 브랜드가 투자자로 합류했습니다.

서두에서 언급했던 삼성전자를 포함해 보쉬 벤처캐피털(Robert Bosch Venture Capita), 델 테크롤로지 캐피털(Dell Technologies Capital), 아마데우스 캐피털파트너스(Amadeus Capital Partners), C4벤처스, 드라퍼 에스프리트(Draper Esprit), 파운데이션 캐피털, 피탕고 캐피털(Pitango Capital), 암(Arm) 공동 창업자 헤르만 하우저(Hermann Hauser)와 딥마인드(DeepMind) 공동 창업자 데미스 하사비스(Demis Hassabis) 등이 총 3억 달러(약 3500억 원)에 달합니다. 이를 현재 기업 가치로 상환하면 15억 달러(약 1조 7400억 원)에 달한다니 약 약 4년 만에 남다른 성장세를 달성한 셈입니다.


4년이나 지난 회사인 만큼 사례도 탄탄합니다. 지난해 MS가 클라우드 컴퓨팅 플랫폼 '애저(Azure)'에 그래프코어 IPU를 도입해 AI 개발 환경을 제공한다고 밝힌 바 있습니다. 애저 플랫폼 안에서 머신러닝이나 자연어처리(NLP) 등을 활용해 새로운 서비스나 제품을 개발할 수 있는 것인데요. 일부러 Dell 서버 랙 규격에 맞춰 제조했기에 필요하다면 당장이라도 제품을 발주하고 머신 인텔리전스 컴퓨팅을 구축할 수 있게 했습니다.

두 개가 상호로 연결된 콜로서스(Colossus) IPU는 각각 16코어 팩과 236억 개의 트랜지스터로 구성했습니다. 단일 칩의 1,216 IPU는 코어당 최대 100GFLOPS(1G FLOP은 초당 약 10억 부동 소수점 연산에 해당)이상으로 300MB 메모리와 짝을 이룰 수 있으며 최대 1만 개의 프로그램을 병렬로 실행할 수 있습니다. 마찬가지로 제조사 표현을 그대로 빌리자면 이론적인 최대치는 HBM2 그래픽 칩 메모리보다 100배 이상 높다고 강조했답니다.

공식 발표회에 참여한 파브리스 모이잔(Fabrice Moizan) 그래프코어 미국 영업 및 비즈니스 총괄 부사장의 목소리에는 한층 힘이 실렸죠. “그래프코어 IPU는 기존 CPU 및 GPU를 사용하는 것과 비교하여 데이터 처리 속도가 10배에서 최대 100배까지 빠르고, GPU보다 전력 사용량이 2배 이상 적어 데이터를 분석해서 컴퓨터 스스로 판단하고 학습할 수 있는 능력인 '머신러닝'에 더 적합하다”라며, “전 세계 AI 시장에서 큰 역할을 하는 한국 고객들의 혁신 제품 개발과 서비스 확대 수요에 맞춘 최적의 IPU 공급을 위해 지속적인 지원과 투자에 나설 것이다”고 관심을 당부했습니다.


By 김현동 에디터 hyundong.kim@weeklypost.kr
〈저작권자ⓒ 위클리포스트, 무단전재 및 재배포 금지〉