안녕하세요! 오늘은 글로벌 반도체 산업에서 중추적인 역할을 하고 있는 인텔(Intel)의 AI반도체 개발에 대해 자세히 알아보겠습니다. 특히 최근 인텔이 기업을 위한 맞춤형 생성형 AI 모델 가우디3와 산업 표준 이더넷을 중심으로 AI 전략을 공개하면서 새로운 AI 컴퓨팅 시대에서도 AI반도체 주력 회사로 떠오를지 관심이 집중되고 있습니다. 인텔의 AI반도체에 대해 더 알아볼까요

인텔(Intel) 회사 개요
인텔은(Intel Corporation)은 발도체 설계와 제조를 하는 미국의 다국적 기업입니다. 세계에서 가장 큰 반도체 제조사로 본사는 캘리포니아주 샌타클라라에 있습니다. 인텔은 1968년 7월 18일에 고든 무어와 로버트 노이스가 설립한 회사로 Integrated Electronics의 혼성어입니다. 그러나 ‘intelligence’라는 영어 단어에서 유래하였다고 오해하는 경우도 있습니다.
레슬리 배다스의 감독 하에 1971년 최초의 마이크로프로세서인 인텔 4004를 만들었으며 이후 만들어진 인텔 8088이 IBM PC에 장착되면서 유명해졌습니다. 이때 만들어진 x86 명령어 아키텍처는 확장을 통해 지금까지 데스크탑 시장에서 널리 쓰이게 되었습니다. 인텔은 혁신적인 기술과 지속적인 연구 개발을 통해 시장에서의 리더십을 유지하고 있으며, 특히 고성능 컴퓨팅, 클라우드 컴퓨팅, 인공지능 분야에서 중요한 역할을 하고 있습니다.’
인텔은 자사의 AI 칩 개발에서 범용성과 통합성에 중점을 두고 있습니다. 인텔의 AI 칩은 주로 기존의 CPU 아키텍처를 기반으로 하며, AI 기능을 강화하기 위해 특정 AI 가속기를 통합하는 방식을 채택합니다. 하지만 인텔의 주요 고객은 마이크로소프트, 알파벳과 같은 클라우드 사업자들이 아닌 AI 가속기를 필요로 하는 기업들을 타깃으로 합니다. 인텔은 기업들에게 서버를 만들어 공급하는 OEM 기업들인 델 테크놀로지 (DELL), 휴렛 패커드 (HPE), 슈퍼마이크로 (SMCI) 등과 주로 협력할 계획인데 이는 엔비디아와 직접적인 경쟁은 아니라는 것을 의미합니다.
가우디 3가 판매되기 시작하는 올해 2분기에서 3~6개월만 더 지나면 엔비디아의 Blackwell GPU가 출시될 예정이기 대문에 클라우드 사업자들 입장에서는 가우디3를 굳이 살 유인이 없는 것입니다. 이에, 인텔은 성능을 우선시하는 클라우드 사업자들을 공략하는 대신 가격을 신경 쓸 수밖에 없는 기업들을 목표로 합니다.
인텔의 제온6
인텔은 2024년 비전 컨퍼런스에서 생성형 AI를 포함한 AI반도체에 대한 야심찬 로드맵을 제시하였습니다. 이 로드맵의 중심에는 생성형 AI전용 제품인 제온6와 가우디3GPU가 있습니다. 인텔의 가우디 3 GPU와 제온 6 CPU는 엔비디아의 블랙웰 H100, H200 GPU보다 더 적은 전력으로 작동하므로 더 저렴하고 효율적인 칩은 “성능”을 유지하면서 생성형 AI 도구의 막대한 전력 소비를 줄이는 데 도움이 될 것입니다.

이 비전 컨퍼런스에서 인텔은 검색 증강 생성(retrieval augmented generation), 일명 RAG라고 부르는 과정을 처리할 수 있는 인텔 제온 6 프로세서를 발표했습니다. RAG는 생성형 AI LLM이 기존에 학습된 방대한 온라인 데이터 세트 외에 외부의 지식 베이스를 참조해 답변 내용을 최적화하므로 RAG 소프트웨어를 사용하면 LLM은 기업의 특정 데이터베이스나 문서 세트에 실시간으로 액세스할 수 있습니다.

예를 들어, RAG를 지원하는 LLM은 의료 시스템 환자에게 약물 조언, 진료 예약, 처방전 리필, 의사 및 병원 서비스 찾기 등의 서비스를 제공합니다. 사용자 기록을 수집해 더 정확하고 상황에 적합한 생성형 AI 기반 챗봇 응답을 생성하는 것도 가능하며 업데이트되는 외부 소스를 지속해서 검색해 답변 내용에 포함하므로 최신 정보를 사용자에게 제공하는 장점도 있습니다.
인텔은 RAG, 더 세분된 LLM을 통해 기업이 자사 데이터를 활용하면서 동시에 보호할 수 있도록 지원한다는 구상이다. 인텔은 이를 신뢰할 수 있는 컴퓨팅, 신뢰할 수 있는 도메인 보안이라고 부른다. 인텔의 이런 모델은 더 작은 시스템인 제온 프로세서에서 실행할 수 있으며 NPU로 강화된 프로세서에서 처리하는 것도 가능한데 어느 쪽이든 거대한 하드웨어 인프라에 수십억 달러를 투자하지 않고도 생성형 AI 작업을 할 수 있게 되는 것입니다. 가우디 3, 그래닛 래피즈 또는 시에라 포레스트 제온 프로세서는 기업이 필요로 하는 LLM을 처리하는 데 적합하다”라고 말했다.
인텔의 가우디3
인텔이 엔비디아의 독주에 맞서는 전략으로 내세우는 것은 표준 이더넷으로 엔비디아의 독점적인 컴퓨터 네트워킹 CUDA에 대한 인텔의 대응 전략이기도 합니다.
엔비디아의 가장 큰 장점은 CUDA 플랫품으로 여기에는 AI가속기를 통해 모델을 훈련하는 데 필요한 여러 알고리즘과 소프트웨어가 포함되어 있습니다. 2006년부터 만들었기 때문에 소프트웨어의 깊이나 범위가 매우 넓다는 장점이 있습니다. 이를 이용하면 개발자가 GPU 하드웨어에 대한 전문 지식이 없어도 API를 통해 GPU 리소스를 활용할 수 있어 CUDA 플랫폼은 생성형 AI 가속 컴퓨팅의 업계에서 상당히 널리 쓰이지만 엔비디아 하드웨어에서만 작동합니다.
인텔은 후발주자이므로 자체적으로 플랫폼을 만들기보다는 다른 기업과 협력하는 방안을 택했습니다. 인텔은 AI에 최적화된 이더넷 솔루션인 UEC(Ultra Ethernet Consortium)를 통해 대규모 스케일업 및 스케일아웃 AI 패브릭을 설계하고자 하며 이를 통해 점점 더 많은 AI 개발자가 CUDA에서 탈출해 모델을 더 쉽게 전송하길 바라고 있습니다. 최근 인텔은 가우디3를 소개하면서 “가우디 3 칩은 가격과 개방형 표준, 그리고 데이터센터 친화적인 이더넷을 사용하는 통합 온칩 네트워크 덕분에 매우 경쟁력 있는 제품이 될 것으로 기대한다”라고 주장했습니다. 실제로 가우디 3에는 24개 이더넷 포트가 있어서 다른 가우디 칩 간의 통신과 서버 간의 통신에 사용됩니다. 인텔은 가우디3의 가격 경쟁력을 강조해 시장 공략에 나설 방침입니다. 가우디 3 가속기는 학습과 추론을 위한 여러 비용 효율적인 클라우드 거대언어모델(LLM) 인프라를 지원해 기업들에게 가격 대비 성능의 이점과 선택권을 제공하고자 하며 가우디3는 2024년 2분기부터 델 테크놀로지스(Dell Technologies), HPE, 레노버(Lenovo), 슈퍼마이크로(Supermicro)를 비롯한 OEM 시스템에 탑재될 예정입니다.

AI반도체 시장의 평가
이러한 인텔의 야심찬 전략 발표에 대해 업계 애널리스트들은 인텔의 전략이 치밀한 것은 맞지만, 데이터센터 AI GPU 시장의 약 90%, 전체 AI 칩 시장의 80%를 차지하는 엔비디아를 따라잡기에는 역부족이라는 데 대부분 동의합니다. 무디스 인베스터스 서비스(Moody’s Investors Service)의 수석 부사장인 라지 조시는 “시간이 지나면 엔비디아 데이터센터 매출의 절반 이상이 클라우드에서 실행되는 AI 서비스에서 나올 것이다. 구글, 아마존과 같은 클라우드 서비스 업체는 각각 AI 중심 워크로드를 처리하기 위해 자체 GPU를 보유하고 있다는 점도 간과해서는 안 된다”라고 언급하였습니다.
결론적으로, 인텔과 엔비디아는 각각의 기술적 강점과 전략적 초점을 바탕으로 AI 반도체 시장에서 중요한 역할을 하고 있습니다. 선택의 문제는 특정 AI 응용 프로그램의 요구 사항과 그 성능, 비용, 사용 용이성으로 향후 AI시장에서도 과연 인텔이 시장 점유율을 확대할지는 더 지켜보아야 할 것입니다.