GPU 기반 추론 워크스테이션 '배틀매트릭스' 힘 주는 인텔 작성일 08-14 23 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">아크 GPU 8개 활용해 최대 1천500억개 LLM 구동..."S/W 지속 개선 예정"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="f0BJk6XDky"> <p contents-hash="48f7206980e5bcb579f5037eff71e2fb5f95e11f7f4ba9bf46b360a708c14a65" dmcf-pid="4wh02HNfNT" dmcf-ptype="general">(지디넷코리아=권봉석 기자)엔비디아·AMD GPU 대비 가격 대비 성능을 극대화한 인텔 AI GPU 워크스테이션 '프로젝트 배틀매트릭스'(Project Battlematrix)가 최근 리눅스용 소프트웨어 정식 버전(1.0)을 공개하고 지속적인 업데이트를 예고했다.</p> <p contents-hash="2234aaf8c0c1798e73f6558b1b79f953dec8e5263f5d77b7d0c2e2697e1eb5ea" dmcf-pid="8rlpVXj4Nv" dmcf-ptype="general">프로젝트 배틀매트릭스는 최대 1만 달러(약 1천383만원) 가격에 1천500억 개 매개변수로 구성된 거대언어모델(LLM)을 처리할 수 있는 AI 추론 특화 워크스테이션이다.</p> <figure class="figure_frm origin_fig" contents-hash="e4825bd5c81cc4bcae15f5f4491de286bb5f6f350260f77392a317f200ea4c0c" dmcf-pid="6mSUfZA8aS" dmcf-ptype="figure"> <p class="link_figure"><img alt="아크 프로 GPU를 최대 8개 탑재 가능한 제온 기반 플랫폼 '프로젝트 배틀매트릭스'. (사진=인텔)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/14/ZDNetKorea/20250814153814993fhzv.jpg" data-org-width="640" dmcf-mid="f0A5qTnbcM" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/14/ZDNetKorea/20250814153814993fhzv.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 아크 프로 GPU를 최대 8개 탑재 가능한 제온 기반 플랫폼 '프로젝트 배틀매트릭스'. (사진=인텔) </figcaption> </figure> <p contents-hash="a823aea2949441bc97fa270cdebf68c6d45fc5858b7198af7ca43af6e37c2c65" dmcf-pid="Psvu45c6kl" dmcf-ptype="general">비용 대비 효율을 중시하는 중/소규모 기업과 개발자 대상으로 클라우드 의존도가 높은 현 AI 워크로드 운영 방식을 온프레미스 중심으로 일부 전환할 수 있는 가능성을 제공한다는 점에서 의미가 크다.</p> <p contents-hash="08687a2d03ff2a99676b26960424db402ba2a2bfa63f562af829ef4236d6e9c3" dmcf-pid="QOT781kPah" dmcf-ptype="general"><strong>5월 아크 프로 GPU 기반 '배틀매트릭스' 공개</strong></p> <p contents-hash="9dd3b381d14b85eb9d1d865c6063cd94d4a7770f6f97a159f4e4bed5ab69a52a" dmcf-pid="xIyz6tEQjC" dmcf-ptype="general">프로젝트 배틀매트릭스는 인텔이 지난 5월 워크스테이션 GPU인 아크 프로 B시리즈와 함께 공개한 AI 워크스테이션 플랫폼이다.</p> <figure class="figure_frm origin_fig" contents-hash="ecd61193f5b7f0384075de491f316c3260668cb6a13202159e460fcf454ab77f" dmcf-pid="yVxESozTjI" dmcf-ptype="figure"> <p class="link_figure"><img alt="주요 그래픽카드 제조사가 시장에 공급중인 아크 프로 B60 탑재 그래픽카드. (사진=인텔)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/14/ZDNetKorea/20250814153816294kouz.jpg" data-org-width="640" dmcf-mid="1B5xa2yjaz" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/14/ZDNetKorea/20250814153816294kouz.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 주요 그래픽카드 제조사가 시장에 공급중인 아크 프로 B60 탑재 그래픽카드. (사진=인텔) </figcaption> </figure> <p contents-hash="0ad5fd91b5993144c78fc38743b95798db35099728da5fea2b9a7f8354beaa8a" dmcf-pid="WfMDvgqyjO" dmcf-ptype="general">Xe2 코어 20개와 24GB 메모리를 탑재한 아크 프로 B60 GPU 최대 8개를 결합해 INT8(정수, 8비트) 기준 1,576 TOPS(1초당 1조 번 연산)급 연산 성능을 구현했다. GPU가 활용하는 메모리 용량은 192GB로 1천500억 개 매개변수로 구성된 거대언어모델(LLM)을 구동할 수 있다.</p> <p contents-hash="d634ef6d2a9301cc1eac472cb63490999e63e3282c314c5512d6a08b29085895" dmcf-pid="Y4RwTaBWNs" dmcf-ptype="general">운영체제 구동에는 워크스테이션급 제온 프로세서를 활용하고 운영체제는 리눅스를 활용하다. 가격대는 5천 달러(약 691만원)에서 1만 달러(약 1천383만원)로 AI 추론 인프라에 대한 진입 장벽을 낮추는 것을 목표로 한다.</p> <p contents-hash="80f26eebe105b48d2b6fc80aa613b8d59fb8c735f780318fb82759849309a651" dmcf-pid="G8eryNbYcm" dmcf-ptype="general"><strong>LLM 스케일러 1.0 공개... 추론 속도 최대 4배 향상</strong></p> <p contents-hash="f2303f097f8ca54cac6daa0c584e5085c583aa02c0b651572406eb223a27200f" dmcf-pid="H6dmWjKGkr" dmcf-ptype="general">인텔은 배틀매트릭스용 소프트웨어 구축에 CPU와 GPU, NPU와 가속기 등 연산 자원을 모두 활용하는 원API(OneAPI)를 활용하고 이를 지속적으로 개선하고 있다.</p> <p contents-hash="25fb266e7b03f363a55fd3d6667252d7b9379bc3c40b57a45de183284502cd33" dmcf-pid="XPJsYA9How" dmcf-ptype="general">이달 초순 공개된 LLM 스케일러 1.0 버전은 초기 버전 대비 LLM 처리 속도 향상에 중점을 뒀다. 매개변수 320억 개 규모 모델 기준 처리 속도는 1.8배, 700억 개급 모델 처리 성능은 4.2배 높아졌다.</p> <figure class="figure_frm origin_fig" contents-hash="213c8d3cfb349f0993efd0f4e84f7b32102001b3304ed106528b7cd8f8dcf671" dmcf-pid="ZQiOGc2XaD" dmcf-ptype="figure"> <p class="link_figure"><img alt="프로젝트 배틀메이지용 리눅스 소프트웨어 스택. (자료=인텔)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/14/ZDNetKorea/20250814153817557xqis.png" data-org-width="638" dmcf-mid="2Bqase3INY" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/14/ZDNetKorea/20250814153817557xqis.png" width="658"></p> <figcaption class="txt_caption default_figure"> 프로젝트 배틀메이지용 리눅스 소프트웨어 스택. (자료=인텔) </figcaption> </figure> <p contents-hash="6360bdf875e7d613b37fad254993d9d8fde37737873407784002d4f6845c3a3c" dmcf-pid="5xnIHkVZoE" dmcf-ptype="general">레이어별 온라인 양자화를 통해 GPU 메모리 요구량을 줄였고, vLLM 기반 파이프라인 병렬 처리를 실험적으로 도입해 대규모 모델 추론의 병목을 완화했다.</p> <p contents-hash="4d84163a4eb78bb942c95a5f76b1f460e73b0d2209a5f2ce4b3dcfbe73b1b0fd" dmcf-pid="1fMDvgqyok" dmcf-ptype="general">임베딩·재순위 모델 지원, 멀티모달 입력 처리 강화, 최대 길이 자동 감지, 데이터 병렬 처리 최적화 기능도 새롭게 추가됐다.</p> <p contents-hash="b0ed8b683742278adb4a42647bf086508951fe366cceb14ed4e00e45185de7ca" dmcf-pid="t4RwTaBWcc" dmcf-ptype="general">원격 관리가 필요한 기업 환경에서 GPU 전력 관리와 펌웨어 업데이트, 메모리 대역폭 모니터링 등 기능을 갖춘 XPU 매니저를 추가했다. GPU 1개를 여러 가상화 인스턴스가 활용할 수 있는 SR-IOV 기능도 추가했다.</p> <p contents-hash="9e71718961c93669f74e5ef99f10b7fd4c22f2d85904d661485e41e07b24d6bb" dmcf-pid="F8eryNbYoA" dmcf-ptype="general"><strong>중소기업·개인 개발자 위한 온프레미스 추론 인프라 제공</strong></p> <p contents-hash="13d3155e59eae31ff7fc8f9082fe6a77301ec3e57ea0c74f83628a15f6dadfad" dmcf-pid="36dmWjKGaj" dmcf-ptype="general">현재 GPU 시장은 엔비디아와 AMD가 성능 중심의 서버 시장을 양분하다시피 하는 상황이다. 반면 인텔이 하바나랩스 인수 후 출시하고 있는 AI 가속기인 가우디3는 제한적인 시장 점유율을 확보하고 있다.</p> <figure class="figure_frm origin_fig" contents-hash="47e67c1e60cea6883fbe50d451bcffc89618661dc40293a6ba58d40b253f5b62" dmcf-pid="0PJsYA9HoN" dmcf-ptype="figure"> <p class="link_figure"><img alt="인텔 가우디3 AI 가속기. (사진=인텔)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/14/ZDNetKorea/20250814153819053hyfk.jpg" data-org-width="640" dmcf-mid="VWX9RUsdoW" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/14/ZDNetKorea/20250814153819053hyfk.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 인텔 가우디3 AI 가속기. (사진=인텔) </figcaption> </figure> <p contents-hash="ec9795acf9c0100601cc8cda9a26065a55f7625bfa7f8fd4aff4eaa972a83f9f" dmcf-pid="pQiOGc2Xca" dmcf-ptype="general">배틀매트릭스는 정체된 서버 시장 대신 합리적인 가격·멀티 GPU 확장성·관리 편의성을 무기로 중소기업과 개인 개발자층을 직접 공략하기 위한 제품이다.</p> <p contents-hash="9282a6f2427811e8d1502a9a4e392b44deeb423f857b0050dd18ab277bd3a98e" dmcf-pid="UxnIHkVZog" dmcf-ptype="general">향후 로드맵도 공격적이다. 인텔은 이달 LLM 스케일러 공개에 이어 오는 SR-IOV 고도화, VDI 지원, 관리 소프트웨어 배포 기능 등 모든 기능을 구현한 완전판을 공개 예정이다.</p> <p contents-hash="5494d5b6ff891d4bae92ba0cd48de1ceeb565d7639a0afd1d9a3ae544a231cdd" dmcf-pid="uMLCXEf5ao" dmcf-ptype="general">권봉석 기자(bskwon@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p> 관련자료 이전 ‘파인 촌뜨기들’ 임수정, 인생캐 경신 08-14 다음 뜨거워지는 바닷물에 원전 비상…10년 안에 8기 가동 중단 위기 08-14 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.