KAIST, 가상 AI 실험장 개발…거대한 AI서버 구축 전 성능 검증 가능해져 작성일 05-29 55 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">고가 장비 없이도 차세대 AI 반도체 성능 검증<br>AI 서비스 개발 시간·비용 대폭 절감 기대</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="9V574CAiY8"> <figure class="figure_frm origin_fig" contents-hash="0bf5b35737a312558378cbd3b2a6be0d9df2202bc3f242b81f9b75641e576796" dmcf-pid="2f1z8hcnZ4" dmcf-ptype="figure"> <p class="link_figure"><img alt="(왼쪽부터) 박종세 KAIST 교수, 조재홍·최현민 KAIST석사과정, 브랜던 리건 교수가 기념촬영을 하고 있다.ⓒKAIST" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/29/dailian/20260529122804526crdp.jpg" data-org-width="700" dmcf-mid="KbSZ7cd8G6" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/29/dailian/20260529122804526crdp.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> (왼쪽부터) 박종세 KAIST 교수, 조재홍·최현민 KAIST석사과정, 브랜던 리건 교수가 기념촬영을 하고 있다.ⓒKAIST </figcaption> </figure> <p contents-hash="0155de756efcdbb4e285e4565190cf3487b70678926b02b4fdf034b0d358c34b" dmcf-pid="V4tq6lkLGf" dmcf-ptype="general">챗GPT와 같은 거대언어모델(LLM) 서비스를 운영하려면 수만 대 규모의 서버 인프라가 필요하지만 새로운 AI 반도체나 시스템 구조를 검증할 때마다 실제 장비를 구축하는 데에는 막대한 비용과 시간이 소요된다.</p> <p contents-hash="55ab79182e6e266baa0eebd78ace7f355c78e3f26e247548f723c66c183156ed" dmcf-pid="fqWFbwLxGV" dmcf-ptype="general">국내 연구진이 이같은 문제를 해소하고 실제 대규모 AI 서버를 구축하기 전에 컴퓨터 안에서 성능과 효율을 미리 검증할 수 있는 가상 실험장을 개발했다.</p> <p contents-hash="73c4dcc7cbf629d3170449fd56baa3f1a1c8c7e37e660f7e2361c92e32f84ba6" dmcf-pid="4BY3KroMY2" dmcf-ptype="general">한국과학기술원(KAIST)은 전산학부 박종세 교수 연구팀이 개발한 LLM 서비스 인프라 시뮬레이터 연구가 컴퓨터 시스템 성능 분석 분야의 세계적 권위 학회인 ISPASS 2026에서 최우수 논문상을 수상했다고 29일 밝혔다.</p> <p contents-hash="174a1fe6a9e1aabc00e13815ff4d9476e3da19d0965c64fdd7caa7cbcfe38200" dmcf-pid="8bG09mgRZ9" dmcf-ptype="general">연구팀이 개발한 ‘LLMServingSim 2.0’은 복잡한 AI 서비스 환경에서 다양한 하드웨어와 소프트웨어 조합을 가상으로 분석할 수 있는 시뮬레이션 플랫폼이다. 연구자와 개발자들은 값비싼 대규모 서버 인프라를 직접 구축하지 않고도 다양한 설계안을 자유롭게 실험하고 성능을 검증할 수 있다.</p> <p contents-hash="f162df824c9c0a870e148499408434bc5407b69340bc78650e3cf7a518d9306b" dmcf-pid="6KHp2saeHK" dmcf-ptype="general">이번 기술은 기존 그래픽처리장치(GPU) 중심 환경을 넘어 차세대 AI 반도체로 주목받는 신경망처리장치(NPU)와 프로세싱 인 메모리(PIM) 등 다양한 하드웨어 환경을 지원한다는 점에서 주목된다.</p> <p contents-hash="f1f669830ef5418ca4817478889083656e768eb9d81639bf26447b4ca902a67b" dmcf-pid="P9XUVONdGb" dmcf-ptype="general">아직 상용화되지 않은 미래형 AI 반도체를 가상의 데이터센터 환경에서 미리 시험해볼 수 있는 기술이다.</p> <p contents-hash="00a471f1bf07056bc1e8ca2e24a6e58bedcb037e33f4470e7d51459e0080f1cb" dmcf-pid="Q2ZufIjJ1B" dmcf-ptype="general">이를 통해 특정 반도체를 적용했을 때 서비스 속도가 얼마나 향상되는지, 전력 소모는 얼마나 줄어드는지, 수만 대 규모의 서버 환경에서도 안정적으로 동작하는지 등을 컴퓨터 안에서 재현하고 분석할 수 있다.</p> <p contents-hash="7e4a2545769cda41cfa11b79e32a07caed4eb500ea67718fbd569195f3f95047" dmcf-pid="xV574CAiGq" dmcf-ptype="general">또 실제 AI 서비스 운영 과정에서 발생하는 데이터 처리, 요청 분배, 메모리 활용 등 복잡한 동작을 시스템 수준에서 재현해 현실에 가까운 성능 평가가 가능하다.</p> <p contents-hash="5b3bc56a52c2f5ae4287e6fbe9aea46d8279a6fd684f11436fb5f6ffded3a778" dmcf-pid="yInkhfUZ5z" dmcf-ptype="general">특히 여러 서버 자원을 분리·연결해 사용하는 분산형(disaggregated) 인프라 환경까지 분석할 수 있어 차세대 AI 데이터센터 연구에도 활용 가능성이 크다.</p> <p contents-hash="55bb7b6e4e55eea3e985d8a2016097e171ebdf5f9319c368683e4ef2a0059b52" dmcf-pid="WCLEl4u5X7" dmcf-ptype="general">이번 시뮬레이터는 연구자뿐 아니라 LLM 서비스 기업과 AI 반도체 스타트업 등이 차세대 AI 인프라를 설계하고 최적화하는 데 폭넓게 활용될 것으로 기대된다. 새로운 AI 반도체나 서비스 구조를 실제 구축 전에 빠르게 검증할 수 있어 AI 인프라 개발 비용과 시간을 크게 줄일 수 있기 때문이다.</p> <p contents-hash="a507506728c725fa17d860d1914842b56b1e94a03b5a38ba9681b16a9573408a" dmcf-pid="Glgwv6ztGU" dmcf-ptype="general">박종세 교수는 “AI 서비스 경쟁력은 모델 자체뿐 아니라 이를 안정적이고 효율적으로 운영하는 인프라 기술에서 결정된다”며 “시뮬레이터가 연구자와 산업계가 차세대 AI 인프라를 더욱 빠르고 효율적으로 개발하는 데 중요한 기반이 되길 기대한다”고 말했다.</p> <p contents-hash="abf7419879adc0477817c6e4e6e9de9c6a68a1490a3594f05856798583417e5d" dmcf-pid="HSarTPqF5p" dmcf-ptype="general">연구는 전산학부 조재홍 석사과정, 최현민 석사과정 학생이 공동 1저자로 연구를 주도했으며, 연구팀은 지난 2024년 IISWC에 이어 이번 ISPASS 2026에서도 최우수 논문상을 수상하며 AI 인프라 분야 연구 경쟁력을 다시 한번 입증했다.</p> <p contents-hash="528a22450c349e026d8a4484ed90adcea340f6f13387adef534921671f8144c0" dmcf-pid="XvNmyQB3Y0" dmcf-ptype="general">한편 이번 연구는 과학기술정보통신부, 정보통신기획평가원, 한국전자통신연구원, SK하이닉스의 지원을 받아 수행됐다.</p> </section> </div> <p class="" data-translation="true">Copyright © 데일리안. 무단전재 및 재배포 금지.</p> 관련자료 이전 "끔찍한 부상" 삼두근 파열 프로레슬러, 수술로 6개월 휴식 전망…본인은 "몇 주 뒤에 돌아오겠다" 선언 05-29 다음 스노우플레이크, AI 에이전트 보안 기업 나토마 인수 05-29 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.