“도메인별로 뾰족하게 깎은 AI”… LGU+, ‘익시젠’으로 한국형 sLLM 전략 본격화 작성일 11-04 46 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">LGU+ ‘익시젠’ 논문, ‘EMNLP 2025’서 채택<br>통신·금융서 성능 향상… 실용성 인정받아<br>김기현 연구위원, 박성익 팀장 인터뷰</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="PB3DoUmjTd"> <figure class="figure_frm origin_fig" contents-hash="c09f03654818bb1012ca847250a344321b89dd9a2a480fc72d9b53bce34c2f2e" dmcf-pid="Qb0wgusASe" dmcf-ptype="figure"> <p class="link_figure"><img alt="김기현(오른쪽) LG유플러스 CTO AX기술그룹 연구위원과 박성익 LG유플러스 CTO AX기술그룹 AI테크랩 기술팀장이 디지털타임스와 인터뷰하고 있다. LG유플러스 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/04/dt/20251104162448571wqln.jpg" data-org-width="640" dmcf-mid="q9zIcblwTc" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/04/dt/20251104162448571wqln.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 김기현(오른쪽) LG유플러스 CTO AX기술그룹 연구위원과 박성익 LG유플러스 CTO AX기술그룹 AI테크랩 기술팀장이 디지털타임스와 인터뷰하고 있다. LG유플러스 제공 </figcaption> </figure> <p contents-hash="e6ce6d9487b127d905a303d63d393589f8f2cf61c6a91c5002b58e24f82f9650" dmcf-pid="xKpra7OchR" dmcf-ptype="general"><br> “인공지능(AI) 경쟁의 핵심은 크기가 아니라 ‘뾰족함’입니다. 산업마다 특화된 영역을 얼마나 잘 깎아내느냐가 관건이죠.”</p> <p contents-hash="b5b5d3a242cf04850e03cf1df0d98ee3780bc8d113412fbfcc12dd5a0806aac5" dmcf-pid="ymjb3k2ulM" dmcf-ptype="general">김기현 LG유플러스 CTO AX기술그룹 연구위원은 4일 디지털타임스와의 인터뷰에서 초거대언어모델(LLM)의 크기를 키우는 경쟁이 한계에 다다랐다고 지적했다. 대신 그래픽처리장치(GPU) 인프라·비용·데이터 보안 등 한국 기업이 맞닥뜨린 현실적 제약 속에서 작지만 정밀한 소형언어모델(sLLM)을 도메인별로 최적화하는 전략이 실효성 있다고 강조했다.</p> <p contents-hash="317058795e5f0f27a206de6a6740427d8a5a5f39eb09c66cb2b807276a2d2f14" dmcf-pid="WsAK0EV7hx" dmcf-ptype="general">LG유플러스가 자체 생성형 AI 모델 ‘익시젠’을 기반으로 작성한 한 논문이 세계적 자연어처리(NLP) 학회 ‘EMNLP 2025’에 최근 채택됐다. 논문은 산업 데이터를 지속적으로 학습하면서도 범용 언어 능력을 유지하는 ‘도메인 특화 학습’(DACP) 기법을 제안했다. 박성익 LG유플러스 CTO AX기술그룹 AI테크랩 기술팀장은 “GPU 자원이 한정된 기업이 작은 모델로 큰 모델 수준의 성능을 내는 방법을 제시한 점이 높은 평가를 받았다”며 “가성비 높은 산업형 AI 전략의 가능성을 보여준 논문”이라고 설명했다.</p> <p contents-hash="e7f94d96eda88f8ebeeaa7bc177bb046810e6b8b3b0e3d0db8f6ec295423440c" dmcf-pid="YOc9pDfzWQ" dmcf-ptype="general">핵심은 도메인 특화 학습이다. 기존 기업들이 사전학습된 범용 LLM을 가져와 소량의 도메인 데이터로 미세조정(파인튜닝)하는 데 그쳤다면, LG유플러스는 약 300기가바이트(GB) 규모의 산업 데이터를 사전학습 단계부터 주입했다. 김 연구위원은 “파인튜닝의 미세 조정이 아니라 지식 자체를 각인시키는 접근”이라며 “산업 언어에 둔감한 범용 모델의 한계를 넘었다”고 말했다.</p> <p contents-hash="38f0e5ea37330855b387a8bd99c3c2e61f19d6d33379e9cbfd828a9c6cb8715c" dmcf-pid="GIk2Uw4qyP" dmcf-ptype="general">인간의 ‘뇌’와 같이 AI 또한 ‘파괴적 망각’(catastrophic forgetting)이 숙제로 꼽힌다. 새 지식을 학습하는 과정에서 이전에 학습했던 지식이 손실되는 식이다. 연구팀은 리플레이를 적용해 도메인 데이터와 범용 데이터를 균형 있게 섞어서 학습시켰다. 박 팀장은 “이전에는 산업 특화 성능을 올리면 일반 언어 이해가 내려갔지만, 이번엔 두 축을 동시에 유지하도록 설계했다”고 말했다. 그는 “작은 모델로도 큰 모델 수준의 체감 성능을 내자, 비용과 인프라 부담이 큰 기업 고객의 반응이 즉각적이었다”며 “실제 서비스 환경에서 재현 가능한 결과라 EMNLP에서도 산업적 실용성을 인정받았다”고 전했다.</p> <p contents-hash="757742c7be9170511e85648a68547d85f28d6c70a6ca5776c96d8ac237b336ca" dmcf-pid="HCEVur8BT6" dmcf-ptype="general">LG유플러스는 LLM 경쟁 대신 ‘작고 효율적인 AI’ 전략에 속도를 낸다. 김 연구위원은 “빅테크는 돈이 많지만 국내 기업들은 현실적으로 인프라와 비용 한계가 있다”며 “한국 시장에서는 작은 모델을 도메인별로 정밀하게 다듬는 방식이 현실적”이라고 말했다.</p> <p contents-hash="7f2a9f57bb4db6a080f96444a4d135059d50a933e79d3f31086596e10e422c4e" dmcf-pid="XhDf7m6bW8" dmcf-ptype="general">연구팀은 DACP를 자사 통신 상담 및 금융 영역에 적용해 실제 성능을 검증했다. 김 연구위원은 “통신 분야에서 평균 56%, 금융 분야에서 39%의 성능 향상을 확인했다”며 “특정 도메인 데이터를 학습하면서 기존 지식을 잊지 않도록 리플레이(replay) 학습을 병행했다”고 말했다.</p> <p contents-hash="f246f1e60728664f8ca209bf52c4d04838ac30f3c44202d3c5c9340f4b3f862c" dmcf-pid="Zlw4zsPKW4" dmcf-ptype="general">LG유플러스는 통신을 넘어 금융, 교육, 법률, 의료 등으로 적용 영역을 확장할 계획이다. 박 팀장은 “DACP는 통신 전용 레시피가 아니라 여러 산업에 이식 가능한 표준 파이프라인”이라며 “특히 온프레미스·보안 요구가 높은 업종에서 장점이 크다”고 말했다.</p> <p contents-hash="569b912ea775598c474beb4fbf77c2e539b610c657064113242170b11739faf1" dmcf-pid="5b0wgusAhf" dmcf-ptype="general">이들은 연구자 개인 아이디어가 곧바로 실험·배포될 수 있는 문화가 성과를 만들었다고 강조했다. LG유플러스 연구팀의 EMNLP 논문은 단순 학문적 결과물이 아니라 ‘현장 기술을 논문화한 사례’다. 김 연구위원은 “처음부터 학회를 목표로 한 게 아니라 실제 산업 문제를 해결하다 보니 자연스럽게 논문으로 이어졌다”고 회상했다. 박 팀장은 “논문을 본격적으로 쓰기 시작한 건 제출 두세 주 전이었다”며 “탑티어 학회는 실험의 빈틈을 하나라도 허용하지 않아 내부 벤치마크와 외부 검증 데이터를 수차례 교차 점검했다”고 말했다. 실험실의 AI가 아니라 서비스 환경에서 검증된 실용 AI를 논문으로 만든 것이 가장 의미있었다는 설명이다.</p> <p contents-hash="bb738582840d9cf67aac3b37e4e6dcbd52bb2a14b03e632c63dc477b3125a47f" dmcf-pid="1Kpra7OcTV" dmcf-ptype="general">김 연구위원은 “클라우드 비용, 보안, 데이터 이전 규제 같은 현실 제약을 정면 돌파하려면 거대 모델 숭배에서 벗어나 산업 현장의 문제를 해결하는 게 진짜 혁신”이라며 “한국형 AI 생태계의 현실적 해법은 ‘작지만 뾰족한 AI’”라고 강조했다.</p> <figure class="figure_frm origin_fig" contents-hash="f5ed804f4e3cff2ca2a4c4a86091097c394e1ee46927834475d3d04f15c9ae63" dmcf-pid="t9UmNzIky2" dmcf-ptype="figure"> <p class="link_figure"><img alt="김기현(오른쪽) LG유플러스 CTO AX기술그룹 연구위원과 박성익 LG유플러스 CTO AX기술그룹 AI테크랩 기술팀장이 인터뷰 질문에 답하고 있다. LG유플러스 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/04/dt/20251104162449903bemq.jpg" data-org-width="640" dmcf-mid="6S4YIPXSCJ" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/04/dt/20251104162449903bemq.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 김기현(오른쪽) LG유플러스 CTO AX기술그룹 연구위원과 박성익 LG유플러스 CTO AX기술그룹 AI테크랩 기술팀장이 인터뷰 질문에 답하고 있다. LG유플러스 제공 </figcaption> </figure> <p contents-hash="bfef9e6c66959416e5ca886f56fe4fd1930a8893179f6cf83a3979e16af3331f" dmcf-pid="F2usjqCEy9" dmcf-ptype="general"><br> 김나인 기자 silkni@dt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털타임스. 무단전재 및 재배포 금지.</p> 관련자료 이전 [TD영상] 아이들 민니, 영화 찍으러 가는 '여배우 김민니' 미연 쇼케 질문에 '뿌듯 냥이가 돼' 11-04 다음 "SMR 방식 일부 구형 HDD, 데이터 복구 불가" 11-04 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.