“세계 최고 한국어 추론성능”…KISTI, ‘독파모 기반 업데이트’ 핵심기술 확보 작성일 01-30 12 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">- AI 최고 학술대회 ICLR에 논문 2편 채택</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="4AooCtTsH0"> <figure class="figure_frm origin_fig" contents-hash="cccf19da836c034420cd5abae15a672a2226e9114a567f9e26674b47f83897c6" dmcf-pid="8cgghFyOZ3" dmcf-ptype="figure"> <p class="link_figure"><img alt="과학기술 특화 생성형 거대 언어모델 ‘코니(KONI)’.[KISTI 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/30/ned/20260130101351567wmub.jpg" data-org-width="1125" dmcf-mid="fuFF4gx2Zp" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/30/ned/20260130101351567wmub.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 과학기술 특화 생성형 거대 언어모델 ‘코니(KONI)’.[KISTI 제공] </figcaption> </figure> <p contents-hash="f8b1ed0136f6d84649c8a263eb392d99e8467f60b722fdd45c1f163c90bf0dcb" dmcf-pid="6kaal3WIXF" dmcf-ptype="general">[헤럴드경제=구본혁 기자] 한국과학기술정보연구원(KISTI)의 과학기술 특화 생성형 거대 언어 모델(LLM) 고니(KONI) 연구진(이하 KONI팀)의 논문 2편이 인공지능(AI) 분야 최고 권위 학술대회인 국제표현학습학회(ICLR)에 동시 채택되며 한국어 LLM의 글로벌 경쟁력을 입증했다.</p> <p contents-hash="360a7d7fefc843e6bdd6f443bcdf28f2fd8a08326cc19269f76228e29791417c" dmcf-pid="PENNS0YCGt" dmcf-ptype="general">KONI팀은 비영리 오픈소스 연구단체 해례(HAERAE)팀과 협력해 한국어 특화 추론 모델 개발 프로젝트를 수행했다. 579만 건의 한국어 네이티브 프롬프트와 370만 건의 장문 추론 경로를 포함한 ‘이상(Yi-SANG)’ 학습 데이터세트를 구축, 이는 공개된 한국어 사후 학습 데이터자원 중 최대 규모다.</p> <p contents-hash="f8727d6bed6e0d2d17e06bffaf25ebf7b27d313025317165fcdef953e314449f" dmcf-pid="QDjjvpGht1" dmcf-ptype="general">KONI팀은 사고 과정에서는 영어를 활용하고 최종 답변은 한국어로 도출하는 ‘혼합 언어 단계적 사고(Language-Mixed CoT)’ 기법을 적용했다. 이를 통해 한국어 전용 모델의 논리적 한계를 극복하고, 번역 어투를 최소화하면서도 추론 효율을 극대화했다. 이 기술을 이용해 학습된 모델은 딥시크(DeepSeek)-R1-32B 등 유사 규모의 글로벌 모델을 제치고 최고 수준의 한국어 추론 성능을 기록했다.</p> <p contents-hash="9c76a974cbaa126dc4e1a4a76077d63f9b9b9b72e377f862b0a8560ad9fa4e5c" dmcf-pid="xmkkW7ZvH5" dmcf-ptype="general">KONI팀은 특정 언어나 도메인에 모델을 적응시킬 때 기존 지식을 잊어버리는 ‘치명적 망각(Catastrophic Forgetting)’ 문제를 해결하는 ‘저계층 적응 기반 대조 보정(LGCD, LoRA-Gated Contrastive Decoding)’ 기술도 개발했다. 이 기술은 추가 모델 훈련 없이 추론 시점에만 작동하며, 모델 내부 지식을 동적으로 추출해 사실 관계를 보정한다. 고도의 정확성이 요구되는 전문 분야에서 환각 현상을 억제하는 데 도움을 줄 수 있다.</p> <p contents-hash="41c29345fde7833cd779db45273dbab7b9cb278251fc5e5395cea705fab52cbd" dmcf-pid="yK77MkiPHZ" dmcf-ptype="general">KISTI는 이번 성과로 최근 과학기술정보통신부 업무보고에서 배경훈 부총리 겸 장관이 요청한 ‘독자 파운데이션 모델(독파모) 기반 KONI 업데이트’에 부응하는 핵심 기술적 토대를 마련했다.</p> <p contents-hash="b656d8f2dab3f82d63cafafc51891b1b9add08d12c3bd153df6ebdc2d874a6c9" dmcf-pid="W9zzREnQGX" dmcf-ptype="general">KONI팀은 이번 연구를 바탕으로 연구자의 파트너로서 가설을 세우고 실험 데이터를 분석하는 ‘AI 연구동료(AI Co-Scientist)’ 기술 개발을 추진할 계획이다. 복잡한 과학적 난제를 함께 해결할 수 있는 지능형 연구 에이전트 시스템을 구축해 국가 AI 주권을 확보하고, 대한민국 연구 현장을 ‘과학을 위한 AI(AI for Science)’ 체제로 전환하는 데 기여할 방침이다.</p> <p contents-hash="eb9f4f4f3423b7165e97eacca05b8add2d7cf14b18b227afffbae29fe616f221" dmcf-pid="Y2qqeDLxYH" dmcf-ptype="general">이식 KISTI 원장은 “이번 성과는 한국어 AI 기술의 글로벌 경쟁력을 입증한 것”이라며, “KONI 고도화를 지속 추진해 AI 연구동료 개발과 과학을 위한 AI 혁신을 선도하겠다”고 밝혔다.</p> </section> </div> <p class="" data-translation="true">Copyright © 헤럴드경제. 무단전재 및 재배포 금지.</p> 관련자료 이전 다음 품은 업스테이지…'한국형 퍼플렉시티' 꿈꾼다(종합) 01-30 다음 기능 모르는 DNA 염기서열 98%, AI가 예측 01-30 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.