빅테크 협력·자체개발…이통사 '소버린 AI' 투트랙 작성일 07-04 16 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">SKT '에이닷엑스 4.0' 한국어평가 고득점 눈길 <br>KT '믿:음' 고도화, 국내 특화 데이터 학습 특징 <br>양사 나란히 오픈소스 공개…정부 사업 등 대비</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="VIpIeyNfyt"> <figure class="figure_frm origin_fig" contents-hash="98bc4017bb6ff7c6b27cfac783127a1443a4412cfd5326cc03c1fc4243b011a4" dmcf-pid="fCUCdWj4W1" dmcf-ptype="figure"> <p class="link_figure"><img alt="KT와 SKT 한국어 기반 LLM/그래픽=윤선정" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/04/moneytoday/20250704050010891rsfo.jpg" data-org-width="560" dmcf-mid="2sZE8IJqvF" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/04/moneytoday/20250704050010891rsfo.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> KT와 SKT 한국어 기반 LLM/그래픽=윤선정 </figcaption> </figure> <p contents-hash="106f41a2acbef2a3c3a5eb024ebbe72bfa40af58ad1043d0b8238ed622d022bb" dmcf-pid="4TBToZDxW5" dmcf-ptype="general"> 정부의 '소버린 AI(인공지능)' 정책에 SK텔레콤과 KT가 '투트랙' 전략을 편다. 양사 모두 글로벌 빅테크(대형 IT기업)의 LLM(거대언어모델)을 한국어에 맞게 개편하는 방안을 추진했으나 정부가 자국 AI를 강조하면서 자체개발한 LLM 육성에 나섰다. </p> <p contents-hash="b2b16259b1d8281d9b43027f1347a024c555afa6637d26687bc88229122ae980" dmcf-pid="8ybyg5wMCZ" dmcf-ptype="general">3일 SK텔레콤은 차세대 LLM '에이닷엑스 4.0' 2종의 오픈소스를 글로벌 AI 개발자 플랫폼 허깅스페이스에 공개했다. 표준모델 매개변수는 720억개, 경량모델은 70억개다. '프롬스크래치'(모델 맨 첫 단계부터 직접 구축) 방식으로 개발한 '에이닷엑스 3.0'과 달리 4.0은 중국 알리바바의 오픈소스 모델 'Qwen(큐엔)2.5'에 방대한 한국어 데이터를 추가 학습시켰다. </p> <p contents-hash="78de5e17744597867ba51d915b09a84058e89f5f1c8db6932c25d68b8edeee7e" dmcf-pid="6WKWa1rRWX" dmcf-ptype="general">알리바바의 오픈소스를 기초로 했으나 한국어 능력평가 벤치마크인 KMMLU에서 'GPT-4o'(72.5점)보다 높은 78.3점을 받았다. 한국어 및 한국 문화 벤치마크 CLIcK에서도 83.5점을 받아 'GPT-4o'(80.2점)를 앞섰다. AI 및 반도체 통합 솔루션업체 디노티시아가 개발한 LLM 한국어 리더보드에 따르면 에이닷엑스 4.0의 한국어 이해·생성능력은 네이버의 '하이퍼클로바X', LG '엑사원', 카카오 '카나나'를 앞섰다. </p> <p contents-hash="6f7ac0e45fec67fd66e2e74d9c366f6d6a6c489bf43e132d2e98a8f0db41c1f2" dmcf-pid="PY9YNtmeyH" dmcf-ptype="general">또 자체 구축한 슈퍼컴퓨터 '타이탄'에서 자체 데이터로 학습·필터링해 데이터 주권을 확보했다는 설명이다. 통상 해외 LLM에서 한국어 사용시 AI가 인식하는 문자 단위인 '토큰'이 영어보다 많이 필요해 처리속도는 늦고 비용은 비싸다. SK텔레콤은 독자 개발한 토크나이저를 적용, GPT-4o 대비 1.5배 더 많은 한국어 정보를 처리하면서 비용은 34% 절감할 수 있게 했다. 다만 정부의 소버린 AI 정책에 발맞춰 에이닷엑스 3.0 개발도 병행할 계획이다. </p> <p contents-hash="b25e2aa61478e1653e40a91cf8c2533f0fcea18ba9db07fc5aaf9ebba8d21950" dmcf-pid="QG2GjFsdvG" dmcf-ptype="general">마이크로소프트(MS)와 손잡고 오픈AI의 GPT-4o 기반 LLM을 준비하던 KT도 2년 만에 자체개발 LLM '믿:음'을 업그레이드했다. </p> <p contents-hash="c0d02e4598fe737e61c258b7e872ea1ce879ba03c5bc4c54e9474967d9dd442f" dmcf-pid="xHVHA3OJSY" dmcf-ptype="general">4일 '믿:음 2.0'의 오픈소스를 허깅스페이스에 공개한다. 표준모델의 매개변수는 115억개, 경량모델은 23억개다. KT와 고려대가 공동개발한 한국어 AI 역량평가지표 'Ko-Sovereign'(코-소버린) 벤치마크에서 글로벌 최고 수준의 오픈소스 모델을 능가했다는 설명이다. 다만 KMMLU 점수는 57.8점에 그쳤다. </p> <p contents-hash="237f46e887a68ffeaf589433ca1da0b7e3b6f52cd00a72aac1ddf0d9448790b8" dmcf-pid="ydIdUa2XWW" dmcf-ptype="general">KT는 믿:음의 강점으로 저작권 논란 없는 국내 데이터로 학습한 점을 꼽았다. 국내 교육용 도서, 문학작품 등 발간물과 법률·특허문서, 각종 사전 등 다양한 산업·공공·문화영역에서 방대한 한국 특화 데이터를 확보해 믿:음의 성능을 높였다는 설명이다. 또 개발단계에서 리벨리온과 협력하며 국산 AI 반도체 생태계 자립에도 힘을 보탰다. </p> <p contents-hash="268f16faa1bf36e0f7b307d89a026e38f47846318cde82250b5c835750e791bc" dmcf-pid="WJCJuNVZly" dmcf-ptype="general">KT의 CAIO(최고인공지능책임자)인 신동훈 생성형AI랩장은 "믿:음은 데이터 구축부터 모델 학습 전과정을 자체 기술로 구축해 소버린 AI를 대표하는 모델"이라며 "에이닷엑스 4.0이 7배 이상 큰 모델이라 직접적인 성능 비교가 의미는 없지만 믿:음 프로 모델도 그 정도를 상회하는 성능을 확보하고 있다"고 자신했다. </p> <p contents-hash="308af957cb86ba799b4636dc3a967b0f2354a7891555c580a69ee5a6dcbc5c29" dmcf-pid="Yihi7jf5yT" dmcf-ptype="general">KT는 MS와 협력한 LLM도 조만간 공개할 예정이다. 글로벌 빅테크의 LLM을 튜닝한 다른 모델들도 공개를 앞뒀다. KT 관계자는 "독자적으로 AI를 개발·운영할 수 있는 역량을 보유했지만 글로벌 사업자와 협력해 오픈이노베이션(개방형 혁신)을 추구한다"고 설명했다. </p> <p contents-hash="561e81d37fa54ed9b65c27177642935d1ecb17b7ad80cb00cab7ac242144cd4a" dmcf-pid="GdIdUa2Xhv" dmcf-ptype="general">이통사가 AI 모델을 오픈소스로 공개하는 건 과학기술정보통신부의 '독자 AI 파운데이션 모델' 사업을 준비하는 차원이다. 과기정통부는 국가대표 AI기업 5개팀을 선발해 GPU(그래픽처리장치), 데이터, 인재를 대규모로 지원할 예정이다. 오픈소스 공개 수준이나 국민 AI 접근성, 사회적 기여도 등이 주요 평가요소다. 해외 오픈소스 모델을 이용했지만 자체 기술력을 확보했다면 참여가 가능할 전망이다. </p> <p contents-hash="928b525d865f27d923527099b8821da3e7c16834a47ee6680194a8341a2ef9ba" dmcf-pid="HJCJuNVZSS" dmcf-ptype="general">윤지혜 기자 yoonjie@mt.co.kr 김승한 기자 winone@mt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.</p> 관련자료 이전 24시간 말하는 AI비서 '스피치SSM' 개발 07-04 다음 경찰 제복에 달 LA 금 메달[스포츠 라운지] 07-04 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.