KT '소버린 AI' 속도…"모든 AI 모델에 한국적 데이터 탑재"(종합) 작성일 07-03 13 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">'믿:음'은 간단한 영역, GPT 개량 모델은 복잡한 영역 활용 전망<br>과기정통부 '독자 AI 파운데이션 모델 프로젝트' 참여 의사</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="ugu8KoKG0A"> <figure class="figure_frm origin_fig" contents-hash="bd54ba48d48ba2081e94253350f1e836ca2e004d9df1512a3bc2ffc037a6d293" dmcf-pid="7a769g9H7j" dmcf-ptype="figure"> <p class="link_figure"><img alt="KT 믿음 [KT 제공. 재판매 및 DB 금지]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/03/yonhap/20250703124156016gtba.jpg" data-org-width="500" dmcf-mid="UtgskHkPzc" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/03/yonhap/20250703124156016gtba.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> KT 믿음 [KT 제공. 재판매 및 DB 금지] </figcaption> </figure> <p contents-hash="43b86fa634a7bd34e90c0c97e9d164ce982b5c543dc109e47f6e39ed8d8956e3" dmcf-pid="zi32zJzTpN" dmcf-ptype="general">(서울=연합뉴스) 조현영 기자 = 정부가 추진하는 소버린 인공지능(국가주권형 AI) 기조에 맞춰 KT가 자체 개발 AI 모델 '믿:음'에 역량을 투입하고 있다.</p> <p contents-hash="d080e3c0bd0d9e5923d477f6bf29599320b86c6b52ad1f2e5687ed898d114861" dmcf-pid="qn0Vqiqy0a" dmcf-ptype="general">지난해 파트너십을 체결한 마이크로소프트(MS)와 개발 중인 GPT-4 한국 특화 모델과 함께 주권과 수익성 두 마리 토끼를 잡을 수 있을지 주목된다.</p> <p contents-hash="0621fffe688cceb3aa89f3952efe3efa1588db0c92cd4485cf2feb43aec06842" dmcf-pid="BLpfBnBWug" dmcf-ptype="general">3일 KT는 취재진 대상 온라인 브리핑에서 자체 개발한 거대 언어모델(LLM) '믿:음 2.0'의 오픈소스를 인공지능(AI) 개발자 플랫폼 허깅페이스(HuggingFace)를 통해 공개할 예정이라고 밝혔다.</p> <p contents-hash="6cead0d7217c67cc8815507c1a5e372bce642483214febd35902d3b66db4ff93" dmcf-pid="boU4bLbYFo" dmcf-ptype="general">기업과 개인, 공공 누구나 상업적으로 활용할 수 있도록 제약 없이 개방되는 플랫폼에 믿:음 2.0을 공개함으로써 대중화를 꾀하기 위함이다.</p> <p contents-hash="ec41180928b06ec6125b719fa80eb59825ee14786485e70db4550d2649e114c1" dmcf-pid="Kgu8KoKGzL" dmcf-ptype="general">믿:음은 KT가 자체 개발한 한국적 독자 AI 모델이다.</p> <p contents-hash="083ed6d61130332965e618bc5710d8ff0c5c4b9342b3206cdaa4709f632e8fa4" dmcf-pid="9a769g9Hzn" dmcf-ptype="general">한국적 AI는 한국의 사회적 맥락 같은 무형 요소와 한국어 고유의 언어적·문화적 특성을 학습시켜, 한국 상황에 가장 잘 맞게 개량된 AI를 의미한다.</p> <p contents-hash="af88610649c718c189e975ab287a061260097f3ae5d85f36eea675bc9da51971" dmcf-pid="2NzP2a2Xui" dmcf-ptype="general">지난 2023년 믿:음 1.0 버전을 출시한 이후 약 2년 만에 개량 모델을 공개한 배경에는 새 정부가 추진하는 소버린 AI 전략이 작용한 것으로 보인다.</p> <p contents-hash="3475ae09fbb117d1d28af24ec680308ef13ce6c8559bcaf8abe68e8024b5bb30" dmcf-pid="VjqQVNVZ7J" dmcf-ptype="general">KT 생성형 AI 랩장(CAIO) 신동훈 상무는 "기간 통신 사업자로서 생성형 AI 원천 기술을 반드시 확보해야 한다는 믿음으로 믿:음 모델을 고도화했다"며 "정부가 추진하는 '독자 AI 파운데이션 모델 프로젝트'에 참여하려고 준비 중"이라고 말했다.</p> <p contents-hash="b0e4fa5ba94ef81118c9b5bc9e0ed8b55c59808b2e4100f73cd0dc8a5ec8254f" dmcf-pid="fABxfjf5Fd" dmcf-ptype="general">2.0 모델은 115억 파라미터 규모의 '믿:음 2.0 베이스(Base)', 23억 파라미터 규모 '믿:음 2.0 미니(Mini)' 2종으로 출시되며 한국어와 영어를 지원한다. 향후 고성능 '프로' 모델도 출시 예정이다.</p> <p contents-hash="d7561eb4d6a50bb64dfb9acd35f7e60a079764ea4fa53ce5921d09f0c822401b" dmcf-pid="4cbM4A41ue" dmcf-ptype="general">베이스 모델은 범용 서비스에 적합한 모델로 한국 특화 지식과 문서 기반 질의응답에서 강력한 성능을 보였다고 KT는 설명했다.</p> <p contents-hash="b576064fd5e2ec1729ecc2a825e945414d85b8bdc3f42b92d536d9de205165a9" dmcf-pid="8kKR8c8tuR" dmcf-ptype="general">미니 모델은 베이스 모델에서 압축한 지식을 학습한 소형 모델이다.</p> <p contents-hash="68403078fe54b6c48642b0ef397d580c40a0c77fc8def8ebf8fad5696114e9f7" dmcf-pid="6e1bURUlFM" dmcf-ptype="general">KT는 국내 교육용 도서와 문학 작품 등 발간물, 법률 및 특허 문서, 각종 사전 등 다양한 산업·공공·문화 영역에서 방대한 한국 특화 데이터를 확보해 믿:음 2.0 학습에 활용했다.</p> <p contents-hash="d5fad572b15859b80db82649d37e68dc404f70cd38f5bf14b19d0ea15e993c38" dmcf-pid="PdtKueuSFx" dmcf-ptype="general">이 밖에 한국어의 구조와 언어학적 특성을 반영한 토크나이저(텍스트를 모델이 이해할 수 있는 작은 단위인 토큰으로 분리하는 도구)를 자체 개발하는 등 KT는 한국 사회 고유의 언어와 문화적 맥락을 정교하게 반영할 수 있도록 AI를 학습시켰다고 설명했다.</p> <p contents-hash="266e6ebe553c0786fe2b2da53d3eeeee2537064d77514242b2456642c7499073" dmcf-pid="QJF97d7vUQ" dmcf-ptype="general">KT는 믿:음 2.0과 MS와 협력을 바탕으로 출시 예정인 GPT-4 한국 특화 모델을 바탕으로 기업의 AI 전환(AX)을 지원할 방침이다.</p> <p contents-hash="dc6abfa262f70ab52d0358b7468b75d2c84b99baee57454a189620b610faae09" dmcf-pid="xi32zJzTFP" dmcf-ptype="general">신 상무는 "믿음은 상대적으로 성능 면에서 (GPT 보다) 부족하지만 모든 작업에 GPT 같은 강력한 모델이 필요한 것은 아니"라면서 "고객 니즈와 목적에 따라 요약 등 간단한 영역에서는 믿:음을, 복잡한 영역에서는 GPT를 사용하는 방식으로 서비스를 준비 중이며 SI(시스템 통합) 사업으로 수익 창출이 가능할 것"이라고 말했다.</p> <p contents-hash="8ea5a055d55725472392c6f42204de25c1556337ff74f970753c988515beac49" dmcf-pid="yZaOEXEQU6" dmcf-ptype="general">믿:음의 예상 활용 영역으로는 공공·금융을 꼽았다.</p> <p contents-hash="301f0045dba07e0ac9278ecb3212e63f6a5b5dd29caae692d26dd5f3ef2f21c6" dmcf-pid="W5NIDZDxF8" dmcf-ptype="general">KT는 향후 교육이나 법률 영역까지 점차 사업 범위를 확장할 계획이다. 기업 소비자 간 거래(B2C) 서비스에 대해서도 내부 검토가 진행 중이다.</p> <p contents-hash="9bf1d847405f89b1b320a1d59b2c99e6f6ca7eca47af8d635f40c89b86ca8997" dmcf-pid="Y1jCw5wMp4" dmcf-ptype="general">다만 GPT-4 한국 특화 모델의 출시 시점에 대해서는 특정하지 않았다.</p> <p contents-hash="4856eb484c36d1d9f206e9e493bb7b1e0cfc739c840a5ffa3a58e0b02d8fb838" dmcf-pid="GtAhr1rRpf" dmcf-ptype="general">신 상무는 "내부적으로 여러 테스트를 진행하면서 성능을 올리는 과정을 진행 중"이라고 설명했다.</p> <p contents-hash="1e3664a76dd874a71c4df3ead66ca476da9ecbc7b93f05c452651d4eabafc534" dmcf-pid="HFclmtme7V" dmcf-ptype="general">이날 브리핑에서는 믿:음 2.0에 대한 성능 평가 결과도 공개됐다.</p> <p contents-hash="7ce8215c19eb591046390acb1c5b70ab9ed76b1ebb86e16857827fba737d25fb" dmcf-pid="X3kSsFsd32" dmcf-ptype="general">믿:음 2.0.은 타사 모델 대비 한국어 이해와 전문지식 분야에서는 성능 차이가 크지 않았지만, 사회·문화 측면에서는 A사(72.4점)보다 약 9점 높은 81.2점을 기록했다.</p> <p contents-hash="264503b872cbbadee9ca30d3bd0103e7f611dbda813d8e46c1f0c2a730e21c6a" dmcf-pid="Z0EvO3OJU9" dmcf-ptype="general">같은 날 오픈소스로 공개된 SK텔레콤의 한국어 특화 LLM A.X(에이닷 엑스) 4.0와 관련해서는 "에이닷 표준 모델은 720억 개(72B), 경량 모델은 70억 개(7B)의 매개변수를 가지고 있고 믿:음 미니는 11B로 에이닷이 7배 이상 더 큰 모델이라 직접 비교하는 것은 의미가 없다"면서 "다만 곧 출시될 믿:음 2.0 프로 모델이 그 수준을 상회하는 성능을 확보하고 있고 데이터 학습 측면에서 KT는 초기 단계부터, SK텔레콤은 외부 모델을 기반으로 했다는 점이 다르다"고 설명했다.</p> <p contents-hash="45f63236d14035c09511369b6c51252e354ce620f1ab55aaa6af2d4e4570a6a1" dmcf-pid="5urWhUhLpK" dmcf-ptype="general">이날 KT는 국가에서 보유한 공공문서를 AI 학습에 적극적으로 활용할 수 있도록 규제를 풀어줄 것을 정부에 요청하기도 했다.</p> <p contents-hash="18a871986eb0d90c584f3b323e30ef16abd50a9d5ce1d2190b2e950bd576586c" dmcf-pid="17mYlulo0b" dmcf-ptype="general">앞서 KT는 믿:음과 글로벌 기업들의 현존 최고 수준 모델(SOTA) 등을 두루 활용해 한국의 특수성을 반영한 AI 모델에 집중 투자한다고 밝힌 바 있다.</p> <p contents-hash="ec7c2c7b16e8bdf1bb810ba94f402f40681ca165d4b38de60d9fe1f45bb6c353" dmcf-pid="tzsGS7SgUB" dmcf-ptype="general">향후 사용자나 기업이 요구하는 다양한 요구사항에 대응하기 위해 외부 공개된 글로벌 기업의 퍼블릭 모델을 튜닝해서 제공하는 모델과 추론, 멀티모델도 순차적으로 공개할 예정이다.</p> <p contents-hash="410887199facbeafbd7a6c9541d7dc40feffc9cb2548b184f57a0a793eb005b6" dmcf-pid="FqOHvzva3q" dmcf-ptype="general">오승필 KT 기술혁신부문장(CTO)은 "어떤 AI 모델 하나를 선택하면 다른 모델을 버리는 것이 아니라, 모든 AI 모델 라인업에 한국적 데이터를 넣어서 쓸수 있게 하는 것이 KT의 철학"이라고 밝혔다.</p> <p contents-hash="c11ea542792c143d666c176c75eeea13246d3b5449af958b0c616cdd2c7e6e60" dmcf-pid="3BIXTqTN3z" dmcf-ptype="general">한편 KT는 국산 AI 생태계 구축을 위해 개발 과정에서 리벨리온 등 국내 신경망 처리장치(NPU) 기업과 협업했다.</p> <p contents-hash="49503fb544a216c717f563cb38355a648c7cb904b85c3c6818b2c94a84400ba8" dmcf-pid="0bCZyByj07" dmcf-ptype="general">hyun0@yna.co.kr</p> <p contents-hash="d48997423f1366a1df07b61557ec6f8bab95a6e2a4ecb672c608ee184662928b" dmcf-pid="U9l1YKYc7U" dmcf-ptype="general">▶제보는 카톡 okjebo</p> </section> </div> <p class="" data-translation="true">Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지</p> 관련자료 이전 '오징어게임3' 위하준 "불의 못 참는 편…지하철서 이상한 사람 끌고 나가" [인터뷰 스포] 07-03 다음 스포츠토토 7월 4일 오후 2시부터 발매 재개 07-03 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.