첫판부터 험난한 'AI 국가대표' 선발전

작성일 01-06

<div id="layerTranslateNotice" style="display:none;"></div> K-AI 평가전 독자기술 논란 네이버, 中소스 일부 활용 인정 업스테이지 이어 논란 재점화 '프롬 스크래치' 정부 기준 모호 업계 "명확한 기준 제시해야" 다음주 5곳 중 1곳 탈락 결정 
 <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
 <section dmcf-sid="xta0XSNdTF">
 <figure class="figure_frm origin_fig" contents-hash="fe3b7ef2079d131153038c3f942b6ba28f36e5df5a139cab60c4369dc9e151a8" dmcf-pid="yRHJPKXSht" dmcf-ptype="figure">
 <img alt="지난달 30일 서울 삼성동 코엑스에서 열린 '독자 AI 파운데이션 프로젝트' 1차 발표회에서 참관객들이 부스를 둘러보고 있다. 이승환 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/06/mk/20260106173002317ldrn.jpg" data-org-width="1000" dmcf-mid="Q1Eq3GDgl3" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/06/mk/20260106173002317ldrn.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 지난달 30일 서울 삼성동 코엑스에서 열린 '독자 AI 파운데이션 프로젝트' 1차 발표회에서 참관객들이 부스를 둘러보고 있다. 이승환 기자
 </figcaption>
 </figure>
 국가대표 인공지능(AI) 모델을 개발하는 정부 사업에서 해외 모델 표절·차용 의혹이 이어지고 있다.
 5개 컨소시엄 중 한 곳이 떨어지는 1차 평가를 앞두고 독자 AI 모델의 자체 설계 여부를 어떻게 판단할 것인지가 관심사로 떠올랐다.
 6일 오픈소스 플랫폼 허깅페이스 등에 따르면 네이버클라우드가 독자 AI 파운데이션 모델 프로젝트 1차 결과물로 공개한 '하이퍼클로바 X 시드 옴니 8B' 등은 모델 구성 요소 중 하나인 비전 인코더에 알리바바의 '큐원 2.5(Qwen 2.5 vl)' 모델을 차용한 것으로 확인됐다. 비전 인코더는 모델의 시신경 같은 구성 요소로, 입력받은 시각 데이터를 AI 모델이 이해할 수 있게끔 변환하는 역할을 한다.
 네이버는 허깅페이스에 모델을 공개하며 'config' 등 관련 문서에 큐원 인코더를 가져와 사용했음을 기재했다. 해당 문서에 따르면 오디오 인코더도 '큐원 2' 모델을 차용한 것으로 파악된다.
 네이버가 활용한 큐원 2.5 비전 인코더는 아파치 2.0 라이선스가 적용된 오픈소스다. 상업적 이용을 포함해 자유롭게 활용할 수 있지만 수정을 거쳐 사용할 경우 해당 사실을 포함해 라이선스 내용을 명시해야 한다.
 이를 두고 일각에서는 네이버 모델에 대해 처음부터 설계하고 학습하는 '프롬 스크래치' 모델로 볼 수 있는가에 대한 의문이 제기되는 상황이다.
 과학기술정보통신부는 사업 공모에서 독자 파운데이션 모델을 "해외 모델 미세 조정 등으로 개발한 파생형 모델이 아닌 모델의 설계부터 사전 학습 과정을 수행한 국산 모델"이라며 "타사 모델에 대한 라이선싱 이슈 부재"로 규정한 바 있다.
 다만 네이버 사례처럼 인코더 등 AI 모델의 다양한 구성 요소에서 어디까지를 프롬 스크래치로 인정할 것인지에 대한 구체적인 기준은 모호한 상황이다. 이에 대해 네이버는 "두뇌 역할이자 모델 본체에 해당하는 파운데이션 모델은 100% 자체 개발"이라고 설명하며 "이번 모델에서 글로벌 기술 생태계와의 호환성과 전체 시스템의 효율적 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다"고 밝혔다. 또한 비전 인코더에서 'VUClip'과 같은 자체 기술을 갖추고 있으며, 향후 인코더도 자체 기술로 대체해 나갈 예정이라고 설명했다.
 AI 개발자 커뮤니티에서도 논의가 뜨겁다. 한 업계 관계자는 "통상적으로 외부 인코더를 가져와 사용하는 경우가 많긴 하지만 멀티모달을 오래 연구해 온 네이버에서 이를 그대로 재사용한 것은 아쉬운 대목"이라고 지적했다. 또 다른 AI 업계 관계자는 "프롬 스크래치 모델에서 중요한 것은 모델 가중치(웨이트)를 랜덤하게 초기화해 처음부터 사전 학습하는 것"이라며 "인코더를 차용했다고 해서 프롬 스크래치가 아니라고 보기는 어렵다"고 평가하기도 했다.
 이번 사업에 참여하고 있는 업스테이지 또한 지난 1일 중국 모델 표절 의혹이 제기되면서 즉각 반박에 나서는 등 공방이 이어졌다. 업스테이지는 검증 절차를 공유하고 학습 로그를 공개하며 자체 개발을 증명한 바 있다.
 정부가 각 기업 모델의 독자 개발 여부와 기술력을 어떻게 판단할지는 1차 평가를 통해 윤곽이 드러날 것으로 보인다.
 한편 프롬 스크래치로 만든 독자 AI 모델의 명확한 기준이 무엇인지에 대한 심층적 논의의 필요성도 제기된다. 네이버, 업스테이지, LG AI연구원, NC AI, SK텔레콤이 경쟁하고 있는 독자 AI 파운데이션 모델 프로젝트는 지난 5일부터 1차 평가에 들어갔으며, 오는 15일 이전에 첫 평가 결과가 공개될 예정이다. 이번 평가를 통해 한 곳이 탈락하게 된다. 
 프롬 스크래치
 AI 모델을 기초부터 자체 설계하고 학습했다는 의미로, 개발력의 중요한 판단 기준이다. 다른 모델의 가중치를 가져와 조정하는 '파생형 모델'과 구분된다.
 [정호준 기자]
 </section> 
 </div> 
 Copyright © 매일경제 &amp; mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이전

인터엑스, 'AI 어시스트'로 K-AI 국가대표 입증

01-06
다음

"광고까지 포기했는데…" 네이트온 '승부수' 안 통했다

01-06

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

첫판부터 험난한 'AI 국가대표' 선발전

멤버랭킹

관련자료

멤버랭킹