'프롬 스크래치' 논란에 네이버 "파운데이션 모델은 자체 기술" 작성일 01-05 30 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">외부 인코더 활용은 인정…“효율적 엔지니어링 선택일 뿐”<br>"부품 조립 넘어 통합 아키텍처 완성에 주력"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="Kwfht5sAZ5"> <figure class="figure_frm origin_fig" contents-hash="f46719fcea54073d2d16077134d3bc7d18f30ca818b0cb36321422dc4c98e5bc" dmcf-pid="9r4lF1OcGZ" dmcf-ptype="figure"> <p class="link_figure"><img alt="성낙호 네이버클라우드 전무가 2025년 12월 30일 코엑스 오디토리움에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 자사 모델을 소개하고 있다.ⓒ데일리안 조인영 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/05/dailian/20260105204644950fhup.png" data-org-width="700" dmcf-mid="bmc7Q60HZ1" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/05/dailian/20260105204644950fhup.png" width="658"></p> <figcaption class="txt_caption default_figure"> 성낙호 네이버클라우드 전무가 2025년 12월 30일 코엑스 오디토리움에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 자사 모델을 소개하고 있다.ⓒ데일리안 조인영 기자 </figcaption> </figure> <p contents-hash="891aa0df3f3dc587be52aafa02b734ab6cb81f5dc64df72278a7c7fe46106918" dmcf-pid="2Xa04V1yZX" dmcf-ptype="general">정부의 독자 파운데이션 인공지능(AI) 모델 정예팀인 네이버클라우드에 '프롬 스크래치(From Scratch)' 논란이 제기됐다.</p> <p contents-hash="8caa124c568eb2e13ce083c5065339b42f8df1cead70a40ad3c94b1e19b2cc96" dmcf-pid="VZNp8ftWHH" dmcf-ptype="general">네이버는 외부 인코더를 사용한 것은 효율적 엔지니어링을 위한 전략적 선택일 뿐, AI의 본체인 파운데이션 모델은 여전히 독자 기술임을 강조했다.</p> <p contents-hash="f0a063480e99fa11417f89ccc9f142dbf5c23111ee0b5d6eddf82ca7f8cc4379" dmcf-pid="f5jU64FYGG" dmcf-ptype="general">5일 업계에 따르면 네이버클라우드의 하이퍼클로바X 시드 32B 싱크 모델이 중국 알리바바의 큐웬(Qwen) 2.4 언어모델과 비전 인코더 웨이트(가중치)의 코사인 유사도와 피어슨 상관계수가 높다는 주장이 나왔다.</p> <p contents-hash="b70e74e16255f16e1578ae71201b23b09406a2c24cf45885bf862e40db57525e" dmcf-pid="41AuP83G1Y" dmcf-ptype="general">코사인 유사도와 피어슨 상관계수는 모두 데이터셋의 유사도를 측정하는 방법이다.</p> <p contents-hash="563246d48f1fcf6757746783029a45c00614e745e6373140495d4c97c2d9472a" dmcf-pid="8tc7Q60HXW" dmcf-ptype="general">코사인 유사도는 방향의 유사성을 판단하고, 피어슨 상관계수는 데이터의 분포가 얼마나 유사한지 나타낸다.</p> <p contents-hash="830afa9af467f0f0d955e81386db129c5b57cda4f1c65b4959950635872541e6" dmcf-pid="6FkzxPpXZy" dmcf-ptype="general">두 지표가 높게 나타나면서, 네이버가 독자 개발이 아닌 외부 인코더를 가져다 쓴 것이 아니냐는 지적이 제기됐다.</p> <p contents-hash="b83c0b084d3755392e76af59a9222283db72aad77c8e6ee37e5e1b0a942feeea" dmcf-pid="P3EqMQUZ5T" dmcf-ptype="general">이에 대해 네이버클라우드는 외부 인코더 채택 사실은 인정하면서도 기술력 부족은 아니라고 선을 그었다.</p> <p contents-hash="f126c2406cbaa8ee3c4cc9a4650e4fb8d5b746d3a411520dbe5ed9111ecfa2e9" dmcf-pid="Q0DBRxu5Hv" dmcf-ptype="general">네이버클라우드 측은 "이번 모델에서는 글로벌 기술 생태계와의 호환성 및 전체 시스템의 효율적 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다"고 전했다.</p> <p contents-hash="d0fa561f1bc3dbd1e661dbdab298b416b5025e06da0359b78426eef83709a0bf" dmcf-pid="xpwbeM71HS" dmcf-ptype="general">이어 "기술적 자립도가 부족해서가 아니라, 이미 표준화된 고성능 모듈을 활용해 전체 모델의 완성도와 안정성을 높이기 위한 고도의 엔지니어링 판단"이라고 해명했다.</p> <p contents-hash="cf6d96f822327b1cf9b450d6a374ed422344d6333811c8a67a8e686417f00c31" dmcf-pid="yjBrGWkLZl" dmcf-ptype="general">그러면서 "비전 인코더는 시각 정보를 모델이 이해할 수 있는 신호로 변환하는 ‘시신경’ 역할을 하고 있고, 네이버는 VUClip 등 독자적인 비전 기술력을 충분히 보유하고 있다"고 강조했다.</p> <p contents-hash="e387fb53fdbaf20a498c687937ea6b38aa67fddfacef7015c7a9eac7a0c70a42" dmcf-pid="WAbmHYEoYh" dmcf-ptype="general">아울러 AI 모델 구축 과정에서 다른 모듈을 활용하는 건 일반적인 방식이라고 부연했다. 글로벌 AI 업계에서도 이러한 방식은 시스템 확장성을 위한 보편적인 설계 표준으로 자리 잡고 있다는 설명이다.</p> <p contents-hash="08a4611df6f8b7d9e096c368cc7a9fbd7fb83748c03978c8a3d202b2c0ab2a15" dmcf-pid="YcKsXGDgHC" dmcf-ptype="general">실제 알리바바의 큐웬 모델 역시 오픈AI나 구글의 기술을 기반으로 구축된 사례가 있다는 점을 예로 들었다.</p> <p contents-hash="7f3dba97de69beef07ceb6adffb906e2ea1db5a2e53abc567998f252d99ca2de" dmcf-pid="Gk9OZHwaHI" dmcf-ptype="general">네이버클라우드 관계자는 "알리바바의 큐웬-오디오(QWEN2-Audio)는 오픈AI의 음성인식 기술(Whisper)을, 큐웬-옴니(Qwen3-Omni)는 구글의 이미지 인식 기술(SigLIP2)을 기반으로 구축됐다"며 "이번 모델의 핵심 기여는 단순 부품의 조립이 아닌, 통합 아키텍처의 완성에 있다"고 말했다.</p> <p contents-hash="f768e8c6ac5dc838873fac8a34b38585b23aaa66b8f62c64ef3bd5b2a46de0eb" dmcf-pid="XDVC1ZmjGs" dmcf-ptype="general">이어 "텍스트, 음성, 이미지를 하나의 유기적인 구조 안에서 동시에 이해하고 생성하도록 설계하는 것이 멀티모달 AI의 가장 본질적이고 어려운 과제"라고 덧붙였다.</p> <p contents-hash="a142e66b8beacb329c762a490572ee5acafc0827c9e2d8b1c6642e3788bddeba" dmcf-pid="ZvdXBzWItm" dmcf-ptype="general">특히 네이버클라우드는 파운데이션 모델만큼은 100% 자체 기술로 개발한 '프롬 스크래치'임을 분명히 했다.</p> <p contents-hash="d760586e6953109884d8731d85ee784b06523ef5af901d227f41c1f3359dc404" dmcf-pid="5TJZbqYC1r" dmcf-ptype="general">네이버클라우드 관계자는 "파운데이션 모델은 입력된 정보를 해석하고 추론하며 결과를 만들어내는 핵심 영역으로, 인간으로 치면 사고와 정체성을 담당하는 '두뇌’에 해당한다"면서 "네이버는 이 핵심 엔진을 프롬 스크래치(From Scratch) 단계부터 100% 자체 기술로 개발해 왔다"고 말했다.</p> <p contents-hash="161a68cfa7dca86e659cbb5e0089cf9ff1d9e42a13e5f3b13dd301ede5cb9ff2" dmcf-pid="1yi5KBGhXw" dmcf-ptype="general">이어 "이를 통해 한국어와 한국 사회의 복잡한 맥락을 가장 깊이 이해하는 독자적인 경쟁력을 확보해 왔다"고 설명했다.</p> <p contents-hash="ba2d530488f8be9501771ab6b519553849e0014ae23c9d29c464a359373db62a" dmcf-pid="tWn19bHlXD" dmcf-ptype="general">네이버클라우드는 기술 선택 사항과 라이선스 정보를 허깅페이스와 테크리포트로 공개해왔고, 향후 기술 개발 과정에서 투명성을 유지하겠다고 전했다.</p> <p contents-hash="fb84e20937049c659e96dbb97c1b02e54c635a8484095c41021d44d6c7f862d3" dmcf-pid="3GoFV9Zv5k" dmcf-ptype="general">네이버클라우드 측은 "단순히 ‘모든 요소를 직접 만들었는가’라는 프레임을 넘어, ‘어떻게 창의적으로 통합해 사용자에게 최고의 가치를 줄 것인가’에 집중할 계획"이라고 덧붙였다.</p> </section> </div> <p class="" data-translation="true">Copyright © 데일리안. 무단전재 및 재배포 금지.</p> 관련자료 이전 국산 보안 제품, 글로벌 1위 보안기업 제품과 첫 연동 01-05 다음 ‘前 세계랭킹 1위’ 두 명과 붙는다? 안세영, 최악의 시즌 출발 대진표 01-05 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.