AI 검색 전쟁, 네이버는 왜 ‘사전’을 꺼냈을까 작성일 12-18 30 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">“지식백과 어학사전 데이터 확보에 3년간 1000억 투자”</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="fjwaq8YCZT"> <figure class="figure_frm origin_fig" contents-hash="deb98e1ad610ab8c3c77ffab287b81f82803854dbc5026fc3dc61baef965e583" dmcf-pid="4ArNB6GhHv" dmcf-ptype="figure"> <p class="link_figure"><img alt="경기 성남시 분당구 네이버 사옥. /뉴스1" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/18/chosun/20251218070213778lgxd.jpg" data-org-width="2970" dmcf-mid="VqV7OWnQYy" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/18/chosun/20251218070213778lgxd.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 경기 성남시 분당구 네이버 사옥. /뉴스1 </figcaption> </figure> <p contents-hash="759c2d24e9cdcac2c1bac787108d38a3efecf49c15568ba2fa5a8aec8ffbfcc1" dmcf-pid="8cmjbPHlZS" dmcf-ptype="general">네이버가 사전·지식백과 등 ‘지식 인프라’ 고도화에 속도를 낸다. 지난 20여 년간 축적해 온 한국어 데이터베이스(DB)를 앞세워, 글로벌 빅테크와의 인공지능(AI) 검색 경쟁에서 ‘고품질 데이터’로 차별화를 꾀하겠다는 전략이다.</p> <p contents-hash="f242f895d73698f9327cd1e585b339ed1a7ca43f87c032fe4c71e7438190d310" dmcf-pid="6ksAKQXStl" dmcf-ptype="general">18일 업계에 따르면, 네이버는 현재 서비스 중인 지식백과와 어학사전의 고품질 데이터 확보에만 향후 3년간 1000억원을 투자한다. AI 검색의 품질은 결국 콘텐츠(DB)가 좌우하는 만큼, 양질의 한국어 콘텐츠를 통해 AI 검색을 고도화하려는 것이다. 네이버는 2000년대 초 검색 서비스 초반부터 한국어 DB 구축에 꾸준히 투자해 왔다. 2000년 백과 서비스를 시작으로 2004년부터는 두산백과와 협업하고 있다. 올해도 동국역경원의 ‘불교사전’, 단국대 동양학연구원의 ‘이두사전’, 선문대의 ‘러시아어 유의어 학습사전’, 고려대의 ‘한국어대사전’ 어원 정보 등을 신규 반영하며 전문 지식 콘텐츠를 확대하고 있다.</p> <p contents-hash="1c27425ce854b73bd5dce532e1df743ffc9e891edfa7f566e59590063016efab" dmcf-pid="PwCEVR1yGh" dmcf-ptype="general">네이버의 지식백과와 어학사전 등 한국어 DB는 사용자 콘텐츠(지식iN·블로그·카페), 비즈니스 데이터(쇼핑·플레이스) 등과 함께 네이버 콘텐츠 경쟁력의 핵심 축으로 꼽힌다. 국내 최대 규모인 네이버 어학사전은 현재 영어, 한자, 일본어, 중국어를 포함한 67종 언어를 대상으로 총 3000만 표제어를 서비스하고 있다. 올해는 한국외국어대학교의 12종 언어 학습 사전(네덜란드어·독일어·스페인어·아랍어·체코어 등)을 네이버 어학사전과 통합 검색에 반영했다. 또 공신력 있는 데이터 확보를 위해 옥스퍼드 대학출판부(영어), 국제울란바토르대학교(몽골어), 인도네시아 국립대학(인도네시아어), 호치민 인문사회과학대학교(베트남어) 등 각국 연구기관과 협력하고 있다.</p> <p contents-hash="e1a229ffcc56c8a3155b15afcb115dafb53add386a6f280578fddb7a263089ea" dmcf-pid="QrhDfetWtC" dmcf-ptype="general">국내에서는 국립국어원, 한국외대, 고려대 민족문화연구원, 동아출판 등과 협업 중이다. 이들과의 파트너십은 단순 제휴에 그치지 않고 전문가 검수 등 품질 고도화로 이어진다. 예컨대 ‘해태’ 같이 기원이 여러 갈래인 단어의 경우, 해당 분야 전문가의 꼼꼼한 검수를 거쳐 일반적인 검색 결과와는 차별화된 신뢰도 높은 정보를 제공하는 식이다.</p> <p contents-hash="02435232b9554dbfa0bfd338ddf8f426acdeeed8c2955f72f36721718c24315d" dmcf-pid="xmlw4dFYHI" dmcf-ptype="general">언어·문화적으로 의미가 있는 소수 언어 사전 편찬도 꾸준히 지원하고 있다. 그리스어, 고대 그리스어, 고대 히브리어, 테툼어, 미얀마어, 덴마크어, 노르웨이어, 히브리어 등 소수 언어 사전을 구축해 지속적으로 개정 중이며, 오는 1월에는 카자흐어 사전을 출시할 예정이다.</p> <p contents-hash="ee7c21fd5a79d2798f6e1eb91df0c8e946a45a75d56d7e4e77ef7d76cae5f986" dmcf-pid="yK8BhHgRXO" dmcf-ptype="general">네이버 지식백과는 단순한 백과사전 자료가 아닌 학회·연구기관·전문가 집필 콘텐츠를 기반으로 제공된다. 대표적으로 대한수학회·한국물리학회·대한화학회 등과 함께 수학백과와 물리학백과를, 한국학중앙연구원과 ‘한국민족문화대백과’, 한국정보통신기술협회와 ‘IT용어사전’, 서울대학교병원과 ‘의학정보’ 등을 제공하고 있다. 올해는 독립기념관과 협업해 ‘한국독립운동인명사전’ 서비스를 시작했으며, 외교부와 협력해 브룬디·모리타니아 등 생소한 국가들의 개황 정보도 제공한다.</p> <p contents-hash="7e646a79e40bedd33209194e75b44bde41dc416b77227aa11d28e038b5538a92" dmcf-pid="W96blXae5s" dmcf-ptype="general">지식백과는 최신 트렌드를 반영해 숏폼 콘텐츠로도 업데이트되고 있다. 올해 두산백과 등과 함께 4400여 건의 숏폼 콘텐츠를 제작해 ‘동영상 백과’ 서비스를 시작했다. 또한, 두산백과와 함께 멀티미디어 지식 콘텐츠를 구축 중이며, 동식물 분야를 중심으로 제작해 향후 학습 분야 등으로 확장할 계획이다. 이 콘텐츠 검수에는 두산백과 집필진 200명가량이 참여했다.</p> </section> </div> <p class="" data-translation="true">Copyright © 조선일보. 무단전재 및 재배포 금지.</p> 관련자료 이전 [팀장칼럼]반복되는 정보유출…책임은 가볍고 피해는 무겁다 12-18 다음 ‘10연속 실점’ 허용하다니, 휘청인 배드민턴 최강 안세영…왕중왕전 첫 경기서 2-1 ‘진땀승’ 12-18 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.