네이버클라우드, 글로벌 문자인식 AI 대회 1위 작성일 10-08 51 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">국제패턴인식학회 ICDAR서 스위스 로잔공대 제쳐<br>멀티모달 LLM 핵심 OCR 기술 경쟁력 입증</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="90knCVOJXf"> <figure class="figure_frm origin_fig" contents-hash="0e1bdd33e98c3f0b386ad15e94eacdc95f40b84027dca3686f00e57a7387a68b" dmcf-pid="2pELhfIiGV" dmcf-ptype="figure"> <p class="link_figure"><img alt="ICDAR 2025 역사 지도 텍스트 판독 과제 예시 [네이버 제공. 재판매 및 DB 금지]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202510/08/yonhap/20251008071730168mlyq.jpg" data-org-width="1117" dmcf-mid="KkLQE7c6Y4" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202510/08/yonhap/20251008071730168mlyq.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> ICDAR 2025 역사 지도 텍스트 판독 과제 예시 [네이버 제공. 재판매 및 DB 금지] </figcaption> </figure> <p contents-hash="857e5188c055106b3df220f8dfe37eb4e7f50e418933f104fa9c957b2a92e6ab" dmcf-pid="VUDol4Cn52" dmcf-ptype="general">(서울=연합뉴스) 김경희 기자 = 네이버클라우드가 글로벌 문자인식 기술 경진대회에서 1위를 차지, 광학 문자 인식(OCR) 분야에서 경쟁력을 입증했다.</p> <p contents-hash="2e74b9553df58c8be56a9857a1035d549a2a8eb2460838a5cb10371dc38e2538" dmcf-pid="fuwgS8hLZ9" dmcf-ptype="general">8일 ICT(정보통신기술) 업계에 따르면 네이버클라우드는 지난달 16~21일 중국에서 개최된 국제패턴인식학회(IAPR)의 학술 콘퍼런스 'ICDAR(International Conference on Document Analysis and Recognition) 2025'에서 진행한 문자 인식 기술 경진대회에서 1위를 수상했다.</p> <p contents-hash="f72856c8f3d6dff231c23b7c633522204d086259844cc33991e1880e90d7a14e" dmcf-pid="47rav6lo1K" dmcf-ptype="general">IDCAR은 국제패턴인식학회가 1991년부터 주관하는 문서 분석 및 인식 학술 콘퍼런스로, 세계적으로 권위를 인정받는 국제 경진대회다.</p> <p contents-hash="da80522ca23349b0439437a059357ea820f7648be3b4e728ba40693711999c71" dmcf-pid="8zmNTPSgXb" dmcf-ptype="general">이로써 네이버 및 네이버클라우드는 2018년, 2019년 2022년에 이어 IDCAR에서 통산 4번째 1위를 기록하며 OCR(광학 문자 인식) 분야 글로벌 경쟁력을 입증했다.</p> <p contents-hash="9086be85be590961e3e9487de02984a6d76de2f4adf7f74d74997cc396b83799" dmcf-pid="6gUX2sKG5B" dmcf-ptype="general">네이버클라우드는 '역사 지도 텍스트 판독' 영역에서 1위를 차지했다.</p> <p contents-hash="a7220f853e08b7e953307d61bd5ee6c2bd11ad29627845eae3b2ed78e3dd2370" dmcf-pid="PauZVO9HZq" dmcf-ptype="general">이 부문은 과거에 만들어진 지도 이미지 속의 복잡한 레이아웃으로 구성된 텍스트를 검출하는 고난도 과제로 구성돼 있다.</p> <p contents-hash="5f4ce45e1df96ff3ee1dda7dc3433792c3ce5b6f8df67cd5004abfe83c09dec1" dmcf-pid="QN75fI2XGz" dmcf-ptype="general">지역명이 두 줄 이상으로 나뉘어 적혀 있거나 직선이 아닌 곡선 형태로 표기된 경우, 경계선과 단어가 중첩된 사례 등이 옛 지도에서 흔히 발견되는데, 네이버클라우드는 문서 이미지 내 텍스트 및 좌표를 동시에 추출하는 '엔드 투 엔드' 방식의 모델로 높은 문자 인식 기술을 인정받은 것으로 전해진다.</p> <p contents-hash="14d5ebe357a1415d38c716118ef5cd43a60d7e5b5fa5e5e773dcd2787d542d0b" dmcf-pid="xjz14CVZ57" dmcf-ptype="general">네이버클라우드는 이번 대회에서 스위스 로잔 연방 공과대학교를 제치고 1위를 차지했다.</p> <p contents-hash="e8cc6a6b6084b4413338a4a8dedc74237a632a2259adc3826d3e5e14db79416c" dmcf-pid="ypELhfIi5u" dmcf-ptype="general">OCR 기술은 최근 화두인 멀티모달 거대언어모델(LLM)의 성능 향상에 핵심 역할을 담당해 지속적으로 주목받는 분야 가운데 하나다. </p> <p contents-hash="2aafd1fbcd83d8a50a3cacc7d9ba7f76a3527970299c70af54a10561efcce089" dmcf-pid="WUDol4CnXU" dmcf-ptype="general">네이버클라우드가 글로벌 자연어처리 학회인 NAACL(북미컴퓨터언어학회)에 발표한 논문에 따르면, 이미지 형태의 한국 수능 및 검정고시 문제를 AI(인공지능)가 푸는 과정에서 OCR 단계에 흔들린 오픈소스 멀티모달 모델은 지문 자체를 잘못 읽거나 일부를 놓쳐 후속 추론이 틀어지는 경우가 잦다.</p> <p contents-hash="8a6899f55f79b7950d6335d8188bb2041d2332d0ec7c1b5fa038219892410fcd" dmcf-pid="YuwgS8hLtp" dmcf-ptype="general">반면 LLM에 별도의 OCR 엔진을 결합한 구조나 내장 OCR을 갖춘 모델은 상대적으로 좋은 점수를 거뒀다.</p> <p contents-hash="9c32a53e9229e63d083ee605ed4b0efe1c2610a92e7fd34bd5b4b122cd3b6f09" dmcf-pid="G7rav6loG0" dmcf-ptype="general">프랑스 AI 기업 미스트랄 AI가 지난 3월 손글씨 노트, 타이핑된 텍스트 등을 높은 정확도로 출시하는 미스트랄 OCR를 출시하는 등 글로벌 기업들의 기술 경쟁도 이어지는 상황이다. </p> <p contents-hash="e987b20cb609ba5ecc008a74adb688ee4172f56a78bd81748d63148bb60ab37a" dmcf-pid="HzmNTPSg13" dmcf-ptype="general">네이버클라우드는 OCR 기술을 내년부터 네이버 클라우드 플랫폼 '클로바 OCR'의 도큐먼트 OCR 설루션에 접목할 계획이다.</p> <p contents-hash="2eea999bd35fc19658c2a44931a29fe042e1cfba97c0c3de2e504a1cc78e1729" dmcf-pid="XO8qJHe7ZF" dmcf-ptype="general">회사 관계자는 "엔드 투 엔드 기술을 적용해 향후 비정형 문서를 판독하고 자유 곡선 형태로 배열된 텍스트도 정확하게 추출할 수 있는 차별화된 OCR 기술을 시장에 선보일 것"이라며 "글로벌 수준의 기술 노하우를 활용해 비전 AI 기술로 확장해 나가겠다"고 말했다.</p> <p contents-hash="931f1b6395f2315835e838adc8db01641f0b2611cbc58a0110a40cff6c0106a8" dmcf-pid="ZI6BiXdzZt" dmcf-ptype="general">kyunghee@yna.co.kr</p> <p contents-hash="74d20b6ef364bfa3c0d8537d95e5cf2dc7bc0ae924ac8d96541841605afba691" dmcf-pid="1hQKL5iBH5" dmcf-ptype="general">▶제보는 카톡 okjebo</p> </section> </div> <p class="" data-translation="true">Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지</p> 관련자료 이전 '가입비만 1300만원' 블랙카드 만든 추신수 …"모르는 번호로 전화가 와서…" 10-08 다음 국정자원 화재 여파 계속…허점 노린 '사이버 공격' 우려 10-08 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.