이파피루스 '파이뮤PDF 프로', 레이아웃 분석 성능 업그레이드 작성일 11-26 30 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">LLM·RAG 특화로 AI 학습·서비스 개발 효율 제고</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="FfZz0UIkol"> <p contents-hash="606eea0999fcd429a227509cd68b615eded003fa180ee569fd2ce33131a97a27" dmcf-pid="345qpuCEoh" dmcf-ptype="general">(지디넷코리아=남혁우 기자)<span>이파피루스(대표 김정희)가 문서 데이터 추출 라이브러리 '파이뮤PDF 프로(PyMuPDF Pro)'에 머신러닝 기반 레이아웃 분석 기능을 적용해</span><span> 글로벌 경쟁 솔루션 대비 약 10배 빠른 속도와 높은 </span><span>정확도를 </span><span>선보인다. </span></p> <p contents-hash="29c0d62760a327aa6dd580d51f4ce2f4c016bdf31b60e7cea276fdb3bd01f187" dmcf-pid="081BU7hDjC" dmcf-ptype="general"><span>이파피루스는 문서 데이터 추출 라이브러리 '파이뮤PDF 프로' 성능을 업그레이드했다고 26일 밝혔다. </span></p> <p contents-hash="4f5dfd967f0154cf18ae57946b1d780ad627bf7a92af5859860a938d9ac5f321" dmcf-pid="p6tbuzlwNI" dmcf-ptype="general"><span>이번 업데이트의 핵심은 머신러닝 기술을 활용한 문서 레이아웃 분석 기능 추가다. 이를 통해 AI 전처리 용도로 활용되는 문서 데이터 추출 작업 전반의 속도와 정확도를 동시에 높였다는 설명이다.</span></p> <figure class="figure_frm origin_fig" contents-hash="71002744635f8227883347c3229432923adfb523b50de3d4ea587e115fd309d5" dmcf-pid="UPFK7qSraO" dmcf-ptype="figure"> <p class="link_figure"><img alt="이파피루스, '파이뮤PDF 프로' 레이아웃 분석 성능 업그레이드(이미지=이파피루스)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/26/ZDNetKorea/20251126181913082dbca.png" data-org-width="638" dmcf-mid="tIW05twacS" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/26/ZDNetKorea/20251126181913082dbca.png" width="658"></p> <figcaption class="txt_caption default_figure"> 이파피루스, '파이뮤PDF 프로' 레이아웃 분석 성능 업그레이드(이미지=이파피루스) </figcaption> </figure> <p contents-hash="ae1f2c7d3981a96c1d10c14acc344f46ba4db6ee291a34aebf90a78aabc8cb9b" dmcf-pid="uQ39zBvmAs" dmcf-ptype="general">현재 시중의 다수 문서 추출 솔루션은 문서를 고해상도 이미지로 변환한 뒤 비전 언어 모델(VLM) 방식으로 인식하는 구조를 갖고 있다. 이 방식은 연산량이 많아 처리 속도가 느리고, 고가 GPU 인프라를 필요로 한다는 한계가 있다. </p> <p contents-hash="1cc136d38754219a72c2e792804485f720ec843ecd46edfdd1648066451cee4b" dmcf-pid="7x02qbTsam" dmcf-ptype="general">반면 최신 버전 '파이뮤PDF 프로'는 자체 개발한 머신러닝 기반 레이아웃 분석기를 적용해 문서 구조를 직접 파악한 뒤 데이터를 추출한다. 이파피루스는 이 방식이 VLM 기반 글로벌 유사 제품 대비 약 10배 빠른 속도를 구현하면서도 높은 정확도를 유지한다고 설명했다. </p> <p contents-hash="95a2590f3bf19332d3fcf90a61cbb8de812e2be21d6c17dcf32e30a79495ea04" dmcf-pid="zMpVBKyOgr" dmcf-ptype="general">특히 테두리가 없거나 병합 셀을 포함한 복잡한 표, 스캔 이미지와 디지털 데이터가 뒤섞인 문서에서도 독보적인 처리 품질을 보인다는 점을 강조했다. GPU 없이 CPU만으로 동작해 인프라 비용 부담이 적은 것도 강점으로 내세웠다.</p> <p contents-hash="6e3ee788f95b6915c113e9e3f8c81bac3b2d441cae2d3f3a7b57e9bbebc508ff" dmcf-pid="qRUfb9WIaw" dmcf-ptype="general">'파이뮤PDF 프로'는 인공지능 및 빅데이터 구축, 업무 자동화, 이미지 렌더링 등 다양한 문서 작업을 파이썬 환경에서 빠르고 정확하게 구현할 수 있는 문서 데이터 추출 라이브러리다. 2016년 첫 출시 이후 2025년 11월 현재 누적 다운로드 1억2천만 건을 돌파했다. 오라클, 보쉬, DHL, 도큐싸인, 슈나이더일렉트릭 등 글로벌 기업 고객을 확보하며 기술력을 인정받고 있다.</p> <p contents-hash="00b06e6781b6d05a837d069731708a901dfe61149f4fdcee27e0bf5ce69eadd4" dmcf-pid="Beu4K2YCcD" dmcf-ptype="general">대규모 언어 모델(LLM)과 검색 증강 생성(RAG) 특화 기능도 강화됐다. '파이뮤PDF 프로'는 문서 내 페이지, 위치 등 메타데이터를 포함한 청크(말뭉치)를 생성할 수 있어 LLM·RAG 환경에서의 검색과 추론 효율을 높인다. </p> <p contents-hash="a0e6b92bd9a58610492c2648aa04b4ee89fb1b2f9006931b4b5233d022ec7aab" dmcf-pid="bd789VGhgE" dmcf-ptype="general">또한 추출한 문서 데이터를 라마인덱스(LlamaIndex)에서 바로 활용 가능한 리더(Reader) 파일 형태로 출력할 수 있어, 문서 기반 대화형 서비스나 검색형 AI 서비스를 개발하는 데 유리하다. 지원 포맷은 PDF, MS오피스, 한글 문서, 이미지 등 다양한 문서 유형을 포괄한다.</p> <p contents-hash="06b44f0cadfb13d1016b12f38debd39fd8ff5b50248f9cdcadbafd9c65d80b2b" dmcf-pid="Kk6LeJu5gk" dmcf-ptype="general">이파피루스 김정아 부사장은 "자체 테스트 결과에 따르면 '파이뮤PDF 프로'는 문서 읽기·쓰기와 텍스트 추출, 문서 렌더링 등 모든 작업에서 글로벌 유사 제품들보다 압도적으로 빠른 속도를 자랑한다"며 "AI 시스템 구축을 위한 필수 도구로서 LLM·RAG 서비스 구현이나 데이터베이스 구축에 드는 시간과 비용을 크게 줄여줄 것"이라고 말했다.</p> <p contents-hash="71c962121f3ea015159828a1f7e0be8b9d8b6cb8b39d00f04c412047eb055f8c" dmcf-pid="9EPodi71cc" dmcf-ptype="general">남혁우 기자(firstblood@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p> 관련자료 이전 윤은혜, 가난한 어린 시절 고백…"한 평짜리 집 거주, 이사갈 때마다 행복했다" (은혜로그인) 11-26 다음 ‘마침내 깨어난’ 구글, AI 패권 흔들다 11-26 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.