나라지식정보, 공공AX 17번 과제 2차년도 착수보고회… 근대 다문자 OCR 고도화 본격 추진 작성일 04-04 4 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">20만 건 데이터 확장… RAG 기반 플랫폼 실증 본격화</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="BPXfudpXmK"> <figure class="figure_frm origin_fig" contents-hash="9d8792ad7f0098758d74b326c4448e27d046a81223f21178a994c658e7b3a4c9" dmcf-pid="bQZ47JUZEb" dmcf-ptype="figure"> <p class="link_figure"><img alt="나라지식정보 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/04/dt/20260404090129127wjsz.jpg" data-org-width="640" dmcf-mid="qE6EnlJ6m9" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/04/dt/20260404090129127wjsz.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 나라지식정보 제공 </figcaption> </figure> <p contents-hash="1154d4f8e4996c63668b84e330ab82dfff2fd547136292cf8070e0cd66266646" dmcf-pid="Kx58ziu5DB" dmcf-ptype="general"><br> 한국 근대사의 방대한 기록물을 디지털로 전환하는 ‘공공 AX(AI 전환)’ 프로젝트가 2단계 고도화 과정에 돌입했다.</p> <p contents-hash="9af7b5e610c5d80cd64edfda0faf7015da2c41c00626c10631547403644d410c" dmcf-pid="9M16qn71wq" dmcf-ptype="general">과학기술정보통신부 산하 정보통신산업진흥원(NIPA)의 공공AX 계속과제인 ‘한국 근대 다문자 자료 활용 지원 AI 솔루션 개발 및 실증’의 2차년도 착수보고회가 충북 진천 정보통신산업진흥원(NIPA) 컨퍼런스홀에서 열렸다.</p> <p contents-hash="80f603e0f7e8fdc0141e12bbdd498242edaaecba51af6b92339fba572cd10db7" dmcf-pid="2RtPBLztmz" dmcf-ptype="general">이번 보고회는 20개 참여 컨소시엄이 통합 진행된 가운데, 나라지식정보가 주관하고 리스트가 참여한 17번 과제 컨소시엄은 PM인 정규상 이사가 26년도 사업 추진 방향을 세 번째 순서로 발표했다.</p> <p contents-hash="51f304cfb2c6630b9e41dca8a2ff3e5880cccdc4d7281c010572c2be7fc83000" dmcf-pid="VeFQboqFO7" dmcf-ptype="general">앞서 진행된 1차년도는 국사편찬위원회 근대자료 약 4만 건을 기반으로, 이미지 정제·구조화 및 다문자 병렬 데이터 구축 완료와 더불어, AI OCR 모델과 번역·요약·검색 프로토타입을 개발하면서 워크벤치 기반 파일럿 시스템과 사용자 피드백 구조를 성공적으로 구축했다.</p> <p contents-hash="81c15b83e33b4394f4f034949a219bdc65a968ac04fc677401012c1cc9104145" dmcf-pid="fd3xKgB3su" dmcf-ptype="general">올해 시작되는 2차년도 사업은 데이터의 ‘양’과 ‘질’ 모두를 잡는 것이 핵심이다. 전년 대비 5배 늘어난 20만 건 이상의 근대 자료를 확보하면서, 특히 해독이 까다로운 세로쓰기와 국한문 혼용체, 필기체 인식 정확도를 높이는 데 집중한다. 여기에 ‘거대언어모델(LLM)’ 기반의 자동 보정 기술과 ‘검색 증강 생성(RAG)’ 기술을 접목해 사료 검색의 편의성을 획기적으로 개선할 계획이다.</p> <p contents-hash="3d91c2196fa54343ca5621e7055c5e8017c3d6d3b38aaef3980ad275ebf28a8f" dmcf-pid="4J0M9ab0IU" dmcf-ptype="general">실증 단계에서는 국사편찬위원회 역사정보시스템과의 실질적인 연계를 추진하며, 국민이 직접 AI 모델의 성능을 체감하고 피드백할 수 있는 참여형 플랫폼도 구축한다.</p> <p contents-hash="e5a5b8f1377e497d40870fe8a1c1c5dd9e6a4eada7ff1eea384f150c099b109e" dmcf-pid="8us3WKTsmp" dmcf-ptype="general">나라지식정보 손영호 대표는 “이번 2차년도는 기술 개발을 넘어 공공서비스로서의 실효성을 입증하는 단계”라며 “시각장애인 보조기기 등 범용 솔루션으로 확장해 정보 격차 없는 디지털 역사 환경을 만들겠다”고 강조했다.</p> <p contents-hash="d22d20e3b26f50355166ee241147fcc111f89eb8b6a8ccff688ae624385922ed" dmcf-pid="67O0Y9yOw0" dmcf-ptype="general">박영서 기자 pys@dt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털타임스. 무단전재 및 재배포 금지.</p> 관련자료 이전 이미주, ‘신부 관리’ 체험기 공개…제작진 “영상 업로드 예정일이 만우절이다” 04-04 다음 [TF초점] 2%대 추락한 '건물주'…'별들에게 물어봐' 악몽 재현하나 04-04 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.