“공공 AX, LLM 도입만으로는 한계”… 기록물 ‘AI-Ready’ 전환 필요성 제기 작성일 04-16 41 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="tydZfsV7Ca"> <p contents-hash="37ddf0ab0a6542a054339a2c9714b9679e5d51fac003973ef84a4c307b8f31b4" dmcf-pid="FWJ54OfzSg" dmcf-ptype="general">아무리 인공지능(AI)과 대형언어모델(LLM)을 공공기관에 도입하더라도, 기반이 되는 데이터가 수작업 중심 구조에 머물러 있다면 국가 차원의 AX(AI 전환)는 기대한 수준의 효과를 내기 어렵다. 출발점은 방대한 기록물을 AI가 이해하고 활용할 수 있는 형태로 전환하는 데 있다.</p> <p contents-hash="f3781690a5b1ebd6866a677f0011c5b24d1ebda8f7bd90f750f2599069d51c23" dmcf-pid="3Yi18I4qvo" dmcf-ptype="general">최근 관련 분석에서는 AI 시대의 데이터 경쟁력이 단순한 정합성이나 정제 수준을 넘어서는 개념으로 확장되고 있다는 점이 강조되고 있다. 정보통신기획평가원에 따르면 고품질 데이터는 AI의 활용 목적과 맥락이 반영된 구조를 포함하며, 경쟁 역시 데이터 확보에서 품질·접근성·연결성·활용성을 높이는 방향으로 이동하는 흐름을 보이고 있다.</p> <p contents-hash="baf6631ed3f7d16fc739a361e5870c98158e71457a1bb233bc69f1f6b5a4abaf" dmcf-pid="0Gnt6C8BTL" dmcf-ptype="general">이와 관련해 AI 기반 기록관리 기업 아카이버스(Archiverse)는 공공 AI 전환의 실효성을 높이기 위해서는 기록물을 단순 전산화 수준이 아닌 구조화된 ‘AI-Ready 데이터’로 전환할 필요가 있다고 보고 있다.</p> <figure class="figure_frm origin_fig" contents-hash="f67a34c7aa7a38d42bbd9cfc90cfda5214158046c35abbcb2f4b417446a3bc55" dmcf-pid="pHLFPh6bvn" dmcf-ptype="figure"> <p class="link_figure"><img alt="사진 제공= 아카이버스" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/16/dt/20260416151934345cmzi.png" data-org-width="600" dmcf-mid="1gFNy6TsyN" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/16/dt/20260416151934345cmzi.png" width="658"></p> <figcaption class="txt_caption default_figure"> 사진 제공= 아카이버스 </figcaption> </figure> <p contents-hash="f783c9536765f00d99c042e66b35bbfb69c8095a892ddd286b6009d1e6f15af4" dmcf-pid="UI6Tqcztyi" dmcf-ptype="general"><br> 현재 B2B 시장에서는 문서를 읽어 텍스트를 추출하거나 특정 필드를 식별하는 OCR 및 문서 파싱 기술이 널리 활용되고 있다. 이러한 솔루션은 영수증, 계약서, 청구서 등 단일 문서 처리의 효율성을 높이는 데에는 효과적이다. 다만 공공 기록물의 경우에는 적용 범위가 제한적이라는 평가가 나온다.</p> <p contents-hash="c8a027fd7d68ab9b2a881799cb6f6d6073c098c3651d3cfbcf9c7b1e56e56cf9" dmcf-pid="uCPyBkqFhJ" dmcf-ptype="general">공공기관의 기록물은 단순한 문서가 아니라, 생산 주체와 시점, 업무 맥락, 관련 사건 및 후속 기록과의 연결 관계까지 포함하는 정보 자산이다. 기록물은 행정의 연속성과 책임을 담는 근거이기도 하다. 이 때문에 텍스트 추출 중심의 접근만으로는 기록의 핵심 요소인 맥락성과 증거성을 충분히 반영하기 어렵다는 지적이 있다.</p> <p contents-hash="0d2001a1d0abe98d8e1cdcb25d853e9c36cbb4bfba17973589f031c1bcf4030f" dmcf-pid="7hQWbEB3Wd" dmcf-ptype="general">아카이버스 측은 “기록물은 감사 대응과 행정 판단의 근거로 활용되는 자산”이라며 “문서 내부 정보뿐 아니라 생산 배경과 관계, 이력까지 함께 구조화돼야 실제 활용 가능한 데이터로 기능할 수 있다”고 설명했다.</p> <p contents-hash="d2d4dd31ca629791d34190e0069fe970f6c9d9ac63bc1d47a4b08aa4ce2a5f0e" dmcf-pid="zlxYKDb0Se" dmcf-ptype="general"><strong>수작업 중심 기록관리의 한계… 지능형 기록관리로 ‘AI-Ready’ 전환</strong></p> <p contents-hash="fc80b6a220fabb499d9f2683ac20fdb7d20d6d96990514a41a9657a1e75fcebc" dmcf-pid="qSMG9wKpyR" dmcf-ptype="general">기록관리 현장의 한계는 인력 자체보다도, 스캔·목록입력·데이터화를 따로 나눠 처리하는 수작업 공정이 반복되는 구조에 있다. 국가기록원에 따르면 2025년까지 전체 소장량 681만철 가운데 디지털화는 18.7%에 그쳤고, 그중 OCR 등 데이터화는 7.6% 수준에 머물러 실제로 기계가 바로 읽고 활용할 수 있는 데이터는 아직 매우 제한적이다. 이에 국가기록원도 2026년 비전자 기록물 3만철 추가 디지털화와 4만철 OCR 데이터화를 추진하는 한편, 생산단계부터 AI 학습데이터로 전환하고 수작업 연계를 자동화하는 방향을 제시했다. 결국 기록을 먼저 파일로 쌓아두고 나중에 다시 사람이 풀어 데이터로 만드는 방식으로는 AX 전환 속도를 따라가기 어렵고, 기록이 생성·수집되는 시점부터 곧바로 AI-Ready 구조로 전환해야 현장의 병목을 줄일 수 있다는 지적이 나온다.</p> <p contents-hash="01cc2a74c981b5c76f49b415cf57bd0f3a4ad62af8f2af990ca0c32ce79b709c" dmcf-pid="BvRH2r9UyM" dmcf-ptype="general">아카이버스는 이러한 한계를 해결하기 위해 자체 지능형 기록관리 기술 ‘IAOS(Intelligent Archive Orchestration System)’와 핵심 모듈 ‘AX-TAG(Thesaurus & Authority Graph)’를 제시하고 있다. AX-TAG는 기록물에 등장하는 인물, 기관, 기능, 사건, 주제 등의 핵심 개체를 식별하고, 이를 전거(Authority) 기반으로 정규화한 뒤 문서 간 관계를 구조적으로 연결하는 기술이다.</p> <p contents-hash="676e3389857851b58868bfe3f500b5a1c5c27fce4da2569c9da89210a690b392" dmcf-pid="bTeXVm2uCx" dmcf-ptype="general">즉, 본문과 첨부, 관련 문서, 생산 주체, 업무 기능, 사건 흐름 등이 분절된 상태로 남아 있던 스캔 파일을 관계와 근거가 유지된 AI-Ready 기록 데이터 자산으로 전환하는 방식이다. 이를 통해 검색, 질의응답, 자동 분류, 추천 등 서비스 활용 기반을 마련하는 동시에, 기록 간 연계와 이력 추적, 근거 확인, 감사 대응이 가능한 관리·거버넌스 체계 구축까지 고려하고 있다는 게 아카이버스의 설명이다.</p> <p contents-hash="dac97f5806a788748c6a944f500c165ca71150262a6875c20fed0f4bd08a50f3" dmcf-pid="KydZfsV7TQ" dmcf-ptype="general">또한 정보통신기획평가원 분석에서도 AI-Ready 데이터는 사후 보정 대상이 아니라, 계획·수집·정제·가공·활용 전 과정에서 사전에 설계되어야 하는 기반으로 제시된다.</p> <p contents-hash="33f86d92d932c7fd96f16b98ae7615462cc170dea81b8eb7a96511f62ecf6310" dmcf-pid="9WJ54OfzTP" dmcf-ptype="general"><strong>국가 AX의 성패, 데이터 기반에 좌우</strong></p> <p contents-hash="140329e343fe9172069cd5aea766c217e5b209d28f3ea1feebd2c60525a0ee3e" dmcf-pid="2Yi18I4qy6" dmcf-ptype="general">업계에서는 공공 부문에서도 RAG(검색증강생성), 문서 요약, 민원 응대, 행정 지원 등 다양한 영역에서 AI 도입이 확대되고 있지만, 맥락과 전거 정보가 충분히 반영되지 않은 텍스트 데이터만으로는 환각(Hallucination)이나 행정 오류를 완전히 방지하기 어렵다는 시각이 나온다. 단순히 문서를 읽는 것과, 해당 문서를 AI가 신뢰하고 재사용할 수 있는 데이터로 전환하는 것은 별개의 문제라는 의미다.</p> <p contents-hash="82fcfb8dc5bed078cb344f4a2742b9ba0ab523affbe92615cc125770045c3bc7" dmcf-pid="VGnt6C8BS8" dmcf-ptype="general">아카이버스는 “국가 차원의 AI 전환이 제대로 작동하려면 결국 학습과 활용의 기반이 되는 데이터 품질이 선행돼야 하며, 공공에서는 그 출발점이 기록관리”라며 “기록의 맥락과 근거, 관계를 유지한 채 실제 업무에 활용할 수 있는 단단한 AI-Ready 기반을 만드는 것이 공공 AX의 출발점”이라고 말했다.</p> <p contents-hash="f528bf10d3d1787be7d1661942092208415f604550422a1a961508073dc7c0e1" dmcf-pid="fHLFPh6bC4" dmcf-ptype="general">단순한 문서의 ‘텍스트화’를 넘어, 국가 기록물의 ‘지식 자산화’와 ‘AI-Ready 전환’을 중심으로 한 접근이 공공 기록관리 체계 변화의 한 방향으로 제시되고 있다.</p> <p contents-hash="335115fce8eeff85195a1513c3e52c7447245f99c3241c2a34eabac44cb8550f" dmcf-pid="4Xo3QlPKyf" dmcf-ptype="general">구본규 기자 qhswls20@dt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털타임스. 무단전재 및 재배포 금지.</p> 관련자료 이전 “미토스 등장, 거대 위기이자 기회”…산·학·연·관 ‘보안 패러다임 전환’ 한목소리 04-16 다음 텔레픽스, AI 큐브위성으로 테헤란 공습 피해 확인…항공기 4대 이상 파괴 04-16 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.