한컴 ‘아래아한글’, AI 시대 전략 자산으로 ‘재조명’ 작성일 11-27 35 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">축적된 아래아한글 문서, 대규모 지식 데이터베이스 역할<br>한컴오피스, 단순 문서도구 아닌 AI 플랫폼으로 전환</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="7Dn4xCd8Yd"> <figure class="figure_frm origin_fig" contents-hash="258fc84475122f080ffae414d2c0472d37826129616b800050861de244ffe32c" dmcf-pid="zro6RliPte" dmcf-ptype="figure"> <p class="link_figure"><img alt="한글과컴퓨터는 35년간 축적된 아래아한글 문서가 ‘소버린AI’ 경쟁력을 강화하는 핵심 데이터가 될 수 있다고 강조했다. [한컴 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/27/ned/20251127090153485sprw.jpg" data-org-width="1280" dmcf-mid="UCe98mx2Zi" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/27/ned/20251127090153485sprw.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 한글과컴퓨터는 35년간 축적된 아래아한글 문서가 ‘소버린AI’ 경쟁력을 강화하는 핵심 데이터가 될 수 있다고 강조했다. [한컴 제공] </figcaption> </figure> <p contents-hash="2cc4333df1519198a8e87eea62956da2486d775571be9ee18700b17d5b344e0e" dmcf-pid="qmgPeSnQZR" dmcf-ptype="general">[헤럴드경제=박세정 기자] 인공지능(AI) 시대, 특화된 고유 데이터의 중요성이 커지면서 한글과컴퓨터(한컴)의 ‘아래아한글(HWP)’이 새로운 전략자산으로 재조명받고 있다.</p> <p contents-hash="2324722b068cda5baf1c32ceba765b221ea33f01afdf63b9ef44c3f70449fa47" dmcf-pid="BsaQdvLx1M" dmcf-ptype="general">35년간 축적된 아래아한글 문서가 AI 데이터 주권을 확보할 수 있는 핵심 기반이 될 수 있다는 기대다.</p> <p contents-hash="5fb58aa3490d2af51089378319c08adf556223605a43fa7b58baf17f7e23be21" dmcf-pid="bONxJToM1x" dmcf-ptype="general">27일 한컴은 AI 시대를 대비해 문서의 구조 정보를 명확히 담을 수 있는 XML 기반의 개방형 표준 포맷 HWPX로의 전환을 추진해왔다고 밝혔다.</p> <p contents-hash="13c78d4cd2f0c4d9c93c93aabb31d9e44583810a9dbf20d1ed5558557fbc23f9" dmcf-pid="KIjMiygRYQ" dmcf-ptype="general">과거 HWP 파일이 이진(Binary) 코드로 구성돼 기계 판독이 어려웠던 한계를 벗어나 이를 기술적으로 해결한 것이다. HWPX는 문서 내의 텍스트, 표, 수식 등을 컴퓨터가 명확하게 식별할 수 있는 구조로 저장한다.</p> <p contents-hash="c2f49298abf9484637a54e42216442cc782664b425af81d06ad3a2c849c9842c" dmcf-pid="9CARnWaeYP" dmcf-ptype="general">한컴에 따르면 정부의 실증 테스트를 통해 HWPX의 데이터 추출 정확도가 마이크로소프트(MS)의 DOCX 등 국제 표준과 비교해 유의미한 차이가 없음을 검증했다. 최근에는 글로벌 빅테크 기업들의 거대언어모델(LLM)도 HWP와 HWPX 파일을 인식하고 내용을 분석하는 기능을 갖추고 있어, 포맷 호환성 문제가 해소된 상태라고 한컴 측은 설명했다.</p> <figure class="figure_frm origin_fig" contents-hash="65fd3b8060e0bae07ff28cd5c93f82ce3f2257a9a362e78fbbec02665a10e3a6" dmcf-pid="2hceLYNdZ6" dmcf-ptype="figure"> <p class="link_figure"><img alt="한글과컴퓨터 사옥 [사진, 한컴]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/27/ned/20251127090153752ngam.jpg" data-org-width="860" dmcf-mid="uJSkmuCE5J" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/27/ned/20251127090153752ngam.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 한글과컴퓨터 사옥 [사진, 한컴] </figcaption> </figure> <p contents-hash="bd52e03088bfd717459ecf119d1f3dd84bbb39c91f8d4746e12f4e6488918b90" dmcf-pid="VlkdoGjJY8" dmcf-ptype="general">이와 함께 한컴은 한컴 데이터 로더(Data Loader) 기술을 통해 문서 활용성을 높였다. 이 기술은 HWP 문서를 AI가 학습하기 쉬운 데이터 형태(JSON 등)로 자동 변환해 준다. 별도의 복잡한 가공 과정 없이도 기존 문서를 AI 학습용 데이터로 즉시 활용할 수 있는 기반이 마련됐다.</p> <p contents-hash="96c9e732d26d589b5be28ec84bf940feed3da86481484f8a3dfeb3605e4d6b2a" dmcf-pid="fEifQIe454" dmcf-ptype="general">더 나아가 30년 넘게 공공 영역에 축적된 방대한 한글 문서가 대규모 지식 데이터베이스 역할을 할 수 있다는 평가가 나온다. 이 데이터들은 공적 검토 과정을 거쳐 생성된 만큼, 신뢰성과 정확도에 강점이 있다.</p> <p contents-hash="f446204e89a4b99cabfb9465edc3f02fc2e734ed53af14fa094b86a8767f0071" dmcf-pid="4Dn4xCd8Yf" dmcf-ptype="general">한컴 측은 “AI 모델의 성능이 학습 데이터의 품질에 의해 좌우된다는 점을 고려할 때, 이러한 공공 문서는 한국형 AI 모델의 정확도와 전문성을 높이는 데 있어 대체 불가능한 가치를 지닌다”고 강조했다.</p> <p contents-hash="ef8d581216c56f9f5ced6384bef03d861b0fcf9dd5213984668aa9f66fd0e561" dmcf-pid="8wL8MhJ6GV" dmcf-ptype="general">디지털 시대의 기술 주권을 위해서는 국내 환경에 최적화된 데이터를 전략적으로 활용해야 한다는 목소리도 커지고 있다. 축적된 문서 데이터를 기반으로 소버린(주권형) AI를 구축, 독자적인 경쟁력을 확보할 수 있다는 기대다. 이에 맞춰 한컴은 한컴오피스를 단순한 문서 작성 도구에서 AI 데이터 플랫폼으로 전환하는 전략을 펴고 있다.</p> <p contents-hash="ba3261f1cc368d28255f19fd2a27c3d4e8c5ef2b3a793e4fdcf6e2a86670340a" dmcf-pid="6ro6RliPH2" dmcf-ptype="general">정지환 한컴 최고기술책임자(CTO)는 “한글 문서는 단순한 기록물이 아니라, 국내 AI 산업이 글로벌 빅테크와 차별화된 경쟁력을 갖게 하는 원천”이라며 “이 자산을 AI 기술과 결합해 데이터 가치를 극대화하고, AI 강국으로 도약하는 데 필요한 기술적 지원을 이어가겠다”고 말했다.</p> </section> </div> <p class="" data-translation="true">Copyright © 헤럴드경제. 무단전재 및 재배포 금지.</p> 관련자료 이전 Zscaler, AI 기반 클라우드 네이티브 SSE ‘ZIA’로 현대 보안 위협 대응 강화 11-27 다음 뇌 ‘도파민 폭발’은 흥분과 억제 회로의 정교한 이중주 11-27 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.