"하네스 갖추면 오픈소스도 프론티어급"…레드햇이 제안하는 금융권 AI 핵심 전략은? 작성일 06-10 14 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">하네스·추론 최적화·신뢰 운영 등 3대 전략 제시</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="9bvyAggRyk"> <figure class="figure_frm origin_fig" contents-hash="c872fdc4f127e938010959c8ad68e9af08bb715c081ca06259257c99b680c0bb" dmcf-pid="2KTWcaaeCc" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/10/552796-pzfp7fF/20260610130621700zgni.jpg" data-org-width="640" dmcf-mid="BiFplOOcCw" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/10/552796-pzfp7fF/20260610130621700zgni.jpg" width="658"></p> </figure> <p contents-hash="6d2f36d5de359aa5eb7b38d18aaa2c210c792eb736e1aceb4ac1af4655d1437a" dmcf-pid="VfGXwccnCA" dmcf-ptype="general">[디지털데일리 박재현기자] 한국레드햇이 금융권의 AI 에이전트 운영 핵심으로 '하네스(Harness)' 구축과 추론 비용 최적화를 제시했다. 폐쇄망과 규제라는 금융권 특유의 제약을 오히려 AI 통제력의 기반으로 삼아야 한다는 주장이다.</p> <p contents-hash="ac2eb79923a12f31a201a173d8d5fc676cc78ffa31fb443422863a1832a028d2" dmcf-pid="f4HZrkkLCj" dmcf-ptype="general">10일 <디지털데일리>와 한국 레드햇이 공동 주최·주관한 '실험을 넘어 실전으로, 금융 비즈니스의 가치를 증명하는 AI 실행 전략' 세미나에서 이 같은 내용이 공유됐다.</p> <p contents-hash="16a7075003d4ab6760c16b66ca43b27e2345b22d278f1fa791d9b20b4ffdaa93" dmcf-pid="48X5mEEoyN" dmcf-ptype="general">이날 행사는 김경상 한국레드햇 사장의 인사말로 시작됐다. 김경상 사장은 이날 세미나의 핵심 키워드로 두 가지를 꼽았다.</p> <p contents-hash="2ee833d070469993452fb4924387bb39c2c7f22485be0d83d8ba7ea63285323a" dmcf-pid="86Z1sDDgWa" dmcf-ptype="general">김경상 사장은 "금융권 특성상 규제와 보안 기준이 타 산업보다 높은 만큼 AI를 어떻게 안전하게 통제·관리할 것인지가 첫 번째고, 에이전틱 AI로 전환되면서 에이전트끼리 끊임없이 상호작용하며 하드웨어 자원 소모가 급증하는 비용 문제가 두 번째다"라면서 "오늘 세미나가 이 두 가지 고민을 해결하는 데 실질적인 힌트가 되길 바란다"고 말했다.</p> <p contents-hash="764864e99864c6e68fe9e087e5ced6ecb8d262084f2462224060df0d3a702cc0" dmcf-pid="6P5tOwwaSg" dmcf-ptype="general"><strong>◆ "도구·운영·토큰, 금융 AI 하네스의 세 축"</strong>=첫 순서로 변현창 한국레드햇 상무가 '금융 하네스 구축을 위한 3가지 조언'을 주제로 연단에 올랐다. 금융권 AI 에이전트를 효과적으로 운영하기 위한 핵심 개념으로 '하네스(Harness)'를 제시하고, 이를 구현하기 위한 3가지 조언을 공유했다.</p> <figure class="figure_frm origin_fig" contents-hash="1c6838948e774524ae11ddf96fbfc7512c9b7502f79bfd98ea4a6692215257a1" dmcf-pid="PQ1FIrrNyo" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/10/552796-pzfp7fF/20260610130623023jpeq.jpg" data-org-width="640" dmcf-mid="bOxezppXCD" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/10/552796-pzfp7fF/20260610130623023jpeq.jpg" width="658"></p> </figure> <p contents-hash="46dec005488829d4c328067a474c45b02e7a86f1196716fab47999b01509da01" dmcf-pid="Qxt3CmmjvL" dmcf-ptype="general">먼저 변현창 상무는 금융권에서의 하네스를 AI 역량을 비즈니스로 견인하는 장치이자, 잘못된 행동을 제어하는 안전 장치로 정의했다. 금융권에서는 특히 제어 기능이 더 중요하다. 100번 중 한 번만 실패해도 치명적인 금융업 특성상, 충분히 검증되고 안전해질 때까지 프로덕션에 올릴 수 없기 때문이다.</p> <p contents-hash="8eb2abe991c72089c38b8ec45109b19b529cf96774968fd17212c26dc472a964" dmcf-pid="xlJnKzztvn" dmcf-ptype="general">레드햇은 하네스를 구성하는 4가지 핵심 요소로 ▲MCP 기반 연동 ▲컨텍스트 허브 ▲FSD(완전자율주행형)와 코파일럿 병행 운영 ▲모델 서빙 최적화 등을 꼽았다.</p> <p contents-hash="4903defc1a4ddcf07c2b85ab6c211209e30806cf9ec9c6ba1a6731bf0ed297a9" dmcf-pid="y8X5mEEovi" dmcf-ptype="general">컨텍스트 허브는 사내 업무 규칙·코드 템플릿 등을 집약한 환경이다. AI가 이를 기반으로 코드를 생성하면 처음부터 사내 규정을 충족한 결과물이 나온다. FSD는 스펙만 주면 처음부터 끝까지 자율 생성하는 방식이고, 코파일럿은 개발자가 개입하는 방식이다.</p> <p contents-hash="1a9ceb4e2e4a51546fc2f3d3ca14390407f727a008f3de557132e2abe5c9c728" dmcf-pid="W6Z1sDDglJ" dmcf-ptype="general">이에 대해 변 상무는 "프론티어 모델을 하네스 없이 외부에서 쓸 경우 요구사항의 35%만 충족되지만, 오픈소스 모델에 MCP·컨텍스트·스킬 기반 하네스를 갖추면 92%까지 높일 수 있었다"는 PoC 결과도 공유했다.</p> <p contents-hash="8c4e7f93015057a7807cefd9a637694e6b3ed66c6093606cfcc34dfa4bf76fb8" dmcf-pid="YP5tOwwaTd" dmcf-ptype="general">금융권에서 하네스를 구축하기 위한 세 가지 전략도 공유했다. 첫 번째는 도구에 신뢰를 더하는 것이다. 에이전트의 3대 요소인 LLM·툴(MCP)·에이전틱 루프 중 툴의 신뢰성을 높이는 핵심으로 업무 스킬을 꼽았다. 스킬을 부여하면 반복 시행착오 없이 정해진 절차대로 업무를 수행하고, 수행 시간도 절반에서 10분의 1까지 단축된다.</p> <p contents-hash="d623b6d850fc5ae1bdccf7d88f90ba56aafac8b90a50d09899f27aefd0f00254" dmcf-pid="GQ1FIrrNWe" dmcf-ptype="general">두 번째는 에이전트를 만들고 운영하는 환경 자체를 에이전트로 구성하는 것이다. 변 상무는 이를 위한 전제 조건으로 컨테이너 환경을 제시했다. 컨테이너는 애플리케이션·트래픽·플랫폼 환경 전체를 API로 제어할 수 있어, 운영 자동화 에이전트가 인프라 전반을 실질적으로 다룰 수 있다.</p> <p contents-hash="d2dd52c09b4f23bedd798c31d7fc2a0ce4e0176f3ec4bb500bed7121f79adbd2" dmcf-pid="Hxt3CmmjWR" dmcf-ptype="general">보안 측면에서도 컨테이너 기반 샌드박스는 필수다. OWASP 에이전틱 톱10 중 4가지 위협은 샌드박스 환경을 제공해야만 방어가 가능하다. 에이전트가 움직이는 환경을 컨테이너에 가두고 자동화해야 한다는 설명이다.</p> <p contents-hash="1fc760de170875d7d5124e7f108275cd9e1c54f0682acf3682bb8b8923f95fe2" dmcf-pid="XMF0hssACM" dmcf-ptype="general">마지막은 토큰을 예산처럼 관리하는 것이다. 에이전트의 요소 중 하나인 에이전틱 루프(반복 실행)는 토큰 소비를 폭발적으로 늘린다. 골드만삭스는 기업의 에이전트 토큰 소비량은 2030년에 현재의 24배에 달할 것이라고 전망하기도 했다.</p> <p contents-hash="4d9ff07a0bc159fa6c594afea79a14eb8b3e5c61986abdec9c8f224d2afa9bd7" dmcf-pid="ZR3plOOcWx" dmcf-ptype="general">레드햇은 토큰 제어는 수요·공급 두 축에서 접근해야 한다고 강조했다. 수요 측면에서는 MCP 게이트웨이에서 권한 있는 도구만 노출하고, 공급 측면에서는 부서·사용자별 토큰 쿼터 배정, 용도별 모델 배분, 오픈소스 모델 내부 서빙 최적화를 병행해야 한다.</p> <p contents-hash="2beaf40c81f9d2b58eddb994003bffb580c970a8f1c249e8ed300ab515213807" dmcf-pid="5JU7ThhDSQ" dmcf-ptype="general">변 상무는 "모델이 더 좋고 나쁜 게 문제가 아니라, 그 모델이 움직일 수 있는 환경을 잘 만드는 것이 모델보다 훨씬 중요하다"고 역설했다.</p> <p contents-hash="18e3ddbf335edb6f9e4ab49afcdf9422a0d7d5aeaeed89fbfcc865a7c4381668" dmcf-pid="1iuzyllwSP" dmcf-ptype="general"><strong>◆추론 비용 최적화·신뢰 운영 환경…레드햇 AI 플랫폼 전략</strong>=성희경 한국레드햇 이사는 에이전트 AI 시대 금융 AI 플랫폼의 핵심 과제로 추론 비용 최적화와 신뢰할 수 있는 운영 환경 구축 두 가지를 제시했다.</p> <figure class="figure_frm origin_fig" contents-hash="2ca0993497ee6a57777b71bf9896b4bc3928b4bd2927ca098fa51c9439f8d50a" dmcf-pid="tn7qWSSrv6" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/10/552796-pzfp7fF/20260610130624344djsz.jpg" data-org-width="640" dmcf-mid="KCF0hssASE" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/10/552796-pzfp7fF/20260610130624344djsz.jpg" width="658"></p> </figure> <p contents-hash="e1e1ef28011789c16762f05cf360e7ecb2a139757e97459f49c80600a01cc374" dmcf-pid="FLzBYvvmh8" dmcf-ptype="general">에이전트 확산에 따른 비용 부담은 이미 현실화되고 있다. 성희경 이사에 따르면, 에이전트는 반복 추론으로 인해 일반 챗봇 대비 5배에서 20배 이상의 GPU 자원을 소모한다.</p> <p contents-hash="023ae413220b9fe17655047db1d4de9f7937fbfb6166a9763eb2ea386a70129f" dmcf-pid="3oqbGTTsl4" dmcf-ptype="general">금융권은 폐쇄망 환경상 GPU를 자유롭게 늘리기 어려운 만큼, 같은 자원으로 더 많은 추론을 처리하는 효율화가 곧 경쟁력이라는 설명이다.</p> <p contents-hash="1e01589c13b066f4ed94802601c8e711b514436a3a4648e4877d2e603aee035c" dmcf-pid="0gBKHyyOvf" dmcf-ptype="general">추론 비용 최적화를 위해 레드햇은 두 가지 방향을 제시했다. 첫 번째는 vLLM과 llm-d 기반 고성능·분산 추론이다. 대표적으로 링크드인은 입력 프롬프트에서 반복 계산되던 공통 구간을 프리픽스 캐싱으로 재사용하고 쿠다 그래프를 최적화해 추론 성능을 끌어올렸다.</p> <p contents-hash="39a0771b4a01bdaae5ac106fd494e24ed9952dff01dba538445351d3a2340eb9" dmcf-pid="pab9XWWIlV" dmcf-ptype="general">테슬라는 기존 라운드 로빈 방식이 vLLM의 KV 캐시를 활용하지 못하는 한계가 있었는데, 캐시 관련 데이터를 보유한 인스턴스로 트래픽을 보내는 캐시 어웨어 라우팅으로 전환한 결과 같은 GPU 환경에서 출력 처리량이 3배 향상되고 첫 토큰 생성 시간도 2배 단축됐다.</p> <p contents-hash="42b9026980b032ba02b2873e0216119c3dd240a1dcb5983d2d838235607cd0ec" dmcf-pid="UNK2ZYYCS2" dmcf-ptype="general">두 번째는 양자화를 통한 모델 압축이다. 레드햇은 70B 모델을 GPU 8장에서 운영하던 고객사에 LLM 컴프레서를 적용해 99% 이상의 정확도를 유지하면서 GPU를 2장으로 줄인 사례를 소개했다.</p> <p contents-hash="de056e28b96d740f20c3ed0ec0886f7fb29c54c9ec969537b1f992a5c6236313" dmcf-pid="uj9V5GGhh9" dmcf-ptype="general">신뢰할 수 있는 운영 환경 구축을 위해 레드햇이 제시한 방안은 세 가지다. 첫째는 검증된 모델을 컨테이너 표준 패키지 형태로 주기적으로 제공해 고객의 모델 검증 부담을 줄이는 것이다.</p> <p contents-hash="848f50cafcc9fa0a018ce060f2ec8bbd1b99c08b9fb22e9c3bb920a27996c458" dmcf-pid="7vno2BB3lK" dmcf-ptype="general">다음으로 폐쇄망 환경에서 모델 반입·평가·등록·서빙 과정을 표준화해 운영 편차와 감사 리스크를 최소화하고, 세 번째로 AI 게이트웨이와 MCP 게이트웨이를 통해 승인된 모델과 도구만 실행되도록 통제하는 것이다.</p> <p contents-hash="d15b065f0d0f19ebcc66694d4051494219d0d5ad5ab5a4da54636c21d894ab60" dmcf-pid="zTLgVbb0Wb" dmcf-ptype="general">레드햇은 이 같은 기능을 단일 플랫폼으로 제공하는 '레드햇 AI'를 소개했다. 레드햇 AI는 모델 추론, 배포, 보안 통제, 모니터링을 하나의 플랫폼에서 운영할 수 있으며, 특정 모델·가속기·클라우드에 종속되지 않고 에이전트 운영 체계를 표준화할 수 있다. 금융권의 폐쇄망과 하이브리드 환경에서도 일관된 방식으로 운영이 가능하다는 점도 강점이다.</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털데일리. All rights reserved. 무단 전재 및 재배포 금지.</p> 관련자료 이전 AI가 바꾼 기업 경쟁력…"승부처는 의사결정 속도" 06-10 다음 UFC, 오는 9월 프랑스 파리에서 대회 개최 06-10 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.