'하네스'가 뭐야?…앤트로픽 '클로드' 성능 비법 드러나자 AI업계 충격 [AI 클로즈업] 작성일 04-11 32 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">"AI 에이전트 시장의 승부처는 모델의 크기가 아니라 하네스 구조"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="1cedNju5Sz"> <figure class="figure_frm origin_fig" contents-hash="cf4091bbc5d08a65d414b5373d3d8665ca616e9ed7a970fec745f9b7804215fc" dmcf-pid="tkdJjA71v7" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/11/552796-pzfp7fF/20260411120011789mviq.jpg" data-org-width="640" dmcf-mid="5dtFqBmjSq" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/11/552796-pzfp7fF/20260411120011789mviq.jpg" width="658"></p> </figure> <p contents-hash="c0e6d003ef2c0bc193c34cef3f64f5076dde46c8286b6df974fb0fade440b222" dmcf-pid="FEJiAcztWu" dmcf-ptype="general">[디지털데일리 구아현기자] 앤트로픽의 AI모델인 '클로드'가 경쟁사보다 코딩을 잘한다는 평가가 왜 나왔을까.</p> <p contents-hash="4add38ce1ca2f704be16bbe27cff63bbb68afa9c997ac266f4311828c35e787b" dmcf-pid="3DinckqFSU" dmcf-ptype="general">놀랍게도 그것은 AI 모델의 성능 차이이 아니라 통제 구조 때문이었다.</p> <p contents-hash="d4cf4819ad72e5f4236f8b9fb6acd72068aba5624b8df111f5a1853282fcd2be" dmcf-pid="0wnLkEB3Wp" dmcf-ptype="general">최근 발생한 클로드 소스코드 유출 사태로 그간 베일에 싸여있던 에이전트 통제 기술 노하우가 드러나 AI업계에 충격을 던지고 있다. 결론부터 말하면 '하네스를 제대로 설계할 줄 아는 기업과 모르는 기업의 격차가 지금 벌어지고 있다'는 것이다.</p> <p contents-hash="b7f5e7669ccb472a164d5e2a4b2b58c35a183821d02c70cac6a5eab5d7f29deb" dmcf-pid="prLoEDb0T0" dmcf-ptype="general"><strong>◆ '하네스'가 AI 에이전트 시대 핵심</strong></p> <p contents-hash="2886a4a978ec1a6e49cb5bdabf6311edb5755ad62665c899d2a54b41dddd89ff" dmcf-pid="UmogDwKpv3" dmcf-ptype="general">'하네스'의 사전적 의미는 말에 씌우는 마구다.</p> <p contents-hash="78b8e00331aa750ba1a9b3194594132ece6286366eaaa6659703bc2d30f739cf" dmcf-pid="usgawr9UlF" dmcf-ptype="general">AI 분야에서는 야생마 같은 대형언어모델(LLM)을 말에 비유하면서 하네스라는 용어를 쓰게 됐다. 추론 모델이 등장하면서 스스로 생각하고 결정하는 단계에서 이랬다 저랬다 하는 돌발 행동을 제어하고 일관된 업무 수행을 보장하는 안전장치가 바로 하네스다.</p> <p contents-hash="4dc5788257f699d2b4a544d51615e13271e2ed8d6367cf6fea2ccb887daac94d" dmcf-pid="7OaNrm2uCt" dmcf-ptype="general">몇 년 전만 해도 AI는 챗봇이었다. 질문에 예상 답변을 주는 규칙 기반(Rule-based)으로 작동했다.</p> <p contents-hash="7efb985146d69b910573b24c84ecc9b908e37d7dc601061946e9a2d84283d5fc" dmcf-pid="z1lSXZLxW1" dmcf-ptype="general">하지만 지금은 다르다. AI가 스스로 계획하고 실행하며 결과를 확인하고, 방향을 수정한다. 이게 '에이전트'다. <br> </p> <p contents-hash="bcb68fdc719cb3affb21c974d6c9332360a611f2063e37bc66c8f6cb909d04bf" dmcf-pid="qtSvZ5oMT5" dmcf-ptype="general">클로드 코드에 코딩을 맡기면 사람이 자리를 비운 사이 수십 개 파일을 고쳐놓는다. 에이전트는 강력한 만큼 위험도 크다. 사람 개입 없이 혼자 움직이기 때문에 의도를 잘못 읽으면 엉뚱한 결과를 낸다. 이메일이나 문서 안에 악성 지령을 숨겨 에이전트를 조종하는 '프롬프트 인젝션' 공격도 가능하다. 자율성이 클수록 통제가 더 중요해지는 이유다.</p> <p contents-hash="22a6eac9739a84ac1f6671a9ae174325d93f5c9cc665ce42227fd4c798b0b972" dmcf-pid="BFvT51gRhZ" dmcf-ptype="general">앤트로픽은 AI 에이전트를 4단계 층으로 나눈다. ▲모델(지능 자체) ▲하네스(지침·제약) ▲도구(연결 서비스) ▲환경(실행 공간)이다. 이 중 핵심은 하네스다. '100달러가 넘으면 먼저 알려라', '확인 없이 경비를 제출하지 마라' 같은 업무 규칙을 에이전트에 심는 층이다. 아무리 좋은 모델도 허술한 하네스를 만나면 무너진다.</p> <p contents-hash="bcc1573957b5ca506dd335d0228f7adb330660ed486d468474820377f04a6b86" dmcf-pid="b3Ty1taeCX" dmcf-ptype="general">앤트로픽은 지난달 24일 자사 엔지니어링 블로그에 하네스 설계도를 처음 공개했다. 핵심은 설계·생성·검증 3단 구조다. ▲설계자가 작업을 잘게 쪼개고 ▲생성자가 코드를 짜고 ▲검증자가 실제 화면을 돌아다니며 결과물을 채점한다. AI 이미지 생성 기술인 생성적 적대 신경망(GAN)에서 착안한 방식이다.</p> <p contents-hash="01e64d8e45b34fe7500f3e8a2e2faf61b9f305119311ec69856ef4aa210ceb8b" dmcf-pid="K0yWtFNdWH" dmcf-ptype="general">이 구조 덕에 수 시간짜리 자율 작업이 가능해졌다. 기존 AI는 맥락이 끊기면 처음부터 다시 시작해야 했다. 앤트로픽은 각 단계가 끝날 때 다음 에이전트에 작업 현황을 넘기는 구조화된 인계 방식을 도입했다. 에이전트가 바뀌어도 일이 이어진다.</p> <p contents-hash="71cbe99c0963d9436b04c45bda7a28855257ebbb3e230065122655c4a97facdf" dmcf-pid="9pWYF3jJvG" dmcf-ptype="general">학계도 움직이기 시작했다.</p> <p contents-hash="dff58138e14575cfed34d95aa9344d4c5a4faddfb3413aadd4208f5e9d259ff1" dmcf-pid="2UYG30AiTY" dmcf-ptype="general">중국 칭화대·선전대 연구팀은 지난달 하네스를 처음으로 독립 연구 대상으로 다룬 '하네스 공학' 논문을 발표했다. 이달 초에는 관련 연구 40편을 총망라한 서베이 논문도 나왔다.</p> <p contents-hash="e172d4784dfe5ea9b120c6b9cc38243951bca93c96e0fe360c52eb2f56bd22e1" dmcf-pid="VuGH0pcnSW" dmcf-ptype="general">조사 결과 대부분의 에이전트 논문이 하네스 설정을 아예 보고하지 않는 것으로 드러났다. 연구자들도 이제야 하네스를 에이전트의 성능을 결정하는 핵심으로 보고 학술 개념으로 재정의하고 연구하기 시작했다.</p> <p contents-hash="7f5b0f97c3d6375f9ac93392757e1b190726df3abf4fe182eeec66a77cd76512" dmcf-pid="f7HXpUkLly" dmcf-ptype="general"><strong>◆ 앤트로픽 소스코드 유출로 드러난 하네스 구조… "500조원 가치"</strong></p> <p contents-hash="f6bf1049c2e82f234b6a86b6b13cf2ee2f1552b759b33e75869c0383736766ad" dmcf-pid="4zXZUuEoCT" dmcf-ptype="general">그런데 이 블로그가 올라온 지 일주일 뒤 예상치 못한 일이 생겼다. 개발자들이 이용하는 소프트웨어 패키지 저장소(NPM)에 수동으로 앤트로픽 코드를 배포하는 과정에서 실수로 클로드 코드 소스코드 일부가 공개됐다.</p> <p contents-hash="e2baea8c07e354abe4887ecce02e1609f0a42234ccc730ac6f5dbaf77d5d3f7d" dmcf-pid="8qZ5u7DgSv" dmcf-ptype="general">51만줄이 넘는 코드와 2000개에 달하는 파일, 출시 전 미공개 기능 등이 포함되면서 "500조원짜리 비법이 다 나왔다"는 반응이 쏟아졌다. 개발자들이 들여다보니 블로그 설계도와 내부 구조가 거의 일치했다.</p> <p contents-hash="46cf2e59245a4a37a17cb67c12b40afbbd87f029b458fd33743646e2aa06e1af" dmcf-pid="6B517zwayS" dmcf-ptype="general">앤트로픽이 수습에 나섰지만 유출 여파는 꽤 컸다. 하네스 설계 노하우를 흡수하려는 움직임이 걷잡을 수 없었기 때문이다. 앤트로픽은 깃허브에 8000여 건의 저작권 침해 신고(DMCA)를 보내 소스코드 삭제를 강력히 요청하는 등 사태 진화에 나섰다.</p> <p contents-hash="3021dbd0e5b1103932bb38cbdc3e01ce4135281f044a4c06f90dc8b7143fb3b7" dmcf-pid="Pb1tzqrNvl" dmcf-ptype="general">하지만 이러한 삭제 조치에도 유출된 코드는 개발자 커뮤니티 중심으로 빠르게 확산됐다.</p> <p contents-hash="c6bb6ae6c0622f2ad5840949e7736d12d063763d457d32e0c22c01ceeaa5c76e" dmcf-pid="QtSvZ5oMCh" dmcf-ptype="general">국내 한 AI 스타트업 대표는 "며칠간 개발자들과 소스코드를 분석한 결과는 놀라웠다"며 직원 한 명이 10명 하는 몫을 하는 것이 조직의 목표였으나 이제는 한 명이 100명 몫을 하는 구조로 설계하는 것으로 전략을 수정했다"고 말했다.</p> <p contents-hash="37ed3470f0af4faabdd9a3b20e75b677902dc0adde41d83d2358d9a8c57fb1d7" dmcf-pid="xFvT51gRvC" dmcf-ptype="general">경쟁사들도 같은 방향을 보고 있다.</p> <p contents-hash="523ae48074d0d88555b1205593be8bfe2b6be05668d5929e844122a13cdb4f3c" dmcf-pid="ygPQnLFYvI" dmcf-ptype="general">오픈AI는 지난 2월, 엔지니어 소수가 코드 한 줄 쓰지 않고 에이전트만으로 100만 줄 규모의 제품을 10배 빠르게 만든 사례를 공개했다. 구글 딥마인드 역시 수학 전용 에이전트 ‘알레테이아(Aletheia)’에 3단 구조를 적용해 수학올림피아드 수준에서 95.1%의 정확도를 기록했다.</p> <p contents-hash="472815ac94a6cfbc81c8f3470b0d032bbfd5213681f48cec05dd979d42ba41a1" dmcf-pid="WaQxLo3GvO" dmcf-ptype="general">결국 AI 에이전트 시장의 승부처는 모델의 크기가 아니라 하네스 구조다.</p> <p contents-hash="707ef39bcf7d28e980820e21ebe4ef900cb5df281708763f91cb3cb85bc25043" dmcf-pid="YNxMog0Hls" dmcf-ptype="general">그 모델을 얼마나 정교하게 통제하고 업무에 최적화하느냐에 달렸다. 다른 AI 기업 대표는 "AI 모델은 이게 더 이상 중요하지 않다"며 "하네스 구조가 성능을 결정할 것"라고 강조했다.</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털데일리. All rights reserved. 무단 전재 및 재배포 금지.</p> 관련자료 이전 첸백시, 또 소속사와 결별…SM 이어 INB100도 계약 해지 통보 04-11 다음 '건물주' 하정우X임수정, 김준한 납치...시청률도 납치할까 04-11 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.