‘안전한 미토스’ 페이블, 불만 속출... “안전장치 너무 엄격해 불편” 작성일 06-11 27 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="VmtdZQQ9mT"> <p contents-hash="ba1bff545061156697b43d250e5baec3522bea921b7e46073404a2561e59ec2c" dmcf-pid="fsFJ5xx2wv" dmcf-ptype="general"><strong>”보안 관련 단어만 들어가도 다운그레이드”<br>“기술 발전 위해 필요한 과정이란 건 인정”</strong></p> <p contents-hash="612bbeec2fd599d62ddf4fb07533861f12a8c80a38f06b74ab39aa5056870365" dmcf-pid="4O3i1MMVOS" dmcf-ptype="general">[보안뉴스 강현주 기자] 앤트로픽이 최근 발표한 AI 모델 ‘페이블’의 보안 안전장치(Guardrails)가 너무 엄격하다는 불만이 제기되고 있다. </p> <p contents-hash="896ac6ff0e21b4c4558438852cfbcd4fed1546e259727189979c1e566edf296b" dmcf-pid="8I0ntRRfDl" dmcf-ptype="general">페이블은 앤트로픽의 사이버보안 특화 모델 ‘미토스’(Mythos)의 제한적 공개 버전이다. 사이버 보안 취약점 공략에 악용될 수 있는 기능을 막았다. </p> <figure class="figure_frm origin_fig" contents-hash="68f47d8033af25410f372716b415269e0e17410eed234af1f7b819e28b58e48a" dmcf-pid="6CpLFee4Dh" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/11/552815-KkymUii/20260611110538538twqh.jpg" data-org-width="1000" dmcf-mid="22aZLWWIDy" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/11/552815-KkymUii/20260611110538538twqh.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> [출처: 연합] </figcaption> </figure> <div contents-hash="865998a6ba7a1fa954fc12132e71f6f7f74b95e60eea43b3bbe1a193e203cb42" dmcf-pid="PhUo3dd8mC" dmcf-ptype="general"> <br>10일(현지시간) 테크 분야 외신에 따르면 이 제약에 대해 사이버보안 연구원들이 온라인을 통해 불만을 토로하고 있다. </div> <p contents-hash="08d7667f5762261c9abef8d7947f04ecfc7d624a116dee335247a1a7dab82cea" dmcf-pid="QEXxY44qII" dmcf-ptype="general">IBM 소속 한 보안 연구원은 “페이블은 사이버보안과 조금이라도 연관성이 있는 요청은 전부 거부한다. 심지어 보안 관련 블로그 글을 읽어달라는 무해한 작업마저도 거부했다”고 밝혔다. </p> <p contents-hash="54b465794a4cb408bb590d5fb9723458331a6f9dfec73939fbe0545c87c132f8" dmcf-pid="xDZMG88BIO" dmcf-ptype="general">프롬프트가 안전장치를 작동시키면 페이블은 대화를 일시 중단하고 “보안 조치에 따라 이 메시지가 사이버보안 또는 생물학 관련 주제로 분류되어 차단되었습니다”와 같은 메시지를 띄운다는 것이다.</p> <p contents-hash="10ccae97e5c35c3a2a6486daeede361b8fc9bc2eb34aefd6936c395f2d47a48b" dmcf-pid="yqiWellwDs" dmcf-ptype="general">AI 보안 스타트업 톨모 관계자는 테크크런치(TechCrunch)와 인터뷰를 통해 “AI에게 안전한 코드를 작성해 달라고 요청하면, 이를 소프트웨어 엔지니어링의 모범 사례가 아니라 사이버보안 관련 작업으로 간주하여 모델의 성능을 강제로 다운 그레이드를 해버린다”고 밝혔다.</p> <p contents-hash="5d91df0129712987c240cf7ec32b37122f4cb8f9c691d234da3f46342926ed9c" dmcf-pid="WBnYdSSrEm" dmcf-ptype="general">페이블은 안전장치에 걸릴 경우 하위 모델인 ‘클로드 오퍼스 4.8’로 자동 전환되도록 프로그래밍돼있다. 이는 단어 기반으로 작동하는 것으로 보이며, ‘사이버보안’의 어휘 범주에 속하는 단어가 조금이라도 들어가면 무조건 발동된다는 것이다. </p> <p contents-hash="785d97619241cfa547dec0617fe4f7be6dfc7d5d155eddcacd06c4568e03ad10" dmcf-pid="YbLGJvvmEr" dmcf-ptype="general">다만 아직 초기 단계이고 앤트로픽 역시 안전장치를 조정해 나가는 과정이기 때문에 이해되는 부분이라는 게 그의 설명이다. 기술 발전을 위해 거쳐야 할 과정임을 인정한다는 것이다. </p> <p contents-hash="833984a09106478d54d6f881add5cb10e19bb1f9644df03d2109789022b68744" dmcf-pid="GKoHiTTsDw" dmcf-ptype="general">그는 “앤트로픽을 비롯한 유력 AI 기업들이 차세대 사이버보안 기업들과 더 많이 협력하면서 안전장치는 점차 진화할 것”이라며 “처음 출시할 때는 보안망을 촘촘히 쳐서 위험 요소를 최대한 잡아내고, 시간이 지나면서 안전장치를 완화하는 편이 낫다”고 말했다. </p> <p contents-hash="1add2edeca493f556ff86ef64137a95464cd63ea979cb2edd7e7ed01806a1612" dmcf-pid="H9gXnyyOOD" dmcf-ptype="general">또 다른 보안 연구원은 엑스(X, 구 트위터)를 통해 “그저 코드 리뷰를 요청했을 뿐인데도 페이블의 안전장치가 작동했다”며 불만을 터뜨렸다.</p> <p contents-hash="edf4425caa07ce23e8592439a95f2821ac7291ae339d0d47ac9da479f4b146c9" dmcf-pid="X2aZLWWIEE" dmcf-ptype="general">이러한 안전장치들은 페이블이 악성코드를 개발하거나 소프트웨어를 해킹하는 데 악용될 위험을 줄이기 위해 도입됐다. 앤트로픽은 지난 4월 미토스를 처음 출시했을 당시, 주요 소프트웨어와 국가 기간시설의 보안을 강화하기 위한 목적의 ‘프로젝트 글래스윙’을 통해 소수의 기업 및 기관에만 모델 사용을 제한한 바 있다. 최근 앤트로픽은 15개국 수백 개의 조직으로 미토스의 접근 권한을 확대한다고 발표했다.</p> <p contents-hash="c945c1a501a0580da580769d20b0697237d3ae32010b561d2f8470beca325d5b" dmcf-pid="ZVN5oYYCwk" dmcf-ptype="general">페이블의 안전장치에 대한 이 같은 불만에 대해 앤트로픽은 아직 특별한 답변을 내놓지 않았다. </p> </section> </div> <p class="" data-translation="true">Copyright © 보안뉴스. 무단전재 및 재배포 금지.</p> 관련자료 이전 [AI는 지금] AI로 업무 3분의 1 줄여도 생산성 바뀌지 않는 이유는 06-11 다음 조병용 선생 추모 국제검도대회, 남원서 12∼14일 개최 06-11 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.