챗GPT 등 대형언어모델, 개인정보 탈취할 수 있어…정확도 95.9%

작성일 02-24

<div id="layerTranslateNotice" style="display:none;"></div>  
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="12L2feiB66">
          <figure class="figure_frm origin_fig" contents-hash="6115176978c28f4414b71895047f7494ab87f6428f15875a9d419cf808dadf7a" dmcf-pid="tdrdicDxP8" dmcf-ptype="figure">
           <p class="link_figure"><img alt="게티이미지뱅크 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202502/24/dongascience/20250224120654720wlnr.jpg" data-org-width="680" dmcf-mid="5oYEwSyjQP" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202502/24/dongascience/20250224120654720wlnr.jpg" width="658"></p>
           <figcaption class="txt_caption default_figure">
            게티이미지뱅크 제공
           </figcaption>
          </figure>
          <p contents-hash="8d4e31fc1506c4bc204a77058f59b4bc190e95d05ac517807f62ec70d77159a6" dmcf-pid="FJmJnkwM84" dmcf-ptype="general">국내 연구진이 챗GPT가 개인정보를 무단으로 수집하거나 사이버공격 등에 악용될 수 있다는 사실을 규명했다. 대형언어모델(LLM) 관련 범죄를 미리 예측하고 대비할 필요가 있는 이유다. </p>
          <p contents-hash="af39cf0992f5409979d7343c130252725fe5e488bd53dde96111b357d607e500" dmcf-pid="3isiLErR6f" dmcf-ptype="general">KAIST는 신승원 전기 및 전자공학부 교수, 이기민 김재철 AI 대학원 교수 공동연구팀이 실제 환경에서 LLM이 사이버 공격에 악용될 가능성을 실험적으로 규명했다고 25일 밝혔다.</p>
          <p contents-hash="0b21fdf70d52e4a4625c2f3b892c56c80e07fe8f2c94841d8a3824277d62b100" dmcf-pid="0nOnoDmePV" dmcf-ptype="general">현재 OpenAI, 구글 AI 등에서 만든 상용 LLM 서비스는 사이버 공격에 사용되는 것을 막기 위해 방어 기법을 자체적으로 탑재하고 있다. 그러나 KAIST 연구팀의 실험 결과 이 같은 방어 기법이 있음에도 쉽게 우회해 LLM 서비스를 이용해 악의적인 사이버 공격을 수행할 수 있음을 확인했다. </p>
          <p contents-hash="4dd3707d09bf48150059d99007e89a95c3b65e83f703b66859ef027539bb0fa1" dmcf-pid="pLILgwsdP2" dmcf-ptype="general">연구팀은 3가지 대표적인 사이버 공격 시나리오를 설계하고 하나씩 입증했다. 첫 번째 개인식별정보(PII) 수집 실험에서는 최신 상용 LLM 모델인 챗GPT, 클로드(Claude), 제미나이(Gemini)를 사용해 주요 대학의 컴퓨터 과학 교수들의 개인 정보를 자동으로 수집하는 테스트를 진행했다. 실험 결과 LLM 모델로 최대 535.6개의 PII 항목을 추출할 수 있었다. 정보의 정확도는 95.9%였다. 특히 웹 검색과 내비게이션 기능을 활용한 모델이 다른 모델보다 높은 성능을 보였다. </p>
          <p contents-hash="824737a0e53a81c4e9576695e85b15b1443f2a62871dca7b2e94f3e80060a8c6" dmcf-pid="UoCoarOJx9" dmcf-ptype="general">두 번째 특정 인물을 사칭하는 게시물 생성 실험에서는 LLM 모델이 저명한 교수를 사칭해 소셜미디어 게시물을 작성하도록 했다. 그 결과 생성된 게시물의 93.9%가 진짜 같다는 평가를 받았다. 셋째 피싱 이메일 제작 실험에서는 LLM 모델이 대상자의 이메일 주소만을 입력받고도 맞춤형 피싱 이메일을 생성하도록 했다. 실험 결과 LLM 모델이 생성한 피싱 이메일의 링크 클릭률은 최대 46.67%였다.</p>
          <p contents-hash="ca7684b014d90fcf67dcba15f20d7610c0e5a220b8d58972f8676800f304032c" dmcf-pid="ughgNmIi4K" dmcf-ptype="general">연구팀은 "평균적으로 LLM 모델이 공격 한번을 수행하는 데 걸리는 시간은 10~20초 내외이며 비용은 약 2~4센트(60원 이하)로 매우 저렴한 것으로 나타났다"라고 말했다. </p>
          <p contents-hash="35004781a8994b250c16ab1f10a55b9bfc97574ffe8a18d9ac197dea574d167e" dmcf-pid="7alajsCn4b" dmcf-ptype="general">제1저자인 김한나 KAIST 전기및전자공학부 박사과정생은 "LLM에게 주어지는 능력이 많아질수록 사이버 공격의 위협이 기하급수적으로 커진다는 것이 확인됐다”며, "LLM 에이전트의 능력을 고려한 확장 가능한 보안 장치가 필요하다”고 말했다.</p>
          <p contents-hash="7e18747c9aa4fb09a7dc01a759adb2b65d6eb6b3b20aa1c1c25ea758657dab5e" dmcf-pid="zNSNAOhLQB" dmcf-ptype="general">신 교수는 “이번 연구는 정보 보안 및 AI 정책 개선에 중요한 기초 자료로 활용될 것으로 기대되며 연구팀은 LLM 서비스 제공업체 및 연구기관과 협력하여 보안 대책을 논의할 계획이다”라고 밝혔다.</p>
          <p contents-hash="441eb333053f148757ff0762f35a020cc0c3e0c14610def5b80c04e4eee0142e" dmcf-pid="qjvjcIloxq" dmcf-ptype="general">이번 연구는 컴퓨터 보안 분야의 학회 중 하나인 국제 학술대회 'USENIX Security Symposium 2025'에 소개될 예정이다.</p>
          <p contents-hash="ab76cc6e9a1144164f1a836659755333136fe8a77b9a33128b0e088b069318c6" dmcf-pid="BLILgwsd4z" dmcf-ptype="general">&lt;참고자료&gt;<br> -DOI: 10.48550/arXiv.2410.14569</p>
          <figure class="figure_frm origin_fig" contents-hash="55c0bc7cdb0130bed02a8c96c4aca17005c307d3f053f88ca987ad1936d8b75e" dmcf-pid="boCoarOJ67" dmcf-ptype="figure">
           <p class="link_figure"><img alt="LLM 에이전트가 웹 기반 도구들을 사용하여 공격자(유저)의 요구에 따라 답변을 생성하는 과정이다." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202502/24/dongascience/20250224120419468zqel.png" data-org-width="554" dmcf-mid="26UgjsCnPu" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202502/24/dongascience/20250224120419468zqel.png" width="658"></p>
           <figcaption class="txt_caption default_figure">
            LLM 에이전트가 웹 기반 도구들을 사용하여 공격자(유저)의 요구에 따라 답변을 생성하는 과정이다.
           </figcaption>
          </figure>
          <p contents-hash="d550e1c6b33d7a2973020b69d0107aec9e0ea120d41d948feff698d578001694" dmcf-pid="KghgNmIixu" dmcf-ptype="general">[이채린 기자 rini113@donga.com]</p>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © 동아사이언스. 무단전재 및 재배포 금지.</p>

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

챗GPT 등 대형언어모델, 개인정보 탈취할 수 있어…정확도 95.9%

멤버랭킹

관련자료

멤버랭킹