당신의 논문을 'AI 동료'가 30분만에 평가?…현실화 임박 작성일 12-04 31 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">전문가들"효율과 타당성은 달라…신뢰도 먼저 쌓아야"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="FY9g7nMVR6"> <figure class="figure_frm origin_fig" contents-hash="88c91a18ffbf5e24853b6cd74b974c5447c4e96c2ada4dba99c1f635f913551f" dmcf-pid="3G2azLRfR8" dmcf-ptype="figure"> <p class="link_figure"><img alt="비영리 단체 오픈아카이브(openRxiv)가 인공지능(AI) 기반의 논문 동료평가(peer review) 도구를 도입하겠다고 발표해 주목받고 있다. 게티이미지뱅크 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/04/dongascience/20251204145744663xyml.jpg" data-org-width="680" dmcf-mid="tO54W2ztJP" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/04/dongascience/20251204145744663xyml.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 비영리 단체 오픈아카이브(openRxiv)가 인공지능(AI) 기반의 논문 동료평가(peer review) 도구를 도입하겠다고 발표해 주목받고 있다. 게티이미지뱅크 제공 </figcaption> </figure> <p contents-hash="c9374f41c673cf964c48afeabb6cfa0098f3cda07111ff0c749a9aed436354e2" dmcf-pid="0NWbhz3GJ4" dmcf-ptype="general">논문 사전공개 사이트를 운영하는 비영리 단체 오픈아카이브(openRxiv)가 인공지능(AI) 기반의 '논문 동료평가(peer review)' 도구를 도입하겠다고 지난달 발표했다. 효율적이지만 오류의 여지가 남아 있는 AI의 논문 심사 과정을 두고 우려의 목소리가 나온다. AI의 심사 능력 자체에 대한 엄밀한 평가가 선행돼야 한다는 것이다.</p> <p contents-hash="9f29d5844f1072cf7ccaaa338296c2da07086e854f9900946f7a7d8c14097836" dmcf-pid="pjYKlq0HMf" dmcf-ptype="general"> 3일(현지시간) 국제학술지 '네이처'에 따르면 지난달 논문 사전공개 사이트인 '바이오아카이브(bioRxiv)'와 '메드아카이브(medRxiv)'를 운영 중인 오픈아카이브가 AI 기반 논문 검토 도구를 각 사이트에 통합한다고 발표해 주목받고 있다.</p> <p contents-hash="32231e8b688ce1b39b67327a512d19e2135fc009546ccf8b30ca05a558ae2237" dmcf-pid="UAG9SBpXLV" dmcf-ptype="general"> 도입되는 AI 도구는 이스라엘의 스타트업 'q.e.d 사이언스'가 개발했다. 생의학 분야 논문에 대해 보통 30분 이내의 신속한 AI 생성 피드백을 제공한다. 독창성을 평가하고 논리적 결함을 식별한다. 추가 실험도 제안하고 텍스트 수정 등도 권고한다.</p> <p contents-hash="c05d0809f1dae1e610272e03686a5454c1721bed73d14e42438f131fdb143135" dmcf-pid="ucH2vbUZM2" dmcf-ptype="general"> AI 논문 심사의 장점은 명확하다. 심사를 기다리며 몇 달을 허비하거나 성과를 비꼬는 일부 적대적인 시각을 겪을 필요가 없어진다. 대규모 언어모델(LLM)은 이해관계 충돌 없이 빠르고 '정중한' 피드백을 제공할 수 있어 논문 심사 효율성을 높일 것으로 기대된다.</p> <p contents-hash="4692bdf26afa240285178dc9651d97371e7f9a39d2c6780685aa3f1267aa8b50" dmcf-pid="7kXVTKu5e9" dmcf-ptype="general"> 영국 임페리얼칼리지런던의 신경생물학자인 조르지오 질레스트로 교수는 'AI 심사관'의 매력을 부인할 수는 없지만 효율과 타당성 개념에는 차이가 있다고 지적한다. 과학계가 AI 기술을 수용하며 '물류 문제'를 해결하려다 더 큰 문제를 만들지 않도록 주의해야 한다는 것이다.</p> <p contents-hash="05145b8a8c80a79a7c5a1958224e9b8cad36aafa03afaa8bf849b2b69397daee" dmcf-pid="zEZfy971dK" dmcf-ptype="general"> 질레스트로 교수가 말하는 동료평가의 목적은 두 가지다. 논문의 통계, 방법론, 논리적 일관성을 면밀히 검토하고 기존 틀에 도전하는 희귀한 발견을 인정하는 것이다. 질레스트로 교수는 "인간은 원칙적으로 두 기능을 모두 수행할 수 있지만 AI는 그렇지 않을 수 있다"고 말했다.</p> <p contents-hash="88f24898441a4d907f79a5f4489875e541af0f7082c421fea1050c28e538298b" dmcf-pid="qD54W2ztJb" dmcf-ptype="general"> LLM은 인간을 대신해 통계 정확성을 확인하고 표절과 인용 오류를 잡아낼 수 있다. 이를 넘어선 범위에서 AI가 심사를 수행할 경우 문제가 생길 수 있다는 설명이다.</p> <p contents-hash="74b923b428c74fdd9421aed62628a2edd4cdc204c0bf35987e49afb4b148d31d" dmcf-pid="Bw18YVqFJB" dmcf-ptype="general"> 먼저 인간 동료평가는 보통 3명의 전문가가 서로 다른 관점을 제시하고 편집자가 이를 통합하는 과정으로 이뤄진다. AI는 서로 다른 평가자의 의견을 통합하는 대신 평균적인 평가를 출력한다는 한계가 있다.</p> <p contents-hash="5c08c63e77724e83d4eb5bb7166ea09cb73e8d90816d238fc88300f5cfa769ce" dmcf-pid="brt6GfB3dq" dmcf-ptype="general"> 인간 동료평가의 쟁점은 경험과 실무 지식의 변동성에서 비롯되기도 한다. 이를 즉각적으로 반영할 수 없는 AI 모델은 이미 최신 기술로 대체된 실험 접근법을 제시할 가능성이 있다. 또 인간 연구자들은 현실적인 예산과 시간 제약 내에서 어떤 실험이 가능한지, 또 어떤 실험이 까다로운지 이해하지만 AI 모델은 이같은 '배려'가 부족하다.</p> <p contents-hash="9925076fc1f2d15dfe5b46905ba0c7adbc55ef48ff7706e73d2e11756086d929" dmcf-pid="KmFPH4b0Mz" dmcf-ptype="general"> 두번째 문제로는 '알고리즘적 완벽주의'가 지적됐다. 기본적으로 모든 잠재적인 문제를 지적하려는 AI 알고리즘의 특징 때문에 실행 불가능한 추가 실험을 제안할 수 있다는 것이다. 향후 AI 모델이 개선되면 이같은 문제는 해결될 가능성이 있다.</p> <p contents-hash="ddcfd7eb77fa50bb89c1208276fb71a5a905270ea432fecc6a605fc2fd45c855" dmcf-pid="9s3QX8KpJ7" dmcf-ptype="general"> AI 논문 심사 도입 이후 중대한 오류가 발생할 경우 해당 리뷰의 신뢰성뿐 아니라 전체 심사 시스템에 대한 신뢰까지 무너질 수 있다는 점이 우려된다.</p> <p contents-hash="5bd37df935379a1f45e7e6a16ca6d19882666839fa15c3fe96c5dd1c058b7b6e" dmcf-pid="2O0xZ69UMu" dmcf-ptype="general"> 질레스트로 교수는 먼저 AI 모델이 과학을 검증하고 획기적인 연구를 인식할 수 있는지 판단하는 데이터를 충분히 확보해야 한다고 봤다. 그는 "AI 동료평가 자체에 대한 평가가 우선돼야 한다"고 강조했다.</p> <p contents-hash="700778748c2af634f302082ea24e31ac7fb0d1cc668f4495500f6a3b1dc74f4f" dmcf-pid="VSzJ3R8BRU" dmcf-ptype="general"> <참고 자료><br> - doi.org/10.1038/d41586-025-03909-5</p> <p contents-hash="e20777700dba62506151d983697d1cd6793e4a37456186e123437e70a228ae3c" dmcf-pid="fvqi0e6bdp" dmcf-ptype="general">[이병구 기자 2bottle9@donga.com]</p> </section> </div> <p class="" data-translation="true">Copyright © 동아사이언스. 무단전재 및 재배포 금지.</p> 관련자료 이전 2035년 'AI 만능주의' 도래할수도…"기술·제도 의도적 공진화 필요" 12-04 다음 'AI'발 메모리 블랙홀 현실화…마이크론, 소비자 사업 철수 12-04 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.