“삐뚤빼뚤 수학답안” 채점도 척척…토종 ‘AI 선생님’ 등장 작성일 12-17 16 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">- UNIST·POSTECH, 손글씨 수학 답안 채점하는 AI 선생님 ‘베미’ 개발</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="8zxYcetW5s"> <figure class="figure_frm origin_fig" contents-hash="7e8b8753fb1503b3aa0c0f2cbc63374f499fc03a94e8f87e4c58ec59a5ac9b6b" dmcf-pid="6gI41lRf5m" dmcf-ptype="figure"> <p class="link_figure"><img alt="손글씨 수학 풀이를 단계별로 분석하는 베미(VEHME)의 채점 과정.[UNIST 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/17/ned/20251217122504934ooqx.jpg" data-org-width="752" dmcf-mid="fVI41lRfXI" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/17/ned/20251217122504934ooqx.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 손글씨 수학 풀이를 단계별로 분석하는 베미(VEHME)의 채점 과정.[UNIST 제공] </figcaption> </figure> <p contents-hash="177aaecd6dbabc5137ffcaf1bffcd4b897c4c8812561d2d854c1f86c3100430d" dmcf-pid="PaC8tSe4Zr" dmcf-ptype="general">[헤럴드경제=구본혁 기자] 삐뚤빼뚤한 수학 답안을 사람처럼 꼼꼼하게 채점하고 첨삭까지 해주는 AI 선생님이 나왔다.</p> <p contents-hash="6cec14d9a6e219b6198db15d479a0b7a9f59f606f4d5d997f60d91403c501693" dmcf-pid="QNh6Fvd8Hw" dmcf-ptype="general">UNIST(울산과학기술원) 인공지능대학원 김태환 교수와 POSTECH 고성안 교수팀은 손글씨로 쓴 복잡한 수학 답안을 채점하는 AI 모델인 ‘베미(VEHME)’를 개발했다고 17일 밝혔다.</p> <p contents-hash="2bf6fac5e1a71eaff1db5c05b6aee859cf757759e9f151d780d03507625172d8" dmcf-pid="xjlP3TJ65D" dmcf-ptype="general">주관식 수학 문제 채점은 교육 현장에서 가장 시간이 많이 소요되는 업무지만 이를 자동화하기에는 한계가 있었다. 수학 풀이 특성상 수식, 그래프, 도형이 섞여 있고 학생마다 필체와 답안 배치가 제각각이라, AI가 이를 정확히 인식해 오류를 찾아내는 것이 어렵기 때문이다.</p> <p contents-hash="09eda04c8372864416833ed19127442392a6772671651301341f44c1f02e3908" dmcf-pid="yp8vaQXSGE" dmcf-ptype="general">연구진이 개발한 베미는 마치 사람이 문제 풀이의 흐름을 따라가는 것처럼 수식의 위치와 문맥을 정확히 읽고, 틀린 풀이를 짚어낼 수 있다.</p> <p contents-hash="b9cfafead0c65e52a104ca4f932c7542aa9c09c13dae67215e45244b69462f3b" dmcf-pid="WU6TNxZv1k" dmcf-ptype="general">실제 베미로 미적분부터 초등학교 산수 수준의 다양한 수학 문제 풀이를 채점해본 결과, 경량 모델임에도 불구하고 거대 모델인 ‘GPT-4o’, 제미나이 2.0 Flash와 대등한 채점 정확도를 보였다. 특히 답안이 심하게 회전되어 있거나 글씨가 엉망인 고난도 평가에서는 베미가 오히려 상용 모델들을 제치고 더 정확하게 오류 위치를 찾아냈다. 70억 개의 매개변수를 사용하는 베미와 달리 GPT나 제미나이와 같은 모델들은 수천억 개 이상의 매개변수를 가진 것으로 알려져 있다.</p> <p contents-hash="3bc7690e71e2be9ccef1761bab7f0764b49b87cffaf532ff3874adfa085ab8fd" dmcf-pid="YuPyjM5TYc" dmcf-ptype="general">연구팀은 수식 인식 시각 프롬프트(EVPM)라는 자체 개발 기술과 ‘이중 학습 기법’을 이용해 베미를 만들 수 있었다. EVPM은 베미가 복잡하게 나열된 수식들에 가상의 박스를 쳐서 풀이 순서를 놓치지 않게 만들어준다. 2단계 강화학습은 단순히 정답을 맞혔는지 뿐만 아니라, 풀이 과정 중 어느 부분이 왜 틀렸는지까지 설명할 수 있도록 한다.</p> <figure class="figure_frm origin_fig" contents-hash="e830b506a739e4acc19e76f413af17716cc6b16d2c9f594ed38f358123096989" dmcf-pid="G7QWAR1yGA" dmcf-ptype="figure"> <p class="link_figure"><img alt="김태환(왼쪽부터) UNIST 교수, 고성안 POSTECH 교수, 투 프엉 융우엔 UNIST 연구원, 득 엠 융우엔 POSTECH 연구원.[UNIST 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/17/ned/20251217122505180yqjz.jpg" data-org-width="1280" dmcf-mid="4myRuGoMtO" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/17/ned/20251217122505180yqjz.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 김태환(왼쪽부터) UNIST 교수, 고성안 POSTECH 교수, 투 프엉 융우엔 UNIST 연구원, 득 엠 융우엔 POSTECH 연구원.[UNIST 제공] </figcaption> </figure> <p contents-hash="49391f380ce51fd95bbff2c70f28016039e847336bda6fb3a1bf0e4eb1e6d4f2" dmcf-pid="HsXnb1Ai1j" dmcf-ptype="general">또 AI가 학습할 수 있는 정교한 손글씨와 첨삭 데이터가 많지 않았기 때문에 거대 언어 모델(QwQ-32B)로 합성 데이터를 만들어 활용했다.</p> <p contents-hash="a5ea09fdf831c09ce9a22ad2083334d152aa2d3db0a74c26908498ab5f3989ad" dmcf-pid="XOZLKtcn5N" dmcf-ptype="general">한편, 베미는 오픈 소스 모델로 만들어져 학교나 학원 같은 교육 기관에서 무료로 쓸 수 있다.</p> <p contents-hash="881cb66365ef8ddac96409f584a6f1e949687365e6b1da57e27996d099fbffc1" dmcf-pid="ZI5o9FkLYa" dmcf-ptype="general">김태환 교수는 “손글씨 수학 채점은 에듀테크 AI의 난제 중 하나이자 이미지와 언어를 함께 이해해야 하는 멀티모달 AI의 대표적 적용 분야”라며 “베미는 복잡한 풀이 구조를 사람처럼 단계별로 따라가며 판단하는 모델로, 실제 교육 현장에서 활용할 수 있을 정도의 안정성과 효율성을 확보한 것에 큰 의미가 있다”고 말했다.</p> <p contents-hash="1bd1aab035f596bb0c052f80306adaa94954cbef3114ceb085e9974dc20f54d2" dmcf-pid="5C1g23EoHg" dmcf-ptype="general">이어 “자체 개발한 EVPM 모듈은 복잡하게 배열된 시각 정보를 자동으로 구조화할 수 있게 해, 교육 분야뿐 아니라 문서 인식, 설계 도면 분석, 수기 기록물 디지털화 등 다양한 산업 분야의 멀티모달 추론 모델에도 쓸 수 있을 것”이라고 덧붙였다.</p> <p contents-hash="f732289eb9d043aca2ab5b4675f96c27046082e0685eea2bedc1dc90d9248d24" dmcf-pid="1htaV0DgXo" dmcf-ptype="general">과학기술정보통신부 한국연구재단, 정보통신기획평가원 등의 지원으로 수행된 이번 연구결과는 자연어처리(NLP) 분야 대표 국제학회인 EMNLP(Empirical Methods in Natural Language Processing)의 정식 논문으로 채택됐다.</p> </section> </div> <p class="" data-translation="true">Copyright © 헤럴드경제. 무단전재 및 재배포 금지.</p> 관련자료 이전 프렌치파파 "子와 '흑백2' 함께 시청…큰 위로 됐다" [N현장] 12-17 다음 정지석 스파이크-조병현 강속구의 합작품...대한항공-SSG, 인천 소외계층 지원 위해 기부 12-17 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.