선분 700억개 그래프서 삼각형 찾기…단일 컴퓨터 최고기록 경신 작성일 05-27 128 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="F4KgZZ41S7"> <figure class="figure_frm origin_fig" contents-hash="026266cb284fb450aefa86b6b690196109a28d3e5c85acb59aff32c7c3e2759b" dmcf-pid="3rcHxxrRlu" dmcf-ptype="figure"> <p class="link_figure"><img alt="왼쪽부터 윤희용 KAIST 전산학부 박사과정생, 한동형 박사과정생, 오세연 박사과정생, 김민수 교수. KAIST 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202505/27/dongascience/20250527113619508ccwk.jpg" data-org-width="680" dmcf-mid="1QCbkkXDlq" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202505/27/dongascience/20250527113619508ccwk.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 왼쪽부터 윤희용 KAIST 전산학부 박사과정생, 한동형 박사과정생, 오세연 박사과정생, 김민수 교수. KAIST 제공 </figcaption> </figure> <p contents-hash="fcdd99fea510fe4023c003f80aa9479de883df91ef433eb8a6a4a6e172fad8d7" dmcf-pid="0mkXMMmeCU" dmcf-ptype="general">국내 연구팀이 GPU 4개가 장착된 컴퓨터 한대를 활용해 700억개의 선분이 포함된 거대한 그래프에서 20분만에 삼각형꼴의 관계를 모두 찾아 세는 데 성공했다. 슈퍼컴퓨터처럼 여러 컴퓨터가 연결된 시스템이 아닌 단일 컴퓨터에서 처리한 그래프 규모로는 역대 최대다.</p> <p contents-hash="02b8b1441fd8a113b45e7f079c2596a02f13331dc844c53ca2152bbedf962a24" dmcf-pid="psEZRRsdyp" dmcf-ptype="general">KAIST는 김민수 전산학부 교수팀이 한정된 그래픽처리장치(GPU) 자원으로도 대규모 그래프 연산을 고속으로 처리할 수 있는 프레임워크인 '지플럭스(GFlux)'를 개발했다고 27일 밝혔다. 프레임워크는 프로그램 개발에서 뼈대 역할을 하는 도구를 말한다. 연구결과는 22일(현지시간) '국제데이터공학학술대회(ICDE)'에서 발표됐다.</p> <p contents-hash="bef7232eace08626b90696a61d1bff3a9623a3b16b857842849859d81ea5b354" dmcf-pid="UOD5eeOJv0" dmcf-ptype="general"> 인공지능(AI) 분야에서는 지식이나 데이터를 대규모 그래프 형태로 저장하고 활용하는 사례가 늘고 있다. 그래프 연산 중 하나인 삼각형 개수 세기는 점과 선으로 이뤄진 그래프에서 삼각형 형태의 관계를 모두 찾고 개수를 파악한다. 데이터 분석과 AI 분야에서 널리 활용된다.</p> <p contents-hash="a4c74f8c33aad831aa0466f076f04ba8018975efb6f9a0c4b59d270601bedd30" dmcf-pid="uIw1ddIiC3" dmcf-ptype="general"> 복잡도가 높은 그래프 연산은 기존 GPU의 메모리 제한 때문에 규모가 작은 그래프만 처리할 수 있다는 한계가 있다.</p> <figure class="figure_frm origin_fig" contents-hash="9c5be5df4bbc2ceb6e0099e1de6f70b1f42044ea3cd535ad1f1dc34f4de0c435" dmcf-pid="7CrtJJCnvF" dmcf-ptype="figure"> <p class="link_figure"><img alt="KAIST 연구팀이 개발한 GFlux 구조. 그래프 연산을 GPU에 최적화된 단위 작업인 지태스크(GTask)로 나누고 이를 효율적으로 GPU에 배분해 처리한다. KAIST 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202505/27/dongascience/20250527113620842pheg.png" data-org-width="680" dmcf-mid="tOw1ddIivz" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202505/27/dongascience/20250527113620842pheg.png" width="658"></p> <figcaption class="txt_caption default_figure"> KAIST 연구팀이 개발한 GFlux 구조. 그래프 연산을 GPU에 최적화된 단위 작업인 지태스크(GTask)로 나누고 이를 효율적으로 GPU에 배분해 처리한다. KAIST 제공 </figcaption> </figure> <p contents-hash="c44bca40f3fd936abf8dfb64fab626622017aa5fa33b2b16b3d6db7af5a3992c" dmcf-pid="zhmFiihLWt" dmcf-ptype="general">연구팀은 그래프 연산을 GPU에 최적화된 단위 작업인 지태스크(GTask)로 나누고 이를 효율적으로 GPU에 배분해 처리하도록 했다. 불필요한 연산을 사전에 제거한 것이다. GFlux는 그래프를 GPU 처리에 최적화된 자체 개발 포맷인 HGF로 변환해 솔리드스테이트드라이브(SSD) 같은 저장장치에서 관리한다.</p> <p contents-hash="760ca2cf543d2d388eb4d1504a8ee12f6eeb2341ad11b7f3876c26753d84a517" dmcf-pid="qls3nnlol1" dmcf-ptype="general"> 점 사이의 선분이 1조개인 그래프를 기존 표준 포맷인 CSR로 저장하면 용량이 9테라바이트(TB)지만 연구팀이 개발한 HGF 포맷으로 저장하면 약 절반인 4.6TB로 줄일 수 있다. 3바이트(Byte, 3바이트는 24비트) 주소 체계를 활용해 GPU 메모리 사용량도 약 25% 절감했다.</p> <p contents-hash="bf5bdc0c0028741d0bbac644396a7683ad23970470d0550cb7d6f72484e0319e" dmcf-pid="BSO0LLSgW5" dmcf-ptype="general"> 메모리에서 정보의 위치를 지정하기 위해 3바이트만큼의 정보를 사용한다는 뜻이다. 3바이트에는 0 또는 1을 나타내는 정보의 단위인 비트가 24개 있어 2의 24제곱인 약 1600만개 위치를 식별할 수 있다.</p> <p contents-hash="8b3245fcac27693ff7eff49ac125ba615778495ba777c9f42eb957a9f65c28f5" dmcf-pid="bsEZRRsdhZ" dmcf-ptype="general"> 미국 엔비디아의 GPU 개발 도구인 쿠다(CUDA)에 의존하지 않고 연산 실패를 방지하도록 컴퓨터 메모리를 통합적으로 관리하는 GTask 전용 메모리 관리 기술도 함께 개발됐다.</p> <p contents-hash="5bf1cf86155a202c61324e56ff1588af00df94e453330310fc7220e643898037" dmcf-pid="KOD5eeOJlX" dmcf-ptype="general"> 연구팀은 700억개의 선분으로 이어진 그래프에서 삼각형을 모두 찾는 과제를 통해 GFlux의 성능 검증을 진행했다.</p> <p contents-hash="1cbb30769698cd5a2398cbcc3e6d8bbdbcba10d844b22512363a53c874f591aa" dmcf-pid="9Iw1ddIihH" dmcf-ptype="general"> 기존 기술에서는 GPU 없이 슈퍼컴퓨터처럼 고속 네트워크로 연결된 컴퓨터 25대가 동원돼 약 2000초가 걸렸다. 연구팀이 개발한 GFlux를 도입하자 하나의 컴퓨터로 약 2배 빠른 1184초 만에 연산을 마친 것이다. 단일 컴퓨터로 삼각형 개수 세기 연산을 처리한 사례 중 역대 최대 규모다.</p> <p contents-hash="405affe077ef27afe00121425374128555f0939862892cd8c1bd2edbf7f0d24a" dmcf-pid="2CrtJJCnSG" dmcf-ptype="general"> 김 교수는 "최근 그래프를 활용한 검색증강생성(RAG), 지식 그래프, 그래프 벡터 색인 등 대규모 그래프에 대한 고속 연산 처리 기술의 중요성이 점점 커지고 있다"며 "GFlux가 이런 문제를 효과적으로 해결할 것"이라고 기대했다.</p> <p contents-hash="debf245056de0cc8b888231fd8fa1d1c21ee7faf81060c96ffff9d0c3122395c" dmcf-pid="VhmFiihLWY" dmcf-ptype="general"> <참고 자료><br> - doi.org/10.1109/ICDE65448.2025.00075</p> <p contents-hash="e20777700dba62506151d983697d1cd6793e4a37456186e123437e70a228ae3c" dmcf-pid="fls3nnloSW" dmcf-ptype="general">[이병구 기자 2bottle9@donga.com]</p> </section> </div> <p class="" data-translation="true">Copyright © 동아사이언스. 무단전재 및 재배포 금지.</p> 관련자료 이전 '이탈 방어' 지원금 올린 SKT, 주말새 3000명 신규 유입 05-27 다음 7만 6천배 적중으로 약 4억원”…스포츠토토 프로토 승부식, 또 한번의 고배당 적중 사례 발생 05-27 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.