“30배 빠른데 정확도까지” 기초과학硏, 생명과학 데이터 분석 도구 ‘scICE’ 개발 작성일 07-03 20 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="6egoI0Iiuc"> <figure class="figure_frm origin_fig" contents-hash="355d85fe986055ccc2d202c98ccd52ecb73edb73caa5f35e9a7ceee25d385534" dmcf-pid="PdagCpCnuA" dmcf-ptype="figure"> <p class="link_figure"><img alt="이번 연구를 수행한 김재경(왼쪽) 기초과학연구원(IBS) 수리 및 계산 과학 연구단 의생명 수학그룹 CI(KAIST 수리과학과 교수)와 김현 선임연구원.[IBS 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/03/ned/20250703152938747bfgl.jpg" data-org-width="1280" dmcf-mid="8XCI181m3k" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/03/ned/20250703152938747bfgl.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 이번 연구를 수행한 김재경(왼쪽) 기초과학연구원(IBS) 수리 및 계산 과학 연구단 의생명 수학그룹 CI(KAIST 수리과학과 교수)와 김현 선임연구원.[IBS 제공] </figcaption> </figure> <p contents-hash="11ea76c1117aadb8a6526bb3158967732cb0650aaee1e5f57dc4c6906a5b9541" dmcf-pid="QJNahUhLuj" dmcf-ptype="general">[헤럴드경제=구본혁 기자] 기존보다 최대 30배 빠른 속도로 안정적인 결과만을 자동으로 선별, 대규모 생명과학 데이터 분석의 정확도와 효율성을 획기적으로 향상하는 방법이 나왔다. 기초과학연구원(IBS) 수리 및 계산 과학 연구단 의생명 수학 그룹 김재경 CI(KAIST 수리과학과 교수) 연구팀은 세포 분류(클러스터링) 결과의 안정성을 수학적으로 평가해 불안정한 결과를 걸러내는 새로운 분석 도구인 ‘scICE(single-cell Inconsistency Clustering Estimator)’를 개발했다.</p> <p contents-hash="c7f2e287ca24ba4cbee6276424a499989d6c20f2c53427d465709b02f03f658e" dmcf-pid="xijNlulozN" dmcf-ptype="general">단일세포 수준에서 유전자 발현을 분석하는 기술인 단일세포 전사체 분석법(scRNA-seq)은 현대 생명과학 연구의 핵심 도구로 자리 잡았다. 이 과정에서 클러스터링은 유사한 유전자 발현 특성을 가진 세포들을 그룹으로 묶는 작업으로, 암세포와 정상 세포를 구분하거나 새로운 세포 유형을 발견하는 데 중요한 첫걸음이다. 하지만 클러스터링 알고리즘은 무작위로 세포를 분류해 같은 데이터를 분석해도 결과가 달라지는 경우가 많다.</p> <p contents-hash="5101c8420042d1c4a583421cfdf79c948a906db8382224f1341031ef40ead22d" dmcf-pid="yZp08c8t0a" dmcf-ptype="general">제1저자인 김현 선임연구원은 “일부 정상 세포가 암세포로 잘못 분류되거나 중요한 세포 유형이 누락되는 불안정성으로 인해 연구자들은 다시 분석하거나 복잡한 계산을 통해 신뢰도가 높은 결과를 선별해야 했다”며 “기존 방법들은 분석을 여러 번 반복해 합의된 결과를 도출하는 방식으로, 계산량이 방대하고 수만 개 이상의 세포가 포함된 대용량 데이터에는 적합하지 않다”고 말했다.</p> <p contents-hash="239a5002c21795882b2267cf27253c1cf1d2057e1b397f151b072404d3edfa43" dmcf-pid="W5Up6k6F0g" dmcf-ptype="general">연구팀이 개발한 scICE는 한 번의 분석만으로도 얼마나 일관성 있게 결과가 도출됐는지를 수학적으로 평가한다. 새로 도입한 ‘불일치 계수(Inconsistency Coefficient, IC)’를 통해 많은 계산량이 요구되는 연산 없이도 클러스터 간 안정성을 정량적으로 판단할 수 있다. 모든 세포를 일일이 비교하던 기존 방식과 달리, 불일치 계수를 활용한 안정성 평가는 클러스터 구조 간 유사성만 평가해 비교 대상을 획기적으로 줄일 수 있어 분석 시간을 크게 단축한다.</p> <p contents-hash="2df8eb72213ad0cfa3b45b773a3e06fe65d7d662d52e7dbf893bd1e668c56092" dmcf-pid="YFz7xwxp0o" dmcf-ptype="general">연구팀은 뇌, 폐, 혈액 등 다양한 조직에서 수집된 48개의 실제 및 모의 scRNA-seq 데이터에 scICE를 적용하여 그 유효성을 입증했다. 그 결과, 기존 분석 결과 중 약 3분의 2는 통계적으로 불안정하며 신뢰하기 어렵다는 사실을 밝혀냈다. 반면, scICE는 신뢰할 수 있는 결과만을 선별해 연구자의 시간과 계산 자원을 절약하면서도 정확도를 한층 높였다.</p> <p contents-hash="8f7748445aa9c18fad97e03654c4799de25fc286fb0cba3a6ad9c7faf9e3acb5" dmcf-pid="G3qzMrMU3L" dmcf-ptype="general">김재경 CI는 “이번 연구는 수학적 아이디어가 어떻게 생명과학의 핵심 문제를 해결하고 분석 과정을 혁신할 수 있는지를 보여주는 성과”라며 “클러스터링 신뢰도의 중요성이 간과되어 온 측면이 있는데, 이번 기회로 scICE가 생명과학 분야에서 신뢰도 높은 데이터 해석을 가능케 하는 표준 도구로 자리 잡기를 기대한다”고 전했다.</p> <p contents-hash="e278cc3af8f359ca968d28053ef7346dc181f40fd7d3a4004e222afbf80c50d4" dmcf-pid="H0BqRmRu3n" dmcf-ptype="general">이번 연구결과는 국제학술지 ‘네이처 커뮤니케이션즈’에 게재됐다.</p> </section> </div> <p class="" data-translation="true">Copyright © 헤럴드경제. 무단전재 및 재배포 금지.</p> 관련자료 이전 "자식보다 낫다"…시니어 삶 바꾸는 챗봇 비서 ‘똑비’ 07-03 다음 차이나조이만큼 뜨겁다. 中 최대 서브컬처 축제 ‘빌리빌리 월드’로 향하는 한국 게임사들 07-03 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.