"스냅드래곤 X2 엘리트 익스트림 CPU, 전세대比 성능 39% 향상" 작성일 11-19 35 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">[스냅드래곤 딥다이브] 프라임/퍼포먼스로 CPU 코어 이원화, 성능·효율 개선</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="3GXACJu5cE"> <p contents-hash="046aa58cb1d565547dc3146aa47cd93193961a1dd549cb2b1b144e1797013d9f" dmcf-pid="0HZchi71gk" dmcf-ptype="general">(지디넷코리아=권봉석 기자)[샌디에이고(미국)=권봉석 기자] 퀄컴은 지난 해 상반기 스냅드래곤 X 엘리트 탑재 PC 출시 이후 현재까지 CPU 관련 내부 구조나 설계 철학 등 상세 내용을 공개한 적이 없다.</p> <p contents-hash="7652fc243b34e71c54802c598ce2dbf1d7bdd9d3812abb45c1b09ae149a8e6b0" dmcf-pid="pjcVduCEoc" dmcf-ptype="general">11일(이하 현지시간) 오전 미국 캘리포니아 주 샌디에이고 내 '스냅드래곤 X 엘리트 딥다이브' 행사에서는 프라딥 카나파티필라 퀄컴 엔지니어링 부사장 겸 CPU 아키텍트가 직접 관련 내용을 설명했다.</p> <figure class="figure_frm origin_fig" contents-hash="de41d4b44a54270107c548b55b024cb00a527adc18c90ff5a59980b45e707314" dmcf-pid="UAkfJ7hDNA" dmcf-ptype="figure"> <p class="link_figure"><img alt="프라딥 카나파티필라 퀄컴 엔지니어링 부사장 겸 CPU 아키텍트. (사진=지디넷코리아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230713076ggpx.jpg" data-org-width="640" dmcf-mid="Yo7RjVGhjh" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230713076ggpx.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 프라딥 카나파티필라 퀄컴 엔지니어링 부사장 겸 CPU 아키텍트. (사진=지디넷코리아) </figcaption> </figure> <p contents-hash="13073515c7de83926253fa6c9707b5876dfd67d1d54855ad65cfa2772670b6dd" dmcf-pid="ucE4izlwaj" dmcf-ptype="general">퀄컴이 내년 출시를 앞둔 고성능 PC용 시스템반도체(SoC)인 스냅드래곤 X2 엘리트 익스트림은 자체 개발한 오라이언(Oryon) CPU 코어를 큰 폭으로 개선해 성능을 높였다. CPU 코어 수도 전 세대 대비 50% 늘어난 최대 18개로 늘려 다중작업시 효율을 강화했다.</p> <p contents-hash="1fc623687dea1be0423c522104a7c18684a91fae658ab82d1852541280e872c4" dmcf-pid="7kD8nqSrjN" dmcf-ptype="general">프라딥 카나파티필라 부사장은 "스냅드래곤 X2 엘리트 익스트림에 탑재된 오라이언 CPU는 3세대에 해당하는 제품으로 처음부터 완전히 새로 설계했다. 전세대 대비 성능과 에너지 효율 면에서 큰 도약을 이뤄냈다"고 평가했다.</p> <p contents-hash="1491eeb6fce4ac18cb910b5c68a8b88b58a464ec84b33581c8c89832bb54dfb9" dmcf-pid="zEw6LBvmka" dmcf-ptype="general"><strong>단일 코어에서 프라임/퍼포먼스 2개 코어로 계층 변경</strong></p> <p contents-hash="2d228e27a100249e8dc50f2d4f9b8f62ad4885e06290894eaf46f510ada9525f" dmcf-pid="qDrPobTsAg" dmcf-ptype="general">전세대인 스냅드래곤 X 엘리트는 오라이온 CPU 코어를 한 종류만 탑재했다. 어떤 상황에서도 같은 성능을 내지만 복잡하지 않은 동작을 수행할 때 전력 소모가 커지는 것이 단점이었다.</p> <figure class="figure_frm origin_fig" contents-hash="9932a11f03ea1f2296fe7fcfca977e2a9a61ff7e67a93c2015cf30acc2b2960b" dmcf-pid="BwmQgKyOjo" dmcf-ptype="figure"> <p class="link_figure"><img alt="스냅드래곤 X2 엘리트 익스트림의 CPU 코어 구성도. (사진=지디넷코리아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230714339nxsj.jpg" data-org-width="640" dmcf-mid="Gsvu4ZkLjC" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230714339nxsj.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 스냅드래곤 X2 엘리트 익스트림의 CPU 코어 구성도. (사진=지디넷코리아) </figcaption> </figure> <p contents-hash="2b3b4064b95e16d083516ede5f6e46dc2757c2336857f3695fabf929df0fa2e9" dmcf-pid="brsxa9WIjL" dmcf-ptype="general">스냅드래곤 X2 엘리트 익스트림은 기본 4.4GHz로 작동하는 코어 6개와 L2 캐시 16MB로 구성된 '프라임 클러스터' 2개, 3.6GHz로 작동하는 코어 6개와 L2 캐시 12MB로 구성된 '퍼포먼스 클러스터' 1개 등 총 3개 클러스터로 작동한다.</p> <figure class="figure_frm origin_fig" contents-hash="242b4f57781d0db4a957bda53bec1a71a253f080d377798a1f6da7b7ebbed239" dmcf-pid="KmOMN2YCon" dmcf-ptype="figure"> <p class="link_figure"><img alt="프라임 클러스터는 최대 성능을 내야 하는 환경에 적합하다. (사진=지디넷코리아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230715606rcdi.jpg" data-org-width="640" dmcf-mid="Hq36LBvmcI" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230715606rcdi.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 프라임 클러스터는 최대 성능을 내야 하는 환경에 적합하다. (사진=지디넷코리아) </figcaption> </figure> <p contents-hash="891a756b971fb22dbd7e842a192773ad95bea91fc05dfd55e597e1605ade0823" dmcf-pid="9sIRjVGhai" dmcf-ptype="general">프라임 클러스터는 최대 5GHz로 작동하며 고성능 작동이 필요한 환경에 적합하다. 반면 퍼포먼스 코어는 성능 극대화가 필요없는 일상적인 작업과 에너지 효율과 저전력 운영 구간에 최적화됐다.</p> <p contents-hash="ad13de17f1314533b2dc66facdfd5b214185f1bd98e56aea9a40cf0637737a35" dmcf-pid="2OCeAfHlAJ" dmcf-ptype="general"><strong>프라임 코어, 조건 분기 예측 성능 향상</strong></p> <p contents-hash="e455dbf9f146cbae2db596a1a480be538cde0c46ccc702f5ebb135c48948ce1c" dmcf-pid="VIhdc4XSkd" dmcf-ptype="general">프라임 코어는 한 클록당 16개 명령어를 동시에 불러오는 구조로 설계됐다. 또 분기 예측 처리 효율을 높이기 위해 두 클록이 필요한 조건 분기 예측기 등이 포함됐다.</p> <p contents-hash="4661203c662af8c6cf21130fca0352a2881ab79bcda5311ec4c3fa51d004f387" dmcf-pid="fvyorxFYge" dmcf-ptype="general">프라딥 카나파티필라 부사장은 "분기 예측에 실패했을 때 이를 다시 예측하는 데 필요한 페널티는 13사이클에 불과하다"고 설명했다.</p> <figure class="figure_frm origin_fig" contents-hash="b675174c2ed34e80794c119a042e73dd7bee5c1cda4027fbb25c37430f3b2573" dmcf-pid="4TWgmM3GgR" dmcf-ptype="figure"> <p class="link_figure"><img alt="프라임 코어는 한 클록당 최대 16개 명령어를 불러온다. (사진=지디넷코리아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230716850qfnr.jpg" data-org-width="640" dmcf-mid="XRqdc4XScO" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230716850qfnr.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 프라임 코어는 한 클록당 최대 16개 명령어를 불러온다. (사진=지디넷코리아) </figcaption> </figure> <p contents-hash="5e805ef2fbf8d713dcbd9a08e920414ab76efdd42adee52ebb93fbda5f5c0cd1" dmcf-pid="8yYasR0HgM" dmcf-ptype="general">정수 연산을 처리하는 실행 유닛은 총 6개이며 64비트 폭으로 설계됐다. 벡터·부동소수점 유닛은 128비트 파이프 4개로 FP32, FP64, BF16, INT 계열 연산을 지원하며, 조건부 벡터 연산 효율을 높였다.</p> <figure class="figure_frm origin_fig" contents-hash="9a0c506339ca5fe62f9e10b829862a6b59d36dc63301add778ca675221a6dc09" dmcf-pid="6WGNOepXAx" dmcf-ptype="figure"> <p class="link_figure"><img alt="메모리 관리 유닛은 가상화와 2단계 주소 전환을 지원한다. (사진=지디넷코리아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230718113waft.jpg" data-org-width="640" dmcf-mid="ZbtfJ7hDNs" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230718113waft.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 메모리 관리 유닛은 가상화와 2단계 주소 전환을 지원한다. (사진=지디넷코리아) </figcaption> </figure> <p contents-hash="139ee7ffda16293a06356a3616c25cd5d6de44f932dec7e1ebec9ebe7ef0c0bf" dmcf-pid="PYHjIdUZgQ" dmcf-ptype="general">메모리 관리 유닛은 가상화와 2단계 주소 전환을 지원하며 6웨이 데이터케시 96KB, 로드/스토어 유닛 4개로 빠른 메모리 접근과 캐시 일관성을 보장한다.</p> <p contents-hash="127b020e917bd2e249d336a10f7b12186d004b5527b991fce7752657733f95ee" dmcf-pid="QGXACJu5gP" dmcf-ptype="general"><strong>행렬 연산 가속기 '매트릭스 엔진' 내장</strong></p> <p contents-hash="5bd5cef22a655dde40ed1941b71a0b5c40c74e96257bf1143035cc59a476b38a" dmcf-pid="xHZchi71A6" dmcf-ptype="general">프라임 클러스터와 퍼포먼스 클러스터에는 AI 연산에 주로 쓰이는 행렬 연산만 전용 처리하는 매트릭스 엔진이 포함된다.</p> <p contents-hash="728f4f49ad49b995ea7e4e2d6ade6ac6739f9e931a7c0cb1e3ff4588a83a5a94" dmcf-pid="ydiu4ZkLc8" dmcf-ptype="general">프라딥 카나파티필라 부사장은 "매트릭스 엔진은 CPU 기반 머신러닝과 대규모 행렬 연산에서 성능 향상을 제공하며, 일반 벡터 유닛 대비 폭넓은 연산 처리가 가능하다"고 설명했다.</p> <figure class="figure_frm origin_fig" contents-hash="3e303af16b70800830e638654553b1c6f1cc9b7b09eb1688647d08943b0f5788" dmcf-pid="WJn785Eok4" dmcf-ptype="figure"> <p class="link_figure"><img alt="행렬 연산 가속을 위한 매트릭스 엔진이 별도 탑재된다. (사진=지디넷코리아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230719392znzk.jpg" data-org-width="640" dmcf-mid="5wmZzSnQam" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230719392znzk.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 행렬 연산 가속을 위한 매트릭스 엔진이 별도 탑재된다. (사진=지디넷코리아) </figcaption> </figure> <p contents-hash="cea3e86207130af50403b5fae279b0bb2d49d48d1cf7385d7259705599cbd35e" dmcf-pid="YiLz61Dgof" dmcf-ptype="general">스냅드래곤 X2 엘리트 익스트림의 경우 프라임 클러스터 2개, 퍼포먼스 클러스터 1개 등 총 3개가 내장된다. 매트릭스 엔진과 CPU 코어의 작동 클록은 동기화되지 않으며 이를 통해 전력 소모를 최적화할 수 있다.</p> <p contents-hash="34c21bd854ac0eef17aa1352093acf969fa2d91310181dccb517b3599384b24f" dmcf-pid="GnoqPtwagV" dmcf-ptype="general">프라임 클러스터의 매트릭스 엔진은 8×8 배열, 퍼포먼스 클러스터의 매트릭스 엔진은 4×8 배열 행렬 처리가 가능하며 BF16, FP16, FP32, INT32, INT8 등 다양한 데이터 타입을 지원한다.</p> <p contents-hash="538e06b90843f6c6ff2d90443af0156511f16f1a1de69b3a35ddb0f7a6ff2815" dmcf-pid="HLgBQFrNj2" dmcf-ptype="general"><strong>현재까지 발견된 보안 취약점 모두 방어</strong></p> <p contents-hash="0d56203920f1ec41348a369eceb9ff889d2652a6b6a32c375cc6beca193a7e24" dmcf-pid="Xoabx3mjA9" dmcf-ptype="general">프라임 코어는 신뢰영역(트러스트존) 기반 명령어 실행, 포인터 인증(PAC), 스펙터/멜트다운 등 현재까지 발견된 분기 예측이나 메모리 관련 보안 취약점에 모두 대응했다.</p> <figure class="figure_frm origin_fig" contents-hash="61bdf5b39ef69b93d978ff6709fc1ccc5d4db28f24ec1d0614c89916f8d3d33c" dmcf-pid="ZnoqPtwaaK" dmcf-ptype="figure"> <p class="link_figure"><img alt="현재까지 발견된 모든 취약점에 대응했다. (사진=지디넷코리아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230720629plrj.jpg" data-org-width="640" dmcf-mid="19mZzSnQor" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230720629plrj.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 현재까지 발견된 모든 취약점에 대응했다. (사진=지디넷코리아) </figcaption> </figure> <p contents-hash="9dd8a1ab0617a9caa19773f434cfc17b50b13f585e7336772499b0c7e20f5147" dmcf-pid="5LgBQFrNob" dmcf-ptype="general">메모리 주소마다 꼬리표를 달아 데이터 저장 영역과 실행 영역을 분리하는 메모리 태깅도 포함됐다. 암호화에 필요한 난수생성기(RNG)도 각 CPU 클러스터마다 하나씩 추가됐다.</p> <figure class="figure_frm origin_fig" contents-hash="c193365ff095d97a58c377fbbdb96f67bc7aa44ec02306fed57b67789f08de5b" dmcf-pid="1oabx3mjoB" dmcf-ptype="figure"> <p class="link_figure"><img alt="프라임 코어는 1세대 대비 최대 성능을 39% 향상했다. (사진=지디넷코리아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230721882hsiw.jpg" data-org-width="640" dmcf-mid="tH1ESLqFgw" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230721882hsiw.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 프라임 코어는 1세대 대비 최대 성능을 39% 향상했다. (사진=지디넷코리아) </figcaption> </figure> <p contents-hash="13fea7ac9a3f2ce38306cf8725adbb5ebef6818667432d71cb56057a0fdd33f4" dmcf-pid="tgNKM0sAAq" dmcf-ptype="general">프라딥 카나파티필라 부사장은 긱벤치 6.5 자체 테스트 결과를 토대로 "프라임 코어는 1세대에 해당하는 스냅드래곤 X 엘리트 탑재 제품 대비 최대 성능은 39% 늘어났고 같은 성능을 내는 데 필요한 소비 전력은 43% 감소했다"고 설명했다.</p> <p contents-hash="5042bd771464c5f56a0afa3890482bd1695faa236ce57c90c4453c6d2d44bc3c" dmcf-pid="Faj9RpOccz" dmcf-ptype="general"><strong>퍼포먼스 코어, 2W 미만 저전력 작동에 최적화</strong></p> <p contents-hash="a0dbf7c22a8f7d5f28140b08bc28e82eb3ba58cb5c0f3c88afd8953ed8ddbdf9" dmcf-pid="3NA2eUIkj7" dmcf-ptype="general">퍼포먼스 코어는 전력 효율과 성능의 균형을 추구했다. 소모전력이 2W 미만인 저전력 환경에서 프라임 코어 대비 더 나은 에너지 효율을 지녔다.</p> <figure class="figure_frm origin_fig" contents-hash="36fe672e53c1803f78bdb11a9a5e288ea26ffad2253340458f93936777463193" dmcf-pid="0jcVduCEAu" dmcf-ptype="figure"> <p class="link_figure"><img alt="퍼포먼스 코어는 전력 효율과 성능의 균형을 추구했다. (사진=지디넷코리아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230723126kuue.jpg" data-org-width="640" dmcf-mid="FxA2eUIkND" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/19/ZDNetKorea/20251119230723126kuue.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 퍼포먼스 코어는 전력 효율과 성능의 균형을 추구했다. (사진=지디넷코리아) </figcaption> </figure> <p contents-hash="982d7dcac4cb44f0aed0fda41e5d68562491176ef82777f66dc853d6e69c04fd" dmcf-pid="pAkfJ7hDjU" dmcf-ptype="general">기본 구조는 모두 비슷하지만 작동 클록은 3.6GHz, L2 캐시 용량은 12MB로 줄이는 등 다이 사이즈 제약이 있는 환경에 더 효과적이다.</p> <p contents-hash="9920858daf104a2f412fe700d035d09d40c4a62444fe918d7b97cd809c5c914a" dmcf-pid="UcE4izlwcp" dmcf-ptype="general">프라딥 카나파티필라 부사장은 "프라임 코어는 클록당 처리할 수 있는 명령어(IPC)가 많지만 실제 환경에서는 최고 성능이 필요하지 않은 작업은 더 효율적인 코어에서 실행하는 것이 전체 전력·효율 측면에서 유리하다"고 설명했다.</p> <p contents-hash="6141dcea921b8ee18efeac94d00baacea1a0ea75cd73522db689841e1a84868c" dmcf-pid="ukD8nqSro0" dmcf-ptype="general">권봉석 기자(bskwon@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p> 관련자료 이전 현빈♥손예진, 인기상·주연상 부부동반 2관왕..'어쩔수가없다' 최고작품상 (종합) [46회 청룡영화상] 11-19 다음 퀄컴 "아드레노 X2, 가장 크고 빠른 고효율 GPU" 11-19 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.