Với phần trước chúng ta đã nói về kiến trúc nhân P-core Redwood Cove của Meteor Lake (MTL). Ở phần này, cấu trúc nhân E-core Crestmont cũng như năng lực xử lý của cụm SoC sẽ là chủ điểm.
Nếu là một người quen thuộc với các sản phẩm của Intel, hẳn bạn đã từng nghe qua cái tên Atom. Vâng! Chính nó! Dòng chip mà Intel từng gắn liền với cái tên netbook rình rang một thời. Nhưng không may là giải pháp điện toán chi phí thấp này không thu hút được nhiều người dùng. Chưa kể sự phát triển mạnh mẽ của tablet/phablet trong vài năm sau đó thực sự đã "câu hết view" ra khỏi netbook. Chiếc laptop giá rẻ mà Intel kỳ vọng sẽ phổ biến khắp nơi trở thành một sản phẩm công nghệ bị vùi vào dĩ vãng...
Một trong những sản phẩm Atom của Intel trong quá khứ
![](https://imgproxy7.tinhte.vn/q0IRAK601TKVT3HkulZCHBHLlyUParyGi1y2X8T9Sh0/rs:fill:480:300:0/plain/https://photo2.tinhte.vn/data/attachment-files/2024/02/8271437_cover-Intel-Meteor-Lake-deeptalk.jpg)
Phân tích kỹ thuật nhân CPU trên Intel Meteor Lake - Không dành cho Windows 10?
Dù Meteor Lake (MTL) là một chip đa thành phần (SoC), thì sức mạnh CPU vẫn là "linh hồn" của một hệ thống PC. Ở bài viết này, chúng ta sẽ phân tích sâu hơn kiến trúc P-Core Redwood Cove và E-Core Crestmont nằm trên con chip mới nhất của Intel…
tinhte.vn
E-core - Sự hồi sinh của Atom
Nếu là một người quen thuộc với các sản phẩm của Intel, hẳn bạn đã từng nghe qua cái tên Atom. Vâng! Chính nó! Dòng chip mà Intel từng gắn liền với cái tên netbook rình rang một thời. Nhưng không may là giải pháp điện toán chi phí thấp này không thu hút được nhiều người dùng. Chưa kể sự phát triển mạnh mẽ của tablet/phablet trong vài năm sau đó thực sự đã "câu hết view" ra khỏi netbook. Chiếc laptop giá rẻ mà Intel kỳ vọng sẽ phổ biến khắp nơi trở thành một sản phẩm công nghệ bị vùi vào dĩ vãng...
![Intel-Atom-N280.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276593_Intel-Atom-N280.jpg)
Một trong những sản phẩm Atom của Intel trong quá khứ
Nhưng như thế không có nghĩa Atom đã chết. Hoặc, đúng hơn là Atom đã chết ở dạng sản phẩm đơn lẻ. Giờ đây nó được hồi sinh dưới dạng E-core "tầm gửi" vào một con chip lớn hơn, mang màu sắc big.LITTLE. Đồng thời vai trò của nhân Atom lúc này cũng đã khác trước - nếu netbook ban đầu là một sản phẩm giá rẻ thì nay E-core đóng vai trò của một nhân điện toán tiết kiệm điện. Có nghĩa những con chip Intel Core mang nhân Atom sẽ không hề rẻ nữa mà bù lại, chúng sẽ đỡ tốn điện hơn trong một số trường hợp cần thiết. Trên Alder Lake (ADL) và Raptor Lake (RTL), các nhân Atom này có tên gọi Gracemont. Còn trên MTL là Crestmont.
Crestmont - Cải tiến 'nhẹ' từ Gracemont?
Câu chuyện về Crestmont, một lần nữa, cũng như Redwood Cove, Intel hoàn toàn không nói gì nhiều về nó. Và tương tự khi so sánh diagram của Crestmont với Gracemont, sự khác biệt là rất nhỏ. Nên, lại một lần nữa, có thể xem Crestmont là refresh của Gracemont cũng được. Nên phần lớn những gì mình nói ở đây sẽ là của Gracemont.
![E-Core-performance.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276594_E-Core-performance.jpg)
So sánh hiệu năng Gracemont và Skylake
Gracemont tại thời điểm ra mắt (trên ADL) được mô tả là một nhân "hiệu quả cao" (Efficient, không phải Low-power). Trong đó khi chạy đơn luồng (1C1T) thì 1 nhân Gracemont có hiệu năng cao hơn 40% 1 nhân Skylake ở cùng mức tiêu thụ điện; còn khi hiệu năng ngang nhau thì Gracemont dùng ít điện hơn 40%. Khi xử lý đa luồng thì các con số lần lượt là hiệu năng hơn 80% hoặc ít điện hơn 80%, nhưng bạn cần chú ý ở chỗ 4 nhân Gracemont so với 2 nhân Skylake (có bật SMT). Điều này cho thấy E-core không có năng lực xử lý đa luồng, có lẽ vì bản chất "hiệu quả" là trên hết nên các thành phần silicon "thừa" bị cắt bỏ hoàn toàn (để có năng lực SMT cần một kiến trúc xử lý khác, chúng ta sẽ tìm hiểu sau). Nó cũng nói lên rằng các nhân E-core này chạy đơn luồng sẽ tốt hơn đa luồng (kể cả khi có nhiều E-core).
![Gracemont 00.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276595_Gracemont_00.jpg)
![Gracemont-Revised.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276596_Gracemont-Revised.jpg)
Tổng quan và sơ đồ khối nhân E-core Gracemont
Front-end E-core
Quảng cáo
Mặc dù cũng có "gốc gác" Atom, nhưng E-core trên ADL không phải là quá "yếu nhược" (ít nhất khi so sánh hiệu năng đơn luồng với Skylake). Điều này có được một phần nhờ sự thay đổi lớn ở khu vực front-end. Thay vì chỉ dùng một decoder 3-wide như các phiên bản cũ thì trên Gracemont sẽ có tới 2 decoder 3-wide. Do đó, dung lượng I-Cache của Gracemont cũng phải tăng lên 64 KB (thế hệ trước, Tremont, là 32 KB) để đáp ứng được nhu cầu của 2 decoder cùng lúc. Cần chú ý thêm là Gracemont không có µOP Cache như P-core, thay vào đó là một bộ phận lưu lại lịch sử các lần decode trước đó. Cách làm này giúp tiết kiệm silicon nhưng bù lại, sẽ không hiệu quả bằng một bộ cache thực sự vì các tập lệnh khi được yêu cầu vẫn phải lôi ra từ I-Cache.
![Gracemont 01.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276598_Gracemont_01.jpg)
Front-end của Gracemont
![Gracemont 02.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276599_Gracemont_02.jpg)
Out of Order Engine của Gracemont
Việc không có µOP Cache trên Gracemont đã được Intel nhận thức rõ nên tới Crestmont, công ty này chịu khó "trích thêm" silicon để bổ sung thêm thành phần tương đối cần thiết này nếu muốn có hiệu năng cao hơn trên front-end.
![Crestmont frontend.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276601_Crestmont_frontend.jpg)
Front-end và OoO Engine của Crestmont
Quảng cáo
Tương tự trên P-core, trước khi các tập lệnh được xử lý thực sự, chúng sẽ đi qua Out of Order (OoO) Engine để được sắp xếp lại thứ tự ưu tiên. Một điểm cần lưu ý là OoO trên Gracemont là 5-wide, còn Crestmont là 6-wide. Có nghĩa trên lý thuyết E-core ADL/RTL cho hiệu suất 5 IPC (hoặc vi lệnh) còn E-core MTL là 6 IPC. Tuy nhiên vì là E-core nên con số IPC này không có nhiều ý nghĩa như trên P-core.
Execution E-core
Phải thừa nhận là mình hơi "sảng hồn" khi nhìn thấy số pipeline xử lý trên Gracemont - 17 pipeline! Trong khi Tremont chỉ có 8 pipeline còn Golden Cove là 12 pipeline. Có thể hình dung vì Gracemont gấp đôi kích thước front-end lên nên nó dẫn tới việc execution cũng phải mở rộng tương ứng. Nhưng ở đây chúng ta thấy có rất nhiều thành phần trùng lặp, trong đó có một số thành phần không được sử dụng thường xuyên liên tục. Chi tiết này cho thấy nhân Gracemont là một thiết kế chưa được tối ưu. Và quả vậy nếu nhìn sang Crestmont, bạn sẽ thấy có đến 10/17 pipeline bị gộp chung lại, giảm con số tổng còn 12 pipeline! Hay nói cách khác thì Crestmont là phiên bản tốt hơn của Gracemont.
![Gracemont 03.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276603_Gracemont_03.jpg)
Execution của Gracemont tới 17 pipeline!
Những thành phần còn lại của Gracemont và Crestmont nhìn chung giống nhau. Bên INT có 4 ALU (2 trong đó có khả năng xử lý MUL/DIV), 4 AGU, 2 cổng Load, 2 cổng Store. Bên FPU tương tự với 3 ALU (2 trong đó có thêm AES/FMUL/ADD; 1 có thêm SHA/IMUL/FDIV), riêng Crestmont bổ sung thêm chức năng SHUFFLE cho tất cả.
Back-end E-core
Một trong các lý do mà E-core được gọi là nhân tiết kiệm điện hay hiệu suất cao, là vì dung lượng cache của nó rất nhỏ. Mặc cho số lượng đơn vị execution hay front-end nhiều là thế, nhưng thực tế chúng không chiếm quá nhiều silicon bằng cache (chung lý do tại sao P-core có µOP Cache còn E-core thì không). Một nhân xử lý thông thường bên AMD hoặc P-core bên Intel vẫn có bộ đệm L2 riêng. Nhưng E-core thì không có "hồng phúc" đó. Mỗi nhân E-core chỉ được "cấp" 32 KB Data Cache. Khi Cache này đầy thì chúng phải "push" tiếp dữ liệu xuống L2 Cache. Vấn đề ở chỗ L2 Cache này được dùng chung cho 4 nhân E-core cùng lúc! Hiện tượng này giống như nhà bạn với các nhà hàng xóm có chung một cái sân/con hẻm để ra vào. Chỉ cần một nhà mang xe hơi tới đậu là những nhà còn lại... tịt!
![Gracemont 04.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276604_Gracemont_04.jpg)
Back-end của Gracemont
![Crestmont exe-backend.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276605_Crestmont_exe-backend.jpg)
Execution và back-end của Crestmont "gọn gàng" hơn nhiều
Ở thế hệ Gracemont đầu tiên (ADL), dung lượng L2 Cache là 2 MB. Sang RTL thì lên được 4 MB. Intel duy trì tiếp 4 MB này trên Crestmont (MTL). Đáng nói ở chỗ 1 nhân P-core RTL/MLT có riêng L2 Cache tới 2 MB, dùng hết dung lượng này chúng mới phải chuyển qua L3 Cache (xài chung) bên dưới. Vì vậy không khó hiểu tại sao front-end Gracemont/Crestmont có năng lực 5/6 IPC nhưng hiệu năng cực thấp so với P-core. Áp dụng vô đời sống thực tế cũng tương tự - bất kể bạn là đầu bếp nấu ăn ngon thế nào mà mặt bằng quán xá của bạn chật hẹp thì cũng khó phục vụ được nhiều khách (không tính vụ take-away).
Nhìn về tương lai mà như sông rộng đường dài
Vậy là chúng ta đã điểm qua 2 thành phần chính trong các dòng sản phẩm mới (và mới nhất) của Intel. Về lý thuyết mà nói, hướng đi Hybrid Architect của Intel không có gì sai khi bên ARM đã áp dụng mô hình big.LITTLE từ rất lâu trước đó. Nhưng thực tế cho thấy không phải cái gì người khác làm thì mình cũng nên làm như họ (ít nhất là tới thời điểm này).
![Thread Director Meteor Lake.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276606_Thread_Director_Meteor_Lake.jpg)
Mô hình Thread Director của Meteor Lake khác hẳn Alder Lake, Raptor Lake
Vấn đề trước tiên với Hybrid Architect nói riêng và phần cứng nói chung là các hệ điều hành và phần mềm thường không "hiểu" kịp tính năng mới của phần cứng. Thế nên trang danh sách các CPU chính thức được hỗ trợ của Intel trên Windows 10 không có các đại diện Core đời 12 (Alder Lake) và Core đời 13 (Raptor Lake). Thậm chí ngay cả trang Windows 11 cũng chưa có tên các model Core đời 14 (Raptor Lake Refresh) mobile - ai đó ở Microsoft cập nhật lại giùm đi?
Tiếp tục vấn đề "kép" là sự thay đổi mô hình Thread Director từ ADL lên MTL. Trên ADL/RTL bạn vẫn có thể tắt E-core đi nếu không thích nhưng không thể làm được điều đó với MTL. Vì lẽ nào đó tuy có sự thay đổi cơ bản trong cách điều phối hoạt động của toàn con chip nhưng các bản BIOS đầu tiên cho MTL dường như chưa cập nhật thông tin này. Những bài review đầu tiên về MTL hồi năm ngoái đều cho thấy hiệu năng CPU có phần thua kém cả RTL (trên lý thuyết nếu không nhanh hơn thì cũng phải bằng). Song khi một số trang cập nhật lại BIOS mới nhất thì mọi thứ đã tốt hơn. Vì thế nếu có ý định mua một chiếc laptop Core Ultra thì bạn cần chú ý điều này.
![Intel Hybrid Arch.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276607_Intel_Hybrid_Arch.jpg)
Sẽ mất thời gian để các hệ điều hành và ứng dụng "hiểu" được phần cứng mới
Dĩ nhiên về mặt kỹ thuật thì dần dần phần mềm cũng sẽ "hiểu" được phần cứng thôi, cái cần là thời gian. Câu hỏi đặt ra là PC có thực sự cần tới Hybrid Architect hay big.LITTLE? Và định hướng lâu dài của Intel với Hybrid Architect là gì?
Thực tế là từ khi ra mắt ADL đến nay, đã 3 thế hệ chip PC nhưng trên server chúng ta không thấy sự hiện diện của Hybrid Architect. Cũng có thể "đổ thừa" chuyện này cho việc xáo trộn tầng lớp lãnh đạo của Intel trong vài năm qua (Intel không có CEO suốt vài năm liên tục). Nhưng cả khi kế hoạch sản xuất chip server được nối lại thì công ty này cũng chia ra 2 dòng sản phẩm riêng biệt là Rapids (P-core) và Forest (E-core). Nó cho thấy việc có 2 kiến trúc khác nhau trên server là một ý tưởng... tồi!
Vì trên server đặc biệt với các dịch vụ cloud, cho thuê máy ảo... bạn sẽ không được "rờ" vô từng nhân vật lý và chỉ dùng nhân "ảo". Tuy là "máy ảo" nhưng sức mạnh dĩ nhiên sẽ lệ thuộc vào nhân "thật". Vấn đề sẽ ra sao nếu datacenter có 3000 nhân E-core và 1500 nhân P-core? Việc "thuê" server của bạn sẽ xảy ra thế nào? Thật khó trả lời.
![intel-server-roadmap.jpg](https://photo2.tinhte.vn/data/attachment-files/2024/03/8276608_intel-server-roadmap.jpg)
Kế hoạch sản xuất chip server của Intel không có Hybrid Architect
Tuy trong kế hoạch sản xuất của Intel, Hybrid Architect sẽ tiếp tục tồn tại cho ít nhất thêm 2 thế hệ chip nữa (Arrow Lake và Lunar Lake), và kèm theo là phần mềm sẽ cần tiếp tục "hiểu" để hỗ trợ chúng tốt hơn. Nhưng sau đó thế nào thì... tương lai như sông rộng đường dài, còn phải chờ coi Intel sẽ làm gì và cả những đối tác phần mềm hay xu hướng ra sao.