Phân tích kỹ thuật nhân CPU trên Intel Meteor Lake - E-core và Hybrid Architect

Lư Thế Nghĩa
3/3/2024 5:50Phản hồi: 82
Phân tích kỹ thuật nhân CPU trên Intel Meteor Lake - E-core và Hybrid Architect
Với phần trước chúng ta đã nói về kiến trúc nhân P-core Redwood Cove của Meteor Lake (MTL). Ở phần này, cấu trúc nhân E-core Crestmont cũng như năng lực xử lý của cụm SoC sẽ là chủ điểm.

Phân tích kỹ thuật nhân CPU trên Intel Meteor Lake - Không dành cho Windows 10?

Dù Meteor Lake (MTL) là một chip đa thành phần (SoC), thì sức mạnh CPU vẫn là "linh hồn" của một hệ thống PC. Ở bài viết này, chúng ta sẽ phân tích sâu hơn kiến trúc P-Core Redwood Cove và E-Core Crestmont nằm trên con chip mới nhất của Intel…
tinhte.vn


E-core - Sự hồi sinh của Atom


Nếu là một người quen thuộc với các sản phẩm của Intel, hẳn bạn đã từng nghe qua cái tên Atom. Vâng! Chính nó! Dòng chip mà Intel từng gắn liền với cái tên netbook rình rang một thời. Nhưng không may là giải pháp điện toán chi phí thấp này không thu hút được nhiều người dùng. Chưa kể sự phát triển mạnh mẽ của tablet/phablet trong vài năm sau đó thực sự đã "câu hết view" ra khỏi netbook. Chiếc laptop giá rẻ mà Intel kỳ vọng sẽ phổ biến khắp nơi trở thành một sản phẩm công nghệ bị vùi vào dĩ vãng...

Intel-Atom-N280.jpg
Một trong những sản phẩm Atom của Intel trong quá khứ


Nhưng như thế không có nghĩa Atom đã chết. Hoặc, đúng hơn là Atom đã chết ở dạng sản phẩm đơn lẻ. Giờ đây nó được hồi sinh dưới dạng E-core "tầm gửi" vào một con chip lớn hơn, mang màu sắc big.LITTLE. Đồng thời vai trò của nhân Atom lúc này cũng đã khác trước - nếu netbook ban đầu là một sản phẩm giá rẻ thì nay E-core đóng vai trò của một nhân điện toán tiết kiệm điện. Có nghĩa những con chip Intel Core mang nhân Atom sẽ không hề rẻ nữa mà bù lại, chúng sẽ đỡ tốn điện hơn trong một số trường hợp cần thiết. Trên Alder Lake (ADL) và Raptor Lake (RTL), các nhân Atom này có tên gọi Gracemont. Còn trên MTL là Crestmont.

Crestmont - Cải tiến 'nhẹ' từ Gracemont?


Câu chuyện về Crestmont, một lần nữa, cũng như Redwood Cove, Intel hoàn toàn không nói gì nhiều về nó. Và tương tự khi so sánh diagram của Crestmont với Gracemont, sự khác biệt là rất nhỏ. Nên, lại một lần nữa, có thể xem Crestmont là refresh của Gracemont cũng được. Nên phần lớn những gì mình nói ở đây sẽ là của Gracemont.

E-Core-performance.jpg
So sánh hiệu năng Gracemont và Skylake

Gracemont tại thời điểm ra mắt (trên ADL) được mô tả là một nhân "hiệu quả cao" (Efficient, không phải Low-power). Trong đó khi chạy đơn luồng (1C1T) thì 1 nhân Gracemont có hiệu năng cao hơn 40% 1 nhân Skylake ở cùng mức tiêu thụ điện; còn khi hiệu năng ngang nhau thì Gracemont dùng ít điện hơn 40%. Khi xử lý đa luồng thì các con số lần lượt là hiệu năng hơn 80% hoặc ít điện hơn 80%, nhưng bạn cần chú ý ở chỗ 4 nhân Gracemont so với 2 nhân Skylake (có bật SMT). Điều này cho thấy E-core không có năng lực xử lý đa luồng, có lẽ vì bản chất "hiệu quả" là trên hết nên các thành phần silicon "thừa" bị cắt bỏ hoàn toàn (để có năng lực SMT cần một kiến trúc xử lý khác, chúng ta sẽ tìm hiểu sau). Nó cũng nói lên rằng các nhân E-core này chạy đơn luồng sẽ tốt hơn đa luồng (kể cả khi có nhiều E-core).

Gracemont 00.jpg
Gracemont-Revised.jpg
Tổng quan và sơ đồ khối nhân E-core Gracemont

Front-end E-core

Quảng cáo


Mặc dù cũng có "gốc gác" Atom, nhưng E-core trên ADL không phải là quá "yếu nhược" (ít nhất khi so sánh hiệu năng đơn luồng với Skylake). Điều này có được một phần nhờ sự thay đổi lớn ở khu vực front-end. Thay vì chỉ dùng một decoder 3-wide như các phiên bản cũ thì trên Gracemont sẽ có tới 2 decoder 3-wide. Do đó, dung lượng I-Cache của Gracemont cũng phải tăng lên 64 KB (thế hệ trước, Tremont, là 32 KB) để đáp ứng được nhu cầu của 2 decoder cùng lúc. Cần chú ý thêm là Gracemont không có µOP Cache như P-core, thay vào đó là một bộ phận lưu lại lịch sử các lần decode trước đó. Cách làm này giúp tiết kiệm silicon nhưng bù lại, sẽ không hiệu quả bằng một bộ cache thực sự vì các tập lệnh khi được yêu cầu vẫn phải lôi ra từ I-Cache.

Gracemont 01.jpg
Front-end của Gracemont
Gracemont 02.jpg
Out of Order Engine của Gracemont

Việc không có µOP Cache trên Gracemont đã được Intel nhận thức rõ nên tới Crestmont, công ty này chịu khó "trích thêm" silicon để bổ sung thêm thành phần tương đối cần thiết này nếu muốn có hiệu năng cao hơn trên front-end.

Crestmont frontend.jpg
Front-end và OoO Engine của Crestmont

Quảng cáo


Tương tự trên P-core, trước khi các tập lệnh được xử lý thực sự, chúng sẽ đi qua Out of Order (OoO) Engine để được sắp xếp lại thứ tự ưu tiên. Một điểm cần lưu ý là OoO trên Gracemont là 5-wide, còn Crestmont là 6-wide. Có nghĩa trên lý thuyết E-core ADL/RTL cho hiệu suất 5 IPC (hoặc vi lệnh) còn E-core MTL là 6 IPC. Tuy nhiên vì là E-core nên con số IPC này không có nhiều ý nghĩa như trên P-core.

Execution E-core


Phải thừa nhận là mình hơi "sảng hồn" khi nhìn thấy số pipeline xử lý trên Gracemont - 17 pipeline! Trong khi Tremont chỉ có 8 pipeline còn Golden Cove là 12 pipeline. Có thể hình dung vì Gracemont gấp đôi kích thước front-end lên nên nó dẫn tới việc execution cũng phải mở rộng tương ứng. Nhưng ở đây chúng ta thấy có rất nhiều thành phần trùng lặp, trong đó có một số thành phần không được sử dụng thường xuyên liên tục. Chi tiết này cho thấy nhân Gracemont là một thiết kế chưa được tối ưu. Và quả vậy nếu nhìn sang Crestmont, bạn sẽ thấy có đến 10/17 pipeline bị gộp chung lại, giảm con số tổng còn 12 pipeline! Hay nói cách khác thì Crestmont là phiên bản tốt hơn của Gracemont.

Gracemont 03.jpg
Execution của Gracemont tới 17 pipeline!

Những thành phần còn lại của Gracemont và Crestmont nhìn chung giống nhau. Bên INT có 4 ALU (2 trong đó có khả năng xử lý MUL/DIV), 4 AGU, 2 cổng Load, 2 cổng Store. Bên FPU tương tự với 3 ALU (2 trong đó có thêm AES/FMUL/ADD; 1 có thêm SHA/IMUL/FDIV), riêng Crestmont bổ sung thêm chức năng SHUFFLE cho tất cả.

Back-end E-core


Một trong các lý do mà E-core được gọi là nhân tiết kiệm điện hay hiệu suất cao, là vì dung lượng cache của nó rất nhỏ. Mặc cho số lượng đơn vị execution hay front-end nhiều là thế, nhưng thực tế chúng không chiếm quá nhiều silicon bằng cache (chung lý do tại sao P-core có µOP Cache còn E-core thì không). Một nhân xử lý thông thường bên AMD hoặc P-core bên Intel vẫn có bộ đệm L2 riêng. Nhưng E-core thì không có "hồng phúc" đó. Mỗi nhân E-core chỉ được "cấp" 32 KB Data Cache. Khi Cache này đầy thì chúng phải "push" tiếp dữ liệu xuống L2 Cache. Vấn đề ở chỗ L2 Cache này được dùng chung cho 4 nhân E-core cùng lúc! Hiện tượng này giống như nhà bạn với các nhà hàng xóm có chung một cái sân/con hẻm để ra vào. Chỉ cần một nhà mang xe hơi tới đậu là những nhà còn lại... tịt!

Gracemont 04.jpg
Back-end của Gracemont
Crestmont exe-backend.jpg
Execution và back-end của Crestmont "gọn gàng" hơn nhiều

Ở thế hệ Gracemont đầu tiên (ADL), dung lượng L2 Cache là 2 MB. Sang RTL thì lên được 4 MB. Intel duy trì tiếp 4 MB này trên Crestmont (MTL). Đáng nói ở chỗ 1 nhân P-core RTL/MLT có riêng L2 Cache tới 2 MB, dùng hết dung lượng này chúng mới phải chuyển qua L3 Cache (xài chung) bên dưới. Vì vậy không khó hiểu tại sao front-end Gracemont/Crestmont có năng lực 5/6 IPC nhưng hiệu năng cực thấp so với P-core. Áp dụng vô đời sống thực tế cũng tương tự - bất kể bạn là đầu bếp nấu ăn ngon thế nào mà mặt bằng quán xá của bạn chật hẹp thì cũng khó phục vụ được nhiều khách (không tính vụ take-away).

Nhìn về tương lai mà như sông rộng đường dài


Vậy là chúng ta đã điểm qua 2 thành phần chính trong các dòng sản phẩm mới (và mới nhất) của Intel. Về lý thuyết mà nói, hướng đi Hybrid Architect của Intel không có gì sai khi bên ARM đã áp dụng mô hình big.LITTLE từ rất lâu trước đó. Nhưng thực tế cho thấy không phải cái gì người khác làm thì mình cũng nên làm như họ (ít nhất là tới thời điểm này).

Thread Director Meteor Lake.jpg
Mô hình Thread Director của Meteor Lake khác hẳn Alder Lake, Raptor Lake

Vấn đề trước tiên với Hybrid Architect nói riêng và phần cứng nói chung là các hệ điều hành và phần mềm thường không "hiểu" kịp tính năng mới của phần cứng. Thế nên trang danh sách các CPU chính thức được hỗ trợ của Intel trên Windows 10 không có các đại diện Core đời 12 (Alder Lake) và Core đời 13 (Raptor Lake). Thậm chí ngay cả trang Windows 11 cũng chưa có tên các model Core đời 14 (Raptor Lake Refresh) mobile - ai đó ở Microsoft cập nhật lại giùm đi?

Tiếp tục vấn đề "kép" là sự thay đổi mô hình Thread Director từ ADL lên MTL. Trên ADL/RTL bạn vẫn có thể tắt E-core đi nếu không thích nhưng không thể làm được điều đó với MTL. Vì lẽ nào đó tuy có sự thay đổi cơ bản trong cách điều phối hoạt động của toàn con chip nhưng các bản BIOS đầu tiên cho MTL dường như chưa cập nhật thông tin này. Những bài review đầu tiên về MTL hồi năm ngoái đều cho thấy hiệu năng CPU có phần thua kém cả RTL (trên lý thuyết nếu không nhanh hơn thì cũng phải bằng). Song khi một số trang cập nhật lại BIOS mới nhất thì mọi thứ đã tốt hơn. Vì thế nếu có ý định mua một chiếc laptop Core Ultra thì bạn cần chú ý điều này.

Intel Hybrid Arch.jpg
Sẽ mất thời gian để các hệ điều hành và ứng dụng "hiểu" được phần cứng mới

Dĩ nhiên về mặt kỹ thuật thì dần dần phần mềm cũng sẽ "hiểu" được phần cứng thôi, cái cần là thời gian. Câu hỏi đặt ra là PC có thực sự cần tới Hybrid Architect hay big.LITTLE? Và định hướng lâu dài của Intel với Hybrid Architect là gì?

Thực tế là từ khi ra mắt ADL đến nay, đã 3 thế hệ chip PC nhưng trên server chúng ta không thấy sự hiện diện của Hybrid Architect. Cũng có thể "đổ thừa" chuyện này cho việc xáo trộn tầng lớp lãnh đạo của Intel trong vài năm qua (Intel không có CEO suốt vài năm liên tục). Nhưng cả khi kế hoạch sản xuất chip server được nối lại thì công ty này cũng chia ra 2 dòng sản phẩm riêng biệt là Rapids (P-core) và Forest (E-core). Nó cho thấy việc có 2 kiến trúc khác nhau trên server là một ý tưởng... tồi!

Vì trên server đặc biệt với các dịch vụ cloud, cho thuê máy ảo... bạn sẽ không được "rờ" vô từng nhân vật lý và chỉ dùng nhân "ảo". Tuy là "máy ảo" nhưng sức mạnh dĩ nhiên sẽ lệ thuộc vào nhân "thật". Vấn đề sẽ ra sao nếu datacenter có 3000 nhân E-core và 1500 nhân P-core? Việc "thuê" server của bạn sẽ xảy ra thế nào? Thật khó trả lời.

intel-server-roadmap.jpg
Kế hoạch sản xuất chip server của Intel không có Hybrid Architect

Tuy trong kế hoạch sản xuất của Intel, Hybrid Architect sẽ tiếp tục tồn tại cho ít nhất thêm 2 thế hệ chip nữa (Arrow Lake và Lunar Lake), và kèm theo là phần mềm sẽ cần tiếp tục "hiểu" để hỗ trợ chúng tốt hơn. Nhưng sau đó thế nào thì... tương lai như sông rộng đường dài, còn phải chờ coi Intel sẽ làm gì và cả những đối tác phần mềm hay xu hướng ra sao.
82 bình luận
Chia sẻ

Xu hướng

Kiến trúc hybrid chỉ phù hợp cho thiết bị di động hoàn toàn không cần hiệu năng cao, khi mà thỉnh thoảng cần tới năng lực mạnh, còn lại hầu hết thời gian là làm những việc nhẹ hoặc nằm chờ.
Với những thiết bị nằm im một chỗ và được cấp nguồn liên tục (PC thùng, server, các máy chuyên dụng,...) thì kiến trúc kiểu hybrid này hoàn toàn thừa thãi, làm cồng kềnh chương trình, lag giật và lỗi sai không cần thiết trong hệ thống do phần mềm phải đi "mò" phần cứng phù hợp để mà chạy.
@bomduc server cần nhiều nhân mà phải mạnh. chứ ko mấy con epyc to vật vả bán cho ai? bộ tưởng server mấy mấy nhân atom của đt chạy ko lết nổi mà server chạy cho khách chửi ah? nhiều nhân rác e core làm vps có mà lết.
@ragefighter Ông nói chuyện cố chấp 😆) máy server cần dùng cho hàng nghìn người truy cập. Cho vài con nhân khỏe vào thế những người còn lại ngồi nhìn ah =))))))
@bomduc đúng gà. nhân khỏe mới đáp ứng nhu cầu truy cập lớn người dùng. nhân rác vào để tiết kiệm điện yếu atom ah? trước giờ các nhân inteo atom toàn nhân mạnh cho server mà nó lết vậy rồi. nhét nhân rác lết cỡ nào? thím đừng nhầm lẫn thấy mấy con epyc hay intel nhiều nhân trước giờ thấy nhiều tưởng nhân rác e core ah? nó toàn nhân mạnh đấy thím.
Atom là cú lừa của intel dành cho Ultrabook, cả chục năm trời k có nổi thiết kế fanless cho đến khi Apple định nghĩa lại bằng dòng chip M😃 kết cục thì h phải lân la nhờ vả cái đứa apple đỡ đầu đúc giùm mấy con chip😃

Ông win thì hô hào windows arm hay lắm nhưng cũng bỏ ngang do thiếu apps. Cũng cố gắng quảng bá cho dòng sf rồi cũng lây lất😃

Cái kết là phần cứng hay mềm gì cũng phải vào tay Apple ms nên thân. 2 con gà tây thì to đấy, nhưng gà vẫn là gà, có dung hợp thì cũng chẳng bao h thành đại bàng dc😃
@vanthoan Thế k xài quan tâm làm j mà gáy khét, con chip làm cho có cửa j mà so j vs mb pro, so vs air m1 ra 3 năm trc còn phế cả khía cạnh cpu lẫn gpu. Mấy con core i7 dòng U cũng phế so vs dòng M, h lấy atom hay pen ra làm trò cười ah. X86 nào cái j cũng đập cpu, mới từ sao hoả xuống ah, thôi vậy chắc nvidia vốn hoá k lên 2k tỉ đâu nhỉ. Cái máy chạy cpu vs vga onboard dc rồi, cần quái j gpu rời mà bảo là đập vào cpu. Hài. Thời buổi này cái j cũng đập vào gpu ms đúng nhé, tỉnh lại đi.
vanthoan
TÍCH CỰC
5 tháng
@MoonBreathing Cái dở của Intel là làm CPU Atom mà quên không làm các accelerator, làm media mà chạy trên CPU thì chậm và bú điện là đúng rồi, nhưng mà người dùng cơ bản thì mấy cái đó cũng chẳng cần, như con Pentium N5030 xài tẹt, tôi chẳng thấy vấn đề gì cả, pin vẫn siêu trâu. Tác vụ nặng thì có con desktop nó gánh rồi, lâu lâu chạy full load vài tháng cũng ổn, chứ ngon chip M1 mà chạy full load vài ngày chắc banh xác rồi 😃
@vanthoan Nhu cầu của bạn thì mình k biết nhé. Nhưng nhu cầu chung hiện tại ngoài web mail là phải có thì còn thêm chỉnh sửa hình ảnh, làm clip nữa. Full load của bạn là ntn, tôi chạy mỗi ngày xuất raw chỉnh phim 60K đâu thấy vấn đề j đâu nhỉ. Và có rất nh ng dùng như thế chả sao hết, còn pin trâu ah. 1 ngày làm việc k cần sạc nhé bạn. Nên những cái bạn đang làm quá bình thường và thậm chí ng ta còn làm hơn x mấy lần nữa. 😃
vanthoan
TÍCH CỰC
5 tháng
@MoonBreathing Thông thường tôi có 1 vài vấn đề cần nghiên cứu, tôi đem vào máy để chạy, nó full load 100% CPU và 100% GPU đúng nghĩa đen, liên tục 24/7 như vậy trong vài ngày, thậm chí vài tháng tùy độ phức tạp của bài toán. Máy chạy full load nó nhanh tã kinh lắm vì tất cả các linh kiện đều rất nóng, 80 90 độ liên tục ngày đêm. Mấy cái chỉnh phim kia thì nhanh, chỉ full load chút xíu là xong, nhiều khi CPU chưa kịp nóng nên chạy laptop bình thường, không vấn đề.
Với PC thì kiến trúc nhân to nhân nhỏ ko để làm gì, nhất là trên máy trạm server các kiểu. Nhưng trên thiết bị di động chạy pin thì rất tốt rất phù hợp
LYSM
TÍCH CỰC
5 tháng
Đợi AMDanh lên bắn phá 😁
@LYSM AMDanh đã khai hỏa, nhưng toàn mấy quả pháo 12 li cùi


Chê e cores chắc vì P core mạnh quá, 8 nhân P đã 24k rồi
Thực thế, 8E đã ngang ngửa con 1700x trong khi có ít hơn 8 luồng, xung cao hơn 300mhz
E core mf có hyperthreadng chắc vả mấy con Zen(+) ko trượt phát nào
@Nitro 5 2021 đaqng đờ bạn tui nó xài intel. mua tản mắc maw cpu cùi hiệu năng kém.
@Nitro 5 2021 nó đâu có ăn điện nhiều và ko nóng nên nó vẫn duy trí hiệu năng thôi. intel 5ghz hay 6ghz vài giây để benchmark xài nặng lag tung đít.
@ragefighter
(3:23)
Mấy con tản đểu đi chê lag, có mà ông dìm thì có, chứ một khi đã yếu thì AMD cũng giật bay lắc chứ ko vừa
Nóng thì ai mà chả nóng, nhìn con 7945hx của bạn này, xung còn bao nhiêu sau khi throttling?
trutan
TÍCH CỰC
5 tháng
Vào chỉ để xem mấy bảng biểu thôi, đọc chữ thì lười lắm.
+10********** cho bảng biểu
AMD Danh vào đi bạn 😃
Kiến trúc hybrid này của Intel rất hay và cảm giác rằng nó sẽ là tương lai của laptop. Tuy nhiên hiện tại dòng Core Ultra đang gây thất vọng khá lớn khi nhiệt độ cao hơn khá nhiều so với AMD, trong khi hiệu năng lại thấp hơn.
Hóng 14th mini pc
Screenshot-20240303-211613.jpg
@demonntl 14th minipc thì đắt lắm bác.
Không biết hiệu năng thực tế khi làm media, render video đã hơn dc M1 chưa
Cười vô mặt
Dark Man
ĐẠI BÀNG
5 tháng
@kehuydietngo E-core mục đích để cho máy vẫn hoạt động mà bớt hao điện thôi, render gì đám đấy =))))))
@nguyễn chí danh@3 Chuẫn:
bí sáng tạu: nên lừa bọn người dùng bằng trò tiết kiệm điện:
cpu ngày càng nóng càng đốt điện: mà vẫn tiết kiệm điện: tau bắt đầu muốn phang thằng Pr sp cho bọn làm chíp:
thứ nữa là trên phương diện vận hành máy: càng nhiều nhân thì càng tốt: mà là tương đồng: chứ ko phãi là tắt con này chạy con kia:
mobile thì ỗn tý: những desk thì ếu ỗn tý nào
con chip intel atom đầu tiên đc xài là trên con zenphone 5 của mình. chiêc phone đầu tiên bỏ tiền mua. 😆))
Xịn
Yêu quá
cái quan trọng bao giờ người dùng k cần phải tắt e-core đi cho máy ổn định thì hãng chém
@congtusitinh1996 Người dùng không được tắt nữa, thế là hết chuyện hehehehe
Nên nói thêm về latency cao khủng khiếp khi chuyển tác vụ nữa, mạnh hơn nhưng lag hơn thế hệ cũ chứ không cần phải so với đối thủ
Chỉ 1 từ là cứ đeo x86 thì sẽ luôn nóng
Thế giới cần bộ vi xử lý kiến trúc lai arm và x86
@DAVIDHUY08 Ếu có chiện đó nhé bạn:
Chủ đề nào có itel là có Danh, mà tội cái làm video chia sẻ không dám lộ mặt
Intel làm mầu vs microshop: đễ chơi bẫn and:
chứ lợi thì ít: mà hại thì nhiều:
mà tau thì xài intel + nvidia nên cũng kệ:
Hhhhhhhh
QH3006
ĐẠI BÀNG
5 tháng
Nói chung chỉ mong Intel cố làm sao tối ưu cả phần mềm lẫn phần cứng tốt hết cõ là được, chứ cứ đà này ăn điện nhiều mà hiệu năng vẫn thấp thì chả mấy chốc mất hết cả mảng client lẫn workstation.

Xu hướng

Bài mới










  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019