TTBC23

TTBC23


Công nghệ Chiplet là gì và tầm quan trọng đối với tương lai của vi xử lý

Frozen Cat
7/6/2023 10:29Phản hồi: 60
Công nghệ Chiplet là gì và tầm quan trọng đối với tương lai của vi xử lý
Mặc dầu cách thiết kế kiểu chiplet đã được sử dụng trong nhiều thập niên, nhưng chúng đã được dùng một cách tằn tiện và cho những mục đích rất cụ thể. Giờ đây, chúng lại đang ở vị thế tiên phong của ngành công nghệ, với hàng triệu người trên toàn cầu sử dụng chúng trong máy tính để bàn (PC), máy trạm và máy chủ.
Một công ty hàng đầu trong ngành là AMD gần đây đã tận dụng thiết kế chiplet để giành lại vị trí đi đầu trong đổi mới và rõ ràng là chẳng bao lâu nữa các chiplet sẽ trở thành tiêu chuẩn trong thế giới điện toán. Vì vậy, bài này trình bày một số hiểu biết nhất định về chiplet và lý do chính xác tại sao chúng lại quan trọng đến vậy.

Các chiplet là gì?

Chiplet là những bộ vi xử lý được phân ra thành từng phần, từng khu vực. Thay vì hợp nhất mọi bộ phận thành một con chip duy nhất (được gọi là phương pháp nguyên khối - monolithic), thì các phần cụ thể được sản xuất dưới dạng các con chip riêng biệt. Những con chip riêng lẻ này sau đó được lắp ráp với nhau thành một gói duy nhất bằng cách sử dụng một hệ thống kết nối phức tạp.

Vì vậy, nhìn qua cấu trúc thì chúng giống một khu phức hợp thương mại, với các cửa hàng tập trung lại một chỗ, sắp xếp đều đặn thành từng ô, nên chiplet có thể diễn dịch là chip outlets: các "cửa hàng" chip.
Sự sắp xếp này cho phép các bộ phận có thể hưởng lợi từ các phương pháp chế tạo mới nhất, để chúng có thể thu nhỏ được kích thước, nâng cao tính hiệu quả của tiến trình và cho phép chúng ăn khớp với nhiều bộ phận hơn. Cách thức hưởng lợi dựa trên nguyên tắc là chỉ cần một số bộ phận tận dụng công nghệ mới nhất, chứ không nhất thiết là toàn bộ chip, nếu điều kiện không cho phép.
Lấy ví dụ về trung tâm thương mại, mỗi cửa hàng bên trong có thể thiết kế mỗi kiểu tùy ý, bán những món hàng cao cấp hay thấp cấp khác nhau. Thay vì nếu là một cửa hàng lớn duy nhất (phương pháp nguyên khối) thì đòi hỏi phải có sự nhất quán về thiết kế và cả những món hàng bán trong đó.
2023-05-15-image-11.jpg

Các bộ phận của chip không thể thu nhỏ đi đáng kể hoặc không đòi hỏi phải thu nhỏ có thể được sản xuất bằng cách dùng những phương pháp cũ hơn và tiết kiệm hơn.
Mặc dầu quy trình sản xuất các bộ xử lý như vậy khá phức tạp, nhưng tổng chi phí thường thấp hơn. Hơn nữa, nó mang đến cho các công ty sản xuất vi xử lý một con đường dễ quản lý hơn để mở rộng phạm vi sản phẩm của họ.

Khoa học về silicon

Để hiểu đầy đủ lý do tại sao các nhà sản xuất bộ xử lý chuyển sang sử dụng chiplet, trước tiên chúng ta phải tìm hiểu kỹ cách thức các thiết bị này được tạo ra. CPU và GPU bắt đầu vòng đời của chúng dưới dạng các đĩa lớn làm bằng silicon siêu tinh khiết, thường có đường kính dưới 12 inch (300 mm) một chút và dày 0.04 inch (1 mm).

Tấm wafer silicon này trải qua một chuỗi các bước phức tạp, dẫn đến nhiều lớp vật liệu khác nhau – chất cách điện, chất điện môi và kim loại. Các nguyên mẫu của các lớp này được tạo ra thông qua một quá trình gọi là quang khắc (photolithography), trong đó ánh sáng cực tím được chiếu qua một phiên bản phóng to của nguyên mẫu (mặt nạ) và sau đó được thu nhỏ qua thấu kính đến mức kích thước cần thiết.
Khuôn mẫu này được lặp lại, theo các khoảng thời gian đã định, trên bề mặt của tấm bán dẫn và mỗi mẫu này cuối cùng sẽ trở thành một bộ xử lý. Vì các con chip có hình chữ nhật và các tấm wafer có hình tròn, nên các mẫu phải chồng lên chu vi của đĩa. Những phần chồng chéo này cuối cùng bị loại bỏ vì chúng không hề hoạt động.
2023-05-15-image-4.jpg
Một khi đã hoàn thành, wafer được kiểm tra bằng cách sử dụng đầu dò áp dụng cho từng chip. Kết quả kiểm tra bằng điện cho các kỹ sư biết về chất lượng của bộ xử lý dựa trên một danh sách dài các tiêu chí. Giai đoạn ban đầu này, được gọi là chip binning, giúp xác định "cấp độ" của bộ xử lý.
Chẳng hạn, nếu con chip được dự định là một CPU, thì mọi bộ phận phải hoạt động chính xác, hoạt động trong một phạm vi tốc độ xung nhịp đã thiết đặt sẵn, ở một hiệu điện thế cụ thể. Mỗi phần wafer sau đó được phân loại dựa trên các kết quả thử nghiệm này.
Sau khi hoàn thành, tấm wafer được cắt thành từng mảnh riêng lẻ hoặc các “khuôn (die)”, để có thể sử dụng được. Những khuôn này sau đó được gắn lên một cái đế (chất nền), hơi giống như một bo mạch chủ chuyên dụng. Bộ xử lý trải qua quá trình đóng gói thêm (ví dụ: với bộ tản nhiệt) trước khi sẵn sàng phân phối đi.
2023-05-15-image-5.jpg
Toàn bộ chuỗi quy trình này có thể mất hàng tuần để chế tạo và các công ty như TSMC và Samsung tính phí cao cho mỗi tấm wafer, đâu đó khoảng từ 3,000 đến 20,000 đô la tùy thuộc vào nút tiến trình đang được sử dụng.
"Nút tiến trình (process node)" là thuật ngữ được sử dụng để mô tả toàn bộ hệ thống chế tạo. Về mặt lịch sử, chúng được đặt tên theo chiều dài cổng của bóng bán dẫn. Tuy nhiên, khi công nghệ sản xuất được cải thiện và cho phép các bộ phận ngày càng nhỏ hơn, danh pháp này không còn tuân theo bất kỳ khía cạnh vật lý nào của khuôn và giờ đây nó chỉ đơn giản là một công cụ tiếp thị.
Tuy nhiên, mỗi nút tiến trình mới vẫn mang lại lợi ích so với nút tiền nhiệm trước đó. Nó có thể rẻ hơn để sản xuất, tiêu thụ ít năng lượng hơn ở cùng tốc độ xung nhịp (hoặc ngược lại: xung nhịp cao hơn với cùng một mức năng lượng) hoặc có mật độ cao hơn. Thang đo về mật độ đo lường xem có bao nhiêu thành phần có thể vừa với một diện tích khuôn nhất định. Trong biểu đồ bên dưới, chúng ta có thể thấy việc này đã tiến triển như thế nào qua nhiều năm đối với GPU (chip lớn nhất và phức tạp nhất mà bạn sẽ tìm thấy trong PC).
2023-05-11-image-2.jpg

Quảng cáo


Mật độ bóng bán dẫn của GPU đã gia tăng theo cấp số nhân trong 30 năm qua, đặc biệt là từ năm 2014 trở đi.

Những cải tiến trong nút tiến trình cung cấp phương tiện để các kỹ sư gia tăng khả năng và hiệu suất của sản phẩm mà không cần phải sử dụng những con chip lớn và tốn kém. Tuy nhiên, biểu đồ trên chỉ nói lên một phần câu chuyện, vì không phải mọi khía cạnh của bộ xử lý đều có thể hưởng lợi từ những tiến bộ này.
Các mạch điện bên trong chip có thể được phân bổ thành một trong các danh mục lớn sau:
  • Logic – xử lý dữ liệu, làm toán và ra quyết định.
  • Bộ nhớ – thường là SRAM (RAM tĩnh, chính là bộ đệm cache), lưu trữ dữ liệu cho mạch logic.
  • Analog (mạch tương tự) – mạch điện quản lý tín hiệu giữa chip và các thiết bị khác, chẳng hạn loa, bàn phím, màn hình, ổ đĩa quang, thanh RAM động (DRAM), v.v…
Thật không may, trong khi các mạch logic tiếp tục bị thu hẹp sau mỗi bước tiến lớn trong công nghệ nút tiến trình, thì các mạch analog lại hầu như không thay đổi và SRAM cũng đang bắt đầu đạt đến giới hạn.
2023-05-11-image-3.jpg
Tỷ lệ diện tích của các loại mạch chức năng trên miếng silicon: Mạch Logic đang giảm diện tích nhưng diện tích Analog và SRAM đang chững lại.

Mặc dù mạch logic vẫn tạo nên phần lớn nhất của khuôn, nhưng lượng SRAM trong CPU và GPU ngày nay đã tăng lên đáng kể trong những năm gần đây. Ví dụ: chip Vega 20 của AMD được sử dụng trong card đồ họa Radeon VII có tổng cộng 5 MB bộ đệm cache L1 và L2. Chỉ cần hai thế hệ GPU sau, Navi 21 có hơn 130 MB bộ nhớ cache đủ các loại – gấp 25 lần so với Vega 20.
Chúng ta có thể kỳ vọng các mức cache này sẽ tiếp tục tăng lên khi các thế hệ bộ xử lý mới được phát triển, nhưng với việc bộ nhớ không được thu nhỏ như logic, việc sản xuất tất cả các mạch điện trên cùng một nút tiến trình sẽ ngày càng trở nên ít hiệu quả hơn về mặt chi phí.
Trong một thế giới lý tưởng, người ta sẽ thiết kế một khuôn trong đó các phần analog được chế tạo trên nút lớn nhất và rẻ nhất, các bộ phận SRAM trên một nút nhỏ hơn nhiều và mạch logic dành riêng cho công nghệ tiên tiến tuyệt đối. Thật không may, điều này là không thể đạt được trên thực tế. Tuy nhiên, tồn tại một cách tiếp cận khác.

Quảng cáo


Chia nhỏ và chinh phục

Trở lại năm 1995, Intel đã tung ra bản kế nhiệm cho bộ xử lý vi kiến trúc P5 nguyên bản của mình, phiên bản này là Pentium II. Điều khiến nó khác biệt so với CPU thông thường vào thời điểm đó là bên dưới tấm chắn nhựa có một bảng mạch chứa hai chip: chip chính, bao gồm tất cả hệ thống logic xử lý và hệ thống analog, và một hoặc hai mô-đun SRAM riêng biệt đóng vai trò bộ đệm cache L2.
Intel đã sản xuất con chip chính, nhưng bộ đệm lại được lấy từ các công ty khác. Điều này sẽ trở thành tiêu chuẩn khá phổ biến đối với máy tính để bàn vào giữa đến cuối những năm 1990, cho đến khi các kỹ thuật chế tạo chất bán dẫn được cải thiện đến mức mà mạch logic, bộ nhớ đệm và analog đều có thể được tích hợp vào cùng một khuôn.
1024px-Intel_Pentium_II_400_SL357_SECC2.jpg
Bộ xử lý Pentium II của Intel - với CPU ở chính giữa, các chip bộ đệm cache nằm bên phải. Nguồn: Wikimedia.

Mặc dù Intel tiếp tục nghiên cứu nhiều chip trong cùng một gói, nhưng phần lớn họ bị mắc kẹt với cái gọi là cách tiếp cận nguyên khối cho bộ xử lý – tức là một chip cho mọi thứ. Đối với hầu hết các bộ xử lý, không cần nhiều hơn một khuôn, vì các kỹ thuật sản xuất đủ thành thạo (và giá cả phải chăng) để giữ cho nó đơn giản.
Tuy nhiên, các công ty khác lại quan tâm nhiều hơn đến cách tiếp cận đa chip, đáng chú ý nhất là IBM. Vào năm 2004, ta có thể mua phiên bản gồm 8 chip của CPU máy chủ POWER4 bao gồm bốn bộ xử lý và bốn mô-đun bộ đệm cache, tất cả được gắn trong cùng một khối (được gọi là mô-đun nhiều chip hoặc cách tiếp cận MCM - multi-chip module).
Khoảng thời gian này, thuật ngữ "tích hợp không đồng nhất (HI)" (heterogeneous integration) bắt đầu xuất hiện, một phần là do công việc nghiên cứu được thực hiện bởi DARPA (Cơ quan chỉ đạo các Dự án Nghiên cứu Quốc phòng Tiên tiến). HI nhằm mục đích phân tách các phần khác nhau của một hệ thống xử lý, chế tạo chúng một cách riêng lẻ trên các nút phù hợp nhất cho từng phần, sau đó kết hợp chúng vào cùng một gói.
Ngày nay, việc này được biết đến nhiều hơn với tên gọi hệ thống trong cùng một gói (System-in-Package, hay SiP) và đã là phương pháp tiêu chuẩn để trang bị chip cho đồng hồ thông minh ngay từ khi loại thiết bị này mới ra đời. Ví dụ: Apple Watch Series 1 chứa CPU, một số DRAM và bộ nhớ NAND Flash, nhiều bộ điều khiển và các thành phần khác bên trong một cấu trúc duy nhất.
2023-05-12-image.jpg
Ảnh tia X cấu trúc SiP của Apple Watch Series 1. Nguồn: iFixit.

Một cách thiết lập tương tự có thể đạt được bằng cách đặt tất cả các hệ thống khác nhau trên một khuôn duy nhất (được gọi là hệ thống trên cùng một chip hoặc SoC). Tuy nhiên, cách tiếp cận này không cho phép tận dụng các nút đắt rẻ khác nhau, cũng như mọi thành phần không thể được sản xuất theo cách này.
Đối với một nhà cung cấp trong mảng công nghệ, sử dụng cách tích hợp không đồng nhất cho một sản phẩm thị trường ngách là một chuyện, nhưng sử dụng nó cho phần lớn danh mục đầu tư của họ lại là chuyện khác. Đây chính xác là những gì AMD đã làm với loạt bộ xử lý của mình. Vào năm 2017, gã khổng lồ bán dẫn đã phát hành kiến trúc Zen của mình dưới dạng CPU máy tính để bàn một khuôn Ryzen. Vài tháng sau, hai dòng sản phẩm đa chip, Threadripper và EPYC, ra mắt, với dòng sau tự hào có tới bốn khuôn.
Với sự ra mắt của Zen 2 hai năm sau đó, AMD đã hoàn toàn chấp nhận HI, MCM, SiP – bất kể bạn muốn gọi nó là gì. Họ đã chuyển phần lớn hệ thống analog ra khỏi bộ xử lý và đặt chúng vào một khuôn riêng, tức là những gì “lạc hậu” thì cần bỏ ra một bên. Chúng được sản xuất trên nút tiến trình đơn giản hơn, rẻ hơn, trong khi nút tiên tiến hơn được sử dụng cho phần logic và bộ đệm cache còn lại.
Và vì vậy, chiplets đã trở thành từ thông dụng được lựa chọn.

Nhỏ hơn thì tốt hơn

Để hiểu chính xác tại sao AMD lại chọn hướng đi này, ta hãy cùng xem xét hình ảnh bên dưới. Nó thể hiện hai CPU từ dòng Ryzen 5 – 2600 ở bên trái, sử dụng thứ gọi là kiến trúc Zen+, và 3600 có kiến trúc Zen 2 ở bên phải.
Bộ tản nhiệt trên cả hai mẫu CPU đã được gỡ bỏ và các bức ảnh được chụp bằng camera hồng ngoại. Khuôn đơn của 2600 chứa tám lõi, mặc dù hai trong số chúng bị vô hiệu hóa đối với mẫu CPU cụ thể này.
2023-05-15-image.jpg
Bên trái: Khuôn của Ryzen 5 2600, bên phải: khuôn của Ryzen 5 3600. Ảnh: Fritzchen Fritz.

Đây cũng là trường hợp của 3600, nhưng ở đây chúng ta có thể thấy rằng có hai khuôn trong gói – Khuôn Phức hợp Lõi (CCD) ở trên cùng, chứa các lõi và bộ đệm, và Khuôn Đầu vào/Đầu ra (IOD) ở phần dưới cùng chứa tất cả các bộ điều khiển (dành cho bộ nhớ, PCI Express, USB, v.v.) và các giao diện vật lý.
Vì cả hai CPU Ryzen đều khớp với cùng một ổ socket bo mạch chủ, nên hai hình ảnh về cơ bản là để chia tỷ lệ. Nhìn bề ngoài, có vẻ như hai khuôn trong 3600 có diện tích kết hợp lớn hơn so với chip đơn trong 2600, nhưng vẻ bề ngoài có thể gây nhầm lẫn.
Nếu chúng ta so sánh trực tiếp các chip chứa lõi, thì rõ ràng thấy mạch analog chiếm không gian đáng kể trong mẫu chip cũ (Zen+) – đó là tất cả các mảng màu xanh dương pha trộn xanh lá (tạo thành màu xanh ngọc) bao quanh các lõi màu vàng và bộ đệm cache. Tuy nhiên, trong CCD của Zen 2, rất ít diện tích khuôn được dành riêng cho các hệ thống analog; nó gần như hoàn toàn bao gồm logic và SRAM (cache).
Chip Zen+ có diện tích 213 mm² và được sản xuất bởi GlobalFoundries bằng nút tiến trình 12nm. Đối với Zen 2, AMD đã giữ lại các dịch vụ của GlobalFoundries cho 125 mm² diện tích của IOD nhưng sử dụng nút tiến trình N7 ưu việt của TSMC cho 73 mm² của CCD.
2023-05-15-image-2.jpg
Zen+ (phía trên) so sánh với CCD của Zen 2 (phía dưới).

Diện tích kết hợp của các chip trong kiến trúc mới Zen 2 nhỏ hơn Zen+ (73+125 < 213) và nó cũng tự hào có bộ nhớ đệm L3 gấp đôi, hỗ trợ bộ nhớ nhanh hơn và PCI Express. Tuy nhiên, phần tốt nhất của phương pháp chiplet là kích thước nhỏ gọn của CCD giúp AMD có thể lắp một cái khác vào gói. Sự phát triển này đã khai sinh ra dòng Ryzen 9, cung cấp các mẫu CPU 12 và 16 lõi cho máy tính để bàn.
Thậm chí còn tốt hơn nữa là bằng cách sử dụng hai chip nhỏ hơn thay vì một chip lớn, mỗi tấm wafer có khả năng tạo ra nhiều khuôn hơn. Trong trường hợp của CCD trong Zen 2, một tấm wafer 12 inch (300 mm) duy nhất có thể tạo ra nhiều khuôn hơn tới 85% so với mẫu Zen+.
Một lát cắt ra khỏi tấm wafer càng nhỏ thì càng ít khả năng phát hiện lỗi sản xuất (vì chúng có xu hướng phân bố ngẫu nhiên trên đĩa), do đó, khi tính đến tất cả những điều này, phương pháp chiplet không chỉ mang lại cho AMD khả năng mở rộng danh mục đầu tư của mình, cho đến nay nó còn hiệu quả về chi phí hơn rất nhiều – cùng các CCD đó có thể được sử dụng trong nhiều mẫu chip và mỗi tấm wafer tạo ra hàng trăm mẫu chip như vậy.
Nhưng nếu sự lựa chọn thiết kế này rất có lợi thế, thì tại sao Intel không làm điều đó? Tại sao chúng ta không thấy nó được sử dụng trong các bộ xử lý khác, chẳng hạn như GPU?

Đi theo kẻ dẫn đầu

Để trả lời câu hỏi đầu tiên, chúng ta thấy Intel thực sự đang áp dụng lộ trình chiplet hoàn toàn và họ đang đi đúng hướng với kiến trúc CPU tiêu dùng tiếp theo của mình, được gọi là Meteor Lake (nghĩa đen: Hồ sao băng). Đương nhiên, cách tiếp cận của Intel có phần độc đáo, vì vậy hãy khám phá xem nó khác với cách tiếp cận của AMD như thế nào.


2023-05-15-image-3.jpg
Bốn ô gạch kết nối tốc độ cao với nhau và tất cả chúng cùng kết nối với bộ đan xen - interposer, thông qua các “bướu” nhỏ trong hình. Các TSV (màu vàng) chạy xuyên qua lớp interposer (phần màu nâu) có các lớp dây dẫn nằm theo phương ngang để tạo ra kết nối. Dưới cùng là các "bướu" lớn hơn để nối kết chính bộ đan xen này với bảng mạch lớn, còn gọi là gói. Điều đáng chú ý là ở hình minh họa cắt dọc khá mơ hồ này của Intel không thể hiện ô gạch I/O, hàm ý rằng cách mà nó kết nối với bộ đan xen có thể khác biệt và tốc độ thấp hơn so với 3 ô còn lại.

Sử dụng thuật ngữ ô gạch (tile) thay vì chiplet, thế hệ bộ xử lý này sẽ chia thiết kế nguyên khối trước đó thành bốn chip riêng biệt:
  • Ô tính toán: Chứa tất cả các lõi và bộ đệm cache L2.
  • Ô GFX: Chứa GPU tích hợp.
  • Ô SOC: Kết hợp bộ đệm L3, PCI Express và các bộ điều khiển khác.
  • Ô IO: Chứa các giao diện vật lý cho bộ nhớ (RAM) và các thiết bị khác.
Các kết nối tốc độ cao, độ trễ thấp hiện diện giữa SOC và ba ô gạch kia và tất cả chúng đều được kết nối với một khuôn khác, được gọi là bộ xen kẽ (interposer). Bộ xen kẽ này cung cấp năng lượng cho từng chip và chứa các dấu hiệu giữa chúng, tức là các đường đi để tín hiệu đi từ chip này tới chip kia. Bộ xen kẽ và bốn ô sau đó được gắn vào một bảng mạch bổ sung để cho phép đóng gói toàn bộ tổ hợp.
Không giống như Intel, AMD không sử dụng bất kỳ khuôn gắn đặc biệt nào, mà họ có hệ thống kết nối độc đáo của riêng mình, được gọi là Infinity Fabric, để xử lý các giao dịch dữ liệu của chiplet. Hoạt động cung cấp năng lượng chạy qua một gói khá chuẩn và AMD cũng sử dụng ít chiplet hơn. Vậy tại sao thiết kế của Intel lại như vậy?
Một thách thức với cách tiếp cận của AMD là nó không phù hợp lắm với mảng chip tiêu thụ điện năng thấp, siêu di động. Đây là lý do tại sao AMD vẫn sử dụng CPU nguyên khối cho phân khúc đó. Thiết kế của Intel cho phép họ trộn lẫn và kết hợp các ô gạch khác nhau để phù hợp với một nhu cầu cụ thể. Ví dụ: các mẫu chip hợp ngân sách cho máy tính xách tay giá rẻ có thể sử dụng các ô nhỏ hơn nhiều ở mọi nơi, trong khi AMD chỉ có một kích thước chiplet cho từng mục đích.
Nhược điểm của hệ thống Intel là nó phức tạp và khá tốn kém để sản xuất, mặc dù còn quá sớm để dự đoán điều này sẽ ảnh hưởng như thế nào đến giá bán lẻ. Tuy nhiên, cả hai công ty sản xuất CPU đều cam kết hoàn toàn với khái niệm chiplet. Một khi mọi bộ phận của chuỗi sản xuất được thiết kế để phục vụ cho thiết kế chiplet, thì chi phí sẽ giảm.
2023-05-15-image-9.jpg
Kiến trúc Navi 31 gồm một GCD (Khuôn Phức hợp Đồ họa - Graphics Complex Die) chứa các lõi và cache L2, một MCD (Khuôn Phức hợp Bộ đệm - Graphics Comples Die) chứa các phần của cache L3 cùng bộ điều khiển bộ nhớ.

Về GPU, chúng chứa tương đối ít khi xét về mạch analog so với phần còn lại của khuôn, nhưng lượng SRAM bên trong đang tăng dần. Đây là lý do tại sao AMD áp dụng kiến thức về chiplet cho dòng Radeon 7000 mới nhất của mình, với GPU Radeon RX 7900 bao gồm nhiều khuôn – một khuôn lớn duy nhất cho các lõi và bộ đệm cache L2, và năm hoặc sáu chip nhỏ, mỗi chip chứa một phần của bộ đệm L3 và một bộ điều khiển bộ nhớ.
Bằng cách di chuyển các bộ phận này ra khỏi khuôn chính, các kỹ sư có thể tăng đáng kể lượng mạch logic mà không cần sử dụng các nút tiến trình mới nhất để kiểm soát kích thước chip. Tuy nhiên, thay đổi này không giúp gia tăng độ rộng của danh mục card đồ họa, mặc dù nó có thể giúp cải thiện chi phí tổng thể.
Hiện tại, Intel và Nvidia không có dấu hiệu đi theo sự dẫn dắt của AMD với các thiết kế GPU của họ. Cả hai công ty đều sử dụng TSMC cho tất cả các hoạt động sản xuất và dường như hài lòng với việc sản xuất những con chip cực lớn, chuyển chi phí sang cho người tiêu dùng.
Tuy nhiên, với doanh thu trong lĩnh vực đồ họa suy giảm đều đặn, chúng ta có thể thấy mọi nhà cung cấp GPU sẽ áp dụng cùng một lộ trình trong vài năm tới.

Đạt được Định luật Moore bằng thiết kế chiplet

Bất kể khi nào những thay đổi này xảy ra, sự thật cơ bản là chúng phải xảy ra. Bất chấp những tiến bộ công nghệ to lớn trong ngành sản xuất chất bán dẫn, thì vẫn có một giới hạn nhất định về mức độ thu nhỏ của mỗi thành phần.


Để tiếp tục nâng cao hiệu suất của chip, về cơ bản, các kỹ sư có hai con đường – bổ sung thêm mạch logic, với bộ nhớ cần thiết để hỗ trợ nó và tăng tốc độ xung nhịp bên trong. Về tốc độ xung nhịp, CPU trung bình đã không thay đổi đáng kể ở khía cạnh này trong nhiều năm. Bộ xử lý FX-9590 của AMD, từ năm 2013, có thể đạt tốc độ 5 GHz trong một số khối lượng công việc nhất định, trong khi tốc độ xung nhịp cao nhất trong các mẫu chip hiện tại của AMD là 5.7 GHz (với Ryzen 9 7950X).
2023-05-15-image-8.jpg
Intel gần đây đã ra mắt Core i9-13900KS, có khả năng đạt 6 GHz trong điều kiện thích hợp, nhưng hầu hết các mẫu chip của họ đều có tốc độ xung nhịp tương đương với AMD.
Tuy nhiên, điều đã thay đổi là số lượng mạch và SRAM. FX-9590 đã nói ở trên có 8 lõi (và 8 luồng) và 8 MB bộ đệm L3, trong khi 7950X3D có 16 lõi, 32 luồng và 128 MB bộ đệm L3. CPU của Intel cũng được mở rộng tương tự về số lõi và SRAM.
GPU đổ bóng hợp nhất đầu tiên của Nvidia, G80 có từ năm 2006, bao gồm 681 triệu bóng bán dẫn, 128 lõi và 96 kB bộ đệm L2 trong một con chip có diện tích 484 mm vuông. Tua nhanh đến năm 2022, khi AD102 được ra mắt và nó hiện bao gồm 76.3 tỷ bóng bán dẫn, 18,432 lõi và 98,304 kB bộ nhớ đệm L2 bên trong diện tích khuôn 608 mm vuông.
Năm 1965, Gordon Moore, nhà đồng sáng lập Fairchild Semiconductor, đã quan sát thấy rằng trong những năm đầu sản xuất chip, mật độ các bộ phận bên trong khuôn tăng gấp đôi mỗi năm với chi phí sản xuất tối thiểu cố định. Quan sát này được gọi là Định luật Moore và sau đó được hiểu là "số lượng bóng bán dẫn trong chip tăng gấp đôi sau mỗi hai năm", dựa trên xu hướng sản xuất.
2023-05-15-image-7.jpg
Định luật Moore vẫn là một sự mô tả khá chính xác về sự phát triển của ngành công nghiệp bán dẫn trong gần sáu thập kỷ. Những thành tựu to lớn về mạch logic và bộ nhớ ở trong cả CPU lẫn GPU đã đạt được nhờ những cải tiến liên tục trong các nút tiến trình, với các thành phần ngày càng trở nên nhỏ hơn qua nhiều năm.
Tuy nhiên, xu hướng này không thể tiếp tục mãi mãi, bất kể công nghệ mới ra đời là gì.
Thay vì chờ đợi đạt đến giới hạn này, các công ty như AMD và Intel đã chuyển sang sử dụng chiplet, khám phá ra nhiều cách khác nhau để kết hợp chúng nhằm tiếp tục tiến tới trong việc tạo ra các bộ xử lý mạnh mẽ hơn bao giờ hết.
Trong nhiều thập kỷ tới, một chiếc PC trung bình có thể chứa các CPU và GPU có kích thước bằng bàn tay của bạn, nhưng khi bóc bộ tản nhiệt ra và bạn sẽ tìm thấy một loạt các con chip nhỏ – không phải ba hay bốn, mà là hàng chục con, tất cả đều được sắp xếp một cách tài tình như những ô gạch và xếp chồng lên nhau. Cho nên sự thống trị của chiplet chỉ mới bắt đầu.

Lược dịch từ bài của Nick Evanson, TechSpot.
60 bình luận
Chia sẻ

Xu hướng

Đố vui, đố anh em ảnh màu đen là ảnh gì
Cười vui vẻ
Zombodroid_07062023070915.jpg
@mig29f quần chip hay quần xà lỏn Thế MOD??
@Huy Nguyễn 1995 quần "chip" đen
@adnpop
Cười vô mặt
@mig29f ảnh lehuuthe đang hửi chip =))
Công nghệ chip ngành càng tiến bộ hơn xưa rất nhiều
@NghiepTranVINA ông Nghiệp viết lộn...mê..thành ghê hả
@adnpop Ý nói sự tiến bộ ngành chip ghê gớm thật
@Frozen Cat Chip mang lên đầu như kính táo là cũ r
@Frozen Cat Giờ người ta sắp cấy chip vào người luôn rồi chứ đâu chỉ đeo lên đầu!
Quá hay và chi tiết, cám ơn bạn nhiều vì bài viết bổ ích!
@Mycroft Holmes Cám ơn bạn nè.
5sao
@Tú Bán Sách Chào cậu ạ, cám ơn cậu nè.😆
Bài dài hơn 5 mét, tặng 5 sao
@Taliban2023 Vụ chiplet này nói cặn kẽ chắc chục cuốn sách cũng chưa đủ, với lại các hãng làm chip cũng không công khai hết 100%, nhưng khái niệm tổng quát là vậy đó cậu. 😁
@Taliban2023 Chính xác là 5,29 mét 🙂
@Frozen Cat ghẹo tí đó mà
Bài hay quá nên cho 5 sao
@zombie01 Cám ơn bạn zombie nè 😁.
Hiếm bài có tính chất chuyên môn chất lượng như này quá!
@nghaimin Cám ơn bạn 😁.
Bài dài quá, đọc hơn 5ph vẫn chưa xong, thôi cho 5* đại
Công nghệ này trái ngược với chip Apple M Series khi Apple tích hợp RAM Unified Memory lên cùng trên chung 1 gói với SoC
@centernc Đúng á bạn, M series chỉ có một khuôn tích hợp toàn bộ thành phần, giúp Apple kiểm soát mọi thứ tối ưu. Nhưng mà có một thứ tựa tựa như chiplet là UltraFusion để nối 2 chip M1 Max lại thành M1 Ultra.
Dũng flop
ĐẠI BÀNG
6 tháng
@centernc Chia nhỏ die ra thì sẽ dễ làm hơn, tỷ lệ yield cao hơn, tiết kiệm hơn/lợi nhuận hơn, đỡ tốn wafer, bài toán là kết nối giữa các die lsao cho độ trễ thấp nhất có thể là được, AMD tính đường dài khôn hơn, chứ đám cpu epyc mà làm mono die thì còn lâu mới nhét được 128 nhân, intel thì chết dí mảng này r.
htux
CAO CẤP
6 tháng
Chiplet & 3d stack là tương lai phải có rồi. Chip ngày càng cần nhiều thứ tích hợp hơn, quy trình càng xuống thấp chi phí càng đắt đỏ nên cần thiết phải có 2 món này kết hợp
Hãy cảm ơn và biết ơn AMD . Nhờ AMD mà bọn cuồng intel mới có cpu nhiều nhân nhiều luồng như vậy để xài . Không có AMD ra tay thì thế giới này chỉ có xài được những con CPU 2 nhân 4 luồng mà intel ban tặng với mức giá trên trời 😆)))))))))
@Nguyễn Chí Danh@1 Quá sức biết ơn lun á! Nhưng mà AMD đặt tên rối wá bạn Danh ui. 😁😁
htux
CAO CẤP
6 tháng
@Nguyễn Chí Danh@1 Bây giờ thằng novideo nó cũng ban tặng mấy cháu nvidiot con cạc giá trên trời mà mấy cháu vẫn bú lấy đó thôi. Chờ AMD Xilinx, intel sapphire, micro$oft google phá thế độc quyền của cái thằng này
bài viết rất bổ ích!
@tranducanhbn Cám ơn bạn nè !
Hay quá
Yêu quá
tanstitch
ĐẠI BÀNG
6 tháng
Bài hay quá. Cám ơn bạn.
@tanstitch Cám ơn bạn ạ.
khoa-ckd
TÍCH CỰC
6 tháng
Tuy ra hơi muộn nhưng bài rất hay, cảm ơn tác giả. Phải nói là AMD từ hồi đc dẫn dắt bởi Lisa su là nhanh nhạy cực kỳ, toàn dẫn đầu công nghệ sản xuất phần cứng.

Đang rất hóng AMD ra APU với phần infinity cache 3D. iGPU bây giờ vẫn quá đói băng thông ram vẫn đến không bung đc hết sức mạnh. Giả dụ Radeon 780M mà có tầm 96MB L3 cache thì có thua gì mấy con dgpu di động tầm trung. Giấc mơ laptop ultra book pin khá hiệu năng cao trở thành hiện thực.
@khoa-ckd phổ cập GDDR SDRAM cho laptop là được 😆
Dũng flop
ĐẠI BÀNG
6 tháng
@khoa-ckd 96MB L3 cache cũng to đấy, nhưng nếu cho vào thì ngon thật, chờ amd cho vào thế hệ sau thì ngon, cân đối hiệu quả năng lượng mới hợp lý trên laptop / máy chơi game cầm tay.
Cứ tưởng con chip M của Apple là dẫn đầu. 🙂
@SoGetSu Kiến trúc khác nên Apple dẫn đầu mảng ARM. 😁
khoa-ckd
TÍCH CỰC
6 tháng
@SoGetSu Bài viết đang nói về về chiplet và xu hướng tất yếu của chiplet, con chip của apple nó là monolithic, nó trớt quớt luôn á. dẫn đầu cái củ cà. Bị buồng apple thì cũng vừa vừa thôi.
đọc bài nhức đầu quá, tôi vẫn mua NVI thôi
Mắc ói quá
Bài viết quá chất lượng
@phongblack92 Cám ơn bạn nè.
bài hay quá

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2023 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019