Bộ nhớ GDDR5X khác gì với GDDR5 và hiệu năng được cải thiện như thế nào?

Như vậy Nvidia đã là nhà sản xuất đầu tiên ra mắt card đồ họa dùng bộ nhớ GDDR5X với phiên bản GeForce GTX 1080. Mẫu card này dùng lõi đồ họa kiến trúc Pascal GP104, sản xuất trển quy trình FinFET 16 nm của TSMC và có 8 GB bộ nhớ GDDR5X. Bên cạnh kiến trúc Pascal thì bộ nhớ GDDR5X là một thành phần rất quan trọng ảnh hưởng đến hiệu năng đồ họa. Vậy GDDR5X khác gì so với GDDR5 và hiệu năng sẽ được cải tiến ra sao?

Chuẩn GDDR5X SGRAM (Synchronous Graphics Random Access Memory) được phát triển dựa trên công nghệ GDDR5 có từ năm 2007. GDDR5X được thiết kế nhằm mục tiêu tăng băng thông cho các vi xử lý đồ họa hiệu năng cao mà không cần thay đổi kiến trúc bộ nhớ của GPU hay bản thân công nghệ bộ nhớ, tương tự như các thế hệ GDDR trước đây. GDDR5X mang lại 3 cải tiến cốt lõi cho GDDR5 gồm: tăng tốc độ truyền tải dữ liệu lên tối đa là gấp đôi, tiết kiệm điện năng hơn và mở ra nhiều kiểu thiết lập bộ nhớ với mật độ cao hơn trên các vi xử lý đồ họa hoặc thiết bị. Điều tối quan trọng đối với các nhà phát triển chip và nhà sản xuất card đồ họa là GDDR5X không đòi hỏi phải thay đổi nhiều về thiết kế của card và các tính năng thông thường của GDDR5 vẫn được giữ nguyên.

Những cải tiến về hiệu năng:

Hiện tại những chip nhớ GDDR5 có thể hoạt động với tốc độ truyền tải từ 7 đến 8 Gbps trên mỗi chân pin và tốc độ này có thể được cải thiện nếu thay đổi lệnh, địa chỉ và dữ liệu (những chỉ số tương ứng Command Clock (CK) và Write Clock (WCK)). Tuy nhiên, Micron Technology - một trong những nhà thiết kế chính của chuẩn GDDR5X và cũng là nhà cung cấp chip nhớ GDDR5X cho dòng card mới của Nvidia cho rằng giới hạn của chip nhớ GDDR5 đến từ tốc độ truy xuất hàng loạt và giao thức lệnh/địa chỉ và để cải thiện hiệu năng của loại bộ nhớ này, các kỹ sư phải thay đổi kiến trúc của chip nhớ.

Cải tiến quan trọng của chuẩn GDD5X so với các thế hệ trước là kiến trúc nạp trước 16n-prefetch hoàn toàn mới cho phép truyền tải đến 512 bit (64 bytes) thông tin trên mỗi chu kỳ truy xuất đọc hoặc ghi. Ngược lại, công nghệ GDDR5 hiện tại dùng kiến trúc 8n-prefetch và lượng thông tin trên mỗi chu kỳ giới hạn ở 256 bit (32 bytes).

Trước khi tìm hiểu sâu hơn, chúng ta hãy cùng xem lại bộ nhớ GDDR5:

GDDR5 hoạt động với 3 xung nhịp vi phân độc lập, phát động từ vi điều khiển bộ nhớ. Bộ nhớ GDDR5 cũng hoạt động theo cơ chế phân nhóm tín hiệu theo chân pin của DRAM thông thường bao gồm các nhóm chân pin: nhóm lệnh/điều khiển (command/control), nhóm địa chỉ (address pin) và nhóm dữ liệu (data pin). Một chip GDDR5 hiện tại có 67 chân pin tín hiệu/170 chân pin theo kiểu đóng gói BGA 170.

3 xung nhịp này bao gồm xung nhịp lệnh (CK) tương ứng với tín hiệu đầu vào (Input) của lệnh (command) và địa chỉ (address) và xung nhịp ghi (WCK) chia làm 2 xung phụ gồm xung vi phân WCK01 và WCK23 đảm nhận tín hiệu tương ứng với hoạt động đọc/ghi, truyền tải vào/ra các chân pin I/O. Các tín hiệu WCK chạy ở tần số tương đương với tốc độ truyền tải dữ liệu (data rate) của thiết bị ở chế độ DDR và mỗi xung truyền tải 16 bit (2 bytes) dữ liệu. Tần số của xung CK bằng 1 nửa tần số WCK.

Thử lấy ví dụ một bộ nhớ GDDR5 có tốc độ truyền tải 5 Gbps trên mỗi chân pin, xung CK chạy ở tần số 1,25 GHz thì xung WCK chạy ở xung 2,5 GHz. 2 xung này sẽ thẳng hàng với nhau, nhờ đó mang lại tốc độ truy xuất đọc/ghi với độ trễ tối thiểu.

Để đạt tốc độ truy xuất cao, GDDR5 sử dụng kiến trúc nạp trước 8n-prefetch. Với kiến trúc này, độ rộng bus dữ liệu đến và đi từ lõi bộ nhớ sẽ gấp 8 lần giao diện bộ đệm I/O. Giao diện GDDR5 sẽ truyền tải 2 chuỗi dữ liệu độ rộng 32 bit trên mỗi chu kỳ tần số xung nhịp ghi (WCK) đến/đi từ các chân pin I/O. Tương ứng với kiến trúc 8n-prefetch, mỗi lần truy xuất đọc hoặc ghi sẽ bao gồm một chuỗi dữ liệu rộng 256 bit với 2 chu kỳ tần số CK tại lõi bộ nhớ và 8 chuỗi dữ liệu rộng 32 bit tương ứng với 1,5 chu kỳ tần số WCK tại các chân pin I/O.

GDDR5X cũng hoạt động với các tần số tương tự là CK và WCK. Với kiến trúc 16n-prefetch tức độ rộng bus từ lõi bộ nhớ gấp 16 lần giao diện I/O, dữ liệu có thể truyền đi ở tốc độ truyền gấp đôi (DDR) hoặc gấp 4 lần (QDR) tương ứng với xung WCK dựa trên kiến trúc nạp trước nào (8n hay 16n) và giao thức nào được dùng. Theo đó, nếu nhà sản xuất chip tăng xung CK lên 1,5 GHz, xung WCK sẽ là 3 GHz thì tốc độ truyền tải theo thiết lập QDR/16n-prefetch sẽ tăng đến 12 Gbps/chân pin.

GDDR5 sử dụng hệ thống bus dữ liệu dạng P2P, nạp đơn để tối ưu hóa hiệu năng. Các chip GDDR5 luôn được hàn xuống bo mạch PCB thay vì lắp trên thanh DIMM. Mỗi chip nhớ hỗ trợ 2 chế độ normal x32 hoặc clamshell x16. Ở chế độ x16, bus dữ liệu được chia thành 2 bus rộng 16-bit định hướng độc lập đến mỗi chip nhớ. Các chân pin đảm nhận địa chỉ và lệnh sẽ được chia sẻ dữ liệu giữa 2 chip nhớ trong khi vẫn giữ nguyên số lượng chân pin I/O tại vi điều khiển bộ nhớ.

GDDR5 hỗ trợ giao thức chuỗi chuẩn bị và cân chỉnh thời gian (interface training sequence) nhằm đảm bảo chip nhớ hoạt động với biên độ thời gian rộng nhất đối với mọi tín hiệu truy xuất. Quá trình chuẩn bị và cân chỉnh được thực hiện bởi vi điều khiển bộ nhớ bao gồm các bước khởi động (power-up), cân chỉnh địa chỉ, cân chỉnh xung nhịp WCK-CK, cân chỉnh xung nhịp đọc và ghi. Do GDDR5X sử dụng giao thức và chuỗi chuẩn bị/cân chỉnh tín hiệu tương tự GDDR5 nên các nhà phát triển chip có thể điều chỉnh vi điều khiển tương ứng với bộ nhớ mới.

Mặc dù theo ước lượng của Hiệp hội JEDEC, GDDR5X sẽ có tốc độ truyền tải dữ liệu từ 10 đến 14 Gbps/pin nhưng Micron tin rằng tốc độ này có thể đạt đến 16 Gbps. Nếu chip GDDR5X được thiết lập 256-bit, chạy ở tốc độ 14 Gbps thì tổng băng thông bộ nhớ có thể lên đến 448 GB/s, chỉ thấp hơn 12,5% so với băng thông của bộ nhớ HBM hiện đang được dùng trên card đồ họa AMD Fury X.

Cải tiến về dung lượng:

Không chỉ hiệu năng, các nhà phát triển cũng muốn tăng dung lượng của bộ nhớ GDDR5X để có thể xuất hiện trên nhiều thiết bị hơn không chỉ card đồ họa như máy chơi game console, thiết bị mạng, …

Trở lại với GDDR5, các chip nhớ thường được thiết lập theo dung lượng 512 Mb, 1 Gb, 2 Gb, 4 Gb và 8 Gb. Cần lưu ý chip nhớ (memory chip) là thành phần thấp nhất của bộ nhớ, chúng là các IC tạo nên mỗi mô-đun nhớ (memory module) và đơn vị đo mật độ của chip nhớ là bit. Một mô-đun nhớ sẽ có nhiều chip nhớ.

Trong khi đó, GDDR5X đưa ra các thiết lập gồm 4 Gb, 6 Gb, 8 Gb, 12 GB và 16 Gb. Thông thường, ngành công nghiệp DRAM có xu hướng tăng gấp đôi dung lượng của chip nhớ vì yếu tố kinh tế và các vấn đề kỹ thuật. Tuy nhiên, với GDDR5X thì các nhà sản xuất quyết định thông qua các thiết lập SGRAM với các mức dung lượng "lạ" là 6 Gb và 12 Gb.

Trên thiết bị di động dùng RAM LPDDR, các mức dung lượng chip nhớ như 3 Gb, 6 Gb hay 12 Gb thường được dùng để đạt độ linh hoạt về thiết lập bộ nhớ tối đa. Và các nhà sản xuất bộ nhớ đồ họa cũng muốn khai thác sự linh hoạt này. Một chip GDDR5X với dung lượng 16 Gb sản xuất trên quy trình 20 nm hoặc 16/18 nm sẽ có kích thước đế chip (die size) lớn hơn, do đó chi phí sản xuất sẽ cao hơn. Tuy nhiên, kích thước và chi phí của một chip nhớ DRAM 12 Gb được cho là rẻ hơn và mức dung lượng này có thể phục vụ cho nhiều ứng dụng trong nhiều phân khúc thị trường hơn.

Cũng như GDDR5, chuẩn GDDR5X cũng hỗ trợ hoàn toàn chế độ clamshell (x16) bên cạnh chế độ normal (x32). Ở chế độ x16 thì bus dữ liệu được chia thành 2 bus với độ rộng 16-bit và được định hướng độc lập đến mỗi chip nhớ. Đây là một phương pháp thiết lập nhằm tăng gấp đôi mật độ bộ nhớ trong kênh, cũng giống như việc chúng ta gắn thêm các thành RAM DIMM vào máy tính để chạy kênh đôi. Ở chế độ x32 thì tất cả các pin truy xuất dữ liệu tốc độ cao và chân pin WCK sẽ được định hướng điểm đến điểm (P2P). Trong khi đó ở chế độ x16 thì tất cả các pin truy xuất tốc độ cao và WCK được định hướng đến 2 chip nhớ hay điểm đến 2 điểm (P22P) trong khi vẫn giữ nguyên số lượng chân pin truy xuất I/O tại vi điều khiển bộ nhớ là 16 pin. Cách thiết lập này không ảnh hưởng đến băng thông hệ thống nhưng cho phép tăng gấp đôi số lượng thành phần bộ nhớ trên mỗi kênh. Như vậy về mặt lý thuyết, các nhà sản xuất có thể tạo ra một chiếc card đồ họa với bộ nhớ 64 GB GDDR5X bằng việc sử dụng một GPU hỗ trợ bus nhớ 512-bit và 32 chip nhớ GDDR5X dung lượng 16 Gb.

Dung lượng không bình thường của chip nhớ GDDR5X sẽ đáp ứng nhu cầu của nhiều phân khúc thị trường bao gồm card đồ họa, HPC, máy chơi game console, … Tuy nhiên, cũng cần lưu ý là đối thủ hàng đầu của GDDR5X là HBM2 có thể mang lại nhiều lợi thế, đặc biệt là ở phân khúc card đồ họa cao cấp với những chiếc máy tính đòi hỏi hiệu năng xử lý cao (HPC).

Cải tiến về mức tiêu thụ điện năng:

Điện năng tiêu thụ và tản nhiệt là yếu tố chính tác động đến hiệu năng tính toán. Khi phát triển chuẩn GDDR5X thì các nhà sản xuất cũng đã tích hợp nhiều giải pháp để giảm mức tiêu thụ điện. Điện áp nguồn (Vdd) và điện áp I/O (Vddq) đã được giảm từ 1,5 V (trên các thiết bị dùng chip nhớ GDDR5 cao cấp) xuống còn 1,35 V. Việc cắt giảm điện áp Vdd và Vddq giúp giảm mức tiêu thụ điện tổng thể của chip nhớ mới đến 10%, một rất quan trọng đối với các thiết bị hiệu năng cao và thiết bị di động.

Bên cạnh đó, GDDR5X còn tích hợp tính năng điều khiển cảm biến nhiệt độ theo tốc độ làm tươi - một công nghệ giúp tối ưu hóa mức tiêu thụ điện năng trong một số tình huống sử dụng nhất định. Nhiều tính năng khác về xung nhịp, về tỉ lệ làm tươi ở các trạng thái hoạt động cũng được tối ưu hóa nhằm thu hẹp mức tiêu thụ điện năng.

Nhờ điện áp thấp vào nhiều tính năng cải tiến, mức tiêu thụ điện sẽ thấp hơn so với những chip nhớ GDDR5 với cùng xung nhịp. Tuy nhiên, nếu nói về tốc độ truyền tải dữ liệu của GDDR5X thì mức tiêu thụ điện năng của thế hệ chip này có thể tương được hoặc cao hơn đôi chút so với GDDR5 theo Micron. Công ty cho biết mức tiêu thụ điện năng của GDDR5X vào khoảng 2 đế 2,5 W/thành phần DRAM và từ 10 đến 30 W/toàn bo mạch. Mặc dù có mức tiêu thụ điện năng ngang bằng và thậm chí là cao hơn nhưng GDDR5X vẫn được xem là tiết kiệm điện năng hơn dựa trên hiệu năng mà nó mang lại so với GDDR5. Nếu AMD hay Nvidia có thể tạo ra những card đồ họa mới dùng bộ nhớ GDDR5X và đạt được tốc độ truyền tải dữ liệu đến 14 Gb/s thì họ có thể tăng gấp đôi băng thông bộ nhớ của các vi xử lý đồ họa so với GDDR5 mà không làm tăng điện năng tiêu thụ.

Ứng dụng:

Sự chuyển dịch từ GDDR5X sang GDDR5 không phải là một sự thay đổi hoàn toàn giống như từ GDDR5 sang HBM. Mặc dù vậy, để chuyển từ GDDR5 sang GDDR5X thì các nhà sản xuất cùng phải mất khá nhiều thời gian, giống như lần chuyển dịch từ GDDR3/GDDR4 sang GDDR5 nhiều năm trước.

Vấn đề nằm ở chỗ GDDR5X sử dụng kĩ thuật đóng gói BGA-190 với 190 chân pin trong khi GDDR5 dùng kĩ thuật BGA-170. Do đó, GDDR5X không tương thích về số lượng chân pin với các chip nhớ GDDR5 cũng như các bo mạch dùng chip nhớ GDDR5 hiện tại. Mặc dù GDDR5X sẽ đòi hỏi bo mạch mới và vi điều khiển mới nhưng cách phát triển không khác gì với GDDR5; các tính năng chuẩn bị chuỗi tín hiệu, xử lý tín hiệu, soát lỗi, giao thức đều như nhau và thậm chí là các chế độ thiết lập normal hay clamshell tốc độ cao cũng được GDDR5X hỗ trợ không khác gì GDDR5. Ngoài ra, kiểu đóng gói BGA cũng không đắt bởi nó không cần đến các đoạn bán dẫn định hướng giữa các chân tiếp xúc và cũng không sử dụng kĩ thuật xếp lớp chân chip như HBM. Do đó, GDDR5X sẽ không quá đắt nếu xét về khía cạnh nghiên cứu và phát triển cũng như sản xuất.

Theo: Micron; Wikipedia [1], [2], AnandTech, và nhiều nguồn khác

Long_thànH

ĐẠI BÀNG

8 năm

Ra dòng mới chỉ hóng nó giảm giá dòng cũ , nhưng nvidia thì luôn có cái trò khai tử dòng cũ để bán dòng mới , còn amd thì lại có cái trò đổi tên dòng cũ để bán như dòng mới :p kẻ cắp bà già gặp nhau 😁

SilverA

TÍCH CỰC

@bibinguyen Mạnh hơn thì có chứ x2 thì không có đâu bác! 😁 Kể cả CPU cũng thế. Ra dòng mới giá vẫn tương đương dòng cũ nhưng thường chỉ hơn 1 chút về hiệu năng, tiêu thụ điện,... thôi. Vài đời mới chênh nhau nhiều.
Chứ nếu nó x2 thì em mua em GT730 chứ không mua GTX650 làm gì vì 730 gấp 2 630 tức là gần gấp đôi 650 rùi. Hoặc máu thì làm hẳn 950 do gấp mấy lần 690 nếu tính theo ý kiến của bác! :D

bomduc

VIP

@Long_thànH =))

bibinguyen

@SilverA Ở đây em nói ở 2 cái con này nè, x2 là tính theo sli khi chạy đó bác.
Chứ các đời trước nó chỉ nằm giữa 2 con cũ.

ailavipnhat35

Trứng

Thông tin chi tiết và bổ ích quá (Y)

khải đập chai

mình thì chỉ chơi dc gt730. đợi gtx 950 còn 3tr hốt về xài. chứ mấy cin này chỉ dành cho pc khủng mấy chục củ trở lên con nhà nghèo ko dám mơ

Người mới vô

GÀ

Vâng và em không hiểu

congthanhgiong

CAO CẤP

nhìn thấy ham mà thấy hao điện quá thấy sợ, ko rõ nếu chỉ lướt web, làm việc cơ bản thì điện năng xài nhiêu nhỉ, nếu cứ load trên 100 w thì thôi nghỉ.

khi nào gpu xài điện năng như cpu thì kêu. 🆒

Metalcore0310

@LuckyZu Dùng 1 màn hình mà cắm cáp vào VGA rời rồi thì làm sao chọn onboard vậy bác?

Ng.Q.Khánh

@Metalcore0310 bác vào phần setting của card VGA mà chỉnh , em ko xài card của ADM nên ko biết chứ Nvidia (Nvidia control panel) thì nó có 3 chế độ rõ ràng :
1.Auto (nó tự chọn chạy VGA hoặc Onboard tùy tác vụ nặng hay nhẹ)
2.luôn luôn chạy card rời
3.luôn luôn chạy onboard

cavaldryg

@congthanhgiong Đó là cả dàn máy chứ đâu mỗi con VGA. full load mà 500W chắc đang dùng i7 + 970 + Ram + HDD + SSD + fans case + đèn led rồi. Chưa kể màn hình tiêu thụ điện riêng khoảng 30~50W tùy màn.
Còn dùng AMD R9 2XX hay 3XX chắc phải thêm 100 tới 150W tùy card

@LuckyZu Thank bác. Mình đang xài 2 con, 1 con GTX-950 & 1 con GT-430 dùng xử lý PhysX. Hướng dẫn trên video là dành cho lap, mình xài PC thì chắc cũng ko cần quan tâm lắm 😁

traisaigon

Sao có thằng ss nửa ta? Băng thông gì kinh vậy

bk9sw

@traisaigon samsung nó sản xuất chip nhớ bạn ạ, cái thị trường này có Samsung, SK Hynix, Qimonda, Micron và nhiều thằng nhỏ khác

khoado93

@traisaigon Samsung sản xuất chip nhớ giờ top 1 thế giới đấy :v Mấy hãng Ram lẫn Đồ họa giờ xài chip nhớ của Samsung khá nhiều.

NguyễnDuyĐạt

ôi mẹ ơi
Nhức não quá
Chỉ biết là nó mạnh hơn GDDR5 dc rồi

kungfu9

bỏ qua...thua hbm...chỉ được cái rẻ hơn

Do Xuan Tuong

@kungfu9 Vậy chờ 1080 Ti sẽ có HBM2 đây.

fu09fjtnhj

99,999999% member tinhte ko hiểu đâu 😁

lanehacker7294

nghe nvidia quảng cáo gtx 1070 mạnh ngang gtx titan không biet có phải thật không? chứ với cái giá 400usd thì phải xúc ngay và luôn mất, để lần đầu hiểu cảm giác pc master race là như thế nào. Trc giờ toàn chiến game 25 fps 😔(

Razor11

@lanehacker7294 Nó thay thế GTX 970 đó, GTX 1080 mạnh hơn 2 con GTX 980 nên mình nghĩ GTX 1070 mạnh hơn Titan cũng đúng

h3141592653

@lanehacker7294 Hôm trc xúc dx em 960 mơ ước gần 7 củ về, giờ nó ra con 400$ mạnh bằng TitanX, kể cũng nhọ thật.

fanclubcongnghe

Nhớ thời pentum 4 sd ram 2 buss 333,667

Giltine

Chờ polaris 14nm hbm2 của Amd cạnh tranh sao vs nvidia

hieupy89

có thể vì titan cách 2 đời rồi 980 đã hơn titan. Chờ nó ra và xem review thôi

nvidia đổi tên dòng cũ thành dòng mới cũng nhiều đấy nhất là mấy dòng cấp thấp nhưng vẫn ko bằng AMD từ Rx 2xx lên 3xx

[HD]YêU cÔnG NgHệ

Đọc 1 đoạn chả hiểu gì nữa. chốt lại là nó tăng tốc độ đọc/ ghi. giảm điện tiêu thụ. tăng dung lượng chip nhớ! mà thằng sam nó chơi 1TB/s lận

(*"Hương-Giang-Trang"*)

em vẫn mơ con gtx 950 mà ko đủ lúa. chắc chờ lên thế hệ pasca này may ra đủ $ thì chắc khi đó gtx 1059 hoặc 1060 ti mong là em sẽ mua được😔

Cuong Nb

@hoangphithanh Không mua được con gtx 950 thì mua sang dòng của AmD cho rẻ 😁
Lựa chọn này xem sao :D

Không thích thì vẫn chơi nvidia dòng gtx750ti :D

@Cuong Nb thanks bác an ủi em . nói thật giờ em đang trăm công nghìn việc của nợ mà em lại thất nghiệp nữa chắc hẹn em gtx sang năm quá:D:D

wallhisg

Mod dịch vụng quá, chắc không phải dân nhà nghề rồi. Kiến thức càng sâu đòi hỏi nhiều thuật ngữ chuyển ngành. Mấy cái này nên dịch đơn giản và thoát ý. Người đọc phần lớn không làm về hardware hoặc embedded system. Xem mấy cái hình mình chỉ lờ đờ hiểu o_O
Mình góp ý vậy.

IIPII

cảm giác mong chờ của một người đang xài 7950 6700k 😆

Bộ nhớ GDDR5X khác gì với GDDR5 và hiệu năng được cải thiện như thế nào?

CHỦ ĐỀ TƯƠNG TỰ

“Miếng RAM" chuẩn CAMM của Dell được nhiều hãng ủng hộ, có thể thay thế SO-DIMM

YMTC đối mặt với nguy cơ phải rời bỏ thị trường sản xuất chip nhớ vào năm 2024

Ổ SSD 8 TB của Phison đạt chứng nhận NASA, chuẩn bị cho trung tâm dữ liệu đặt trên Mặt Trăng

YMTC lại đi trước Micron với 3D NAND 232 lớp dùng giao tiếp 2400 MT/s