TTBC 2025

TTBC 2025


Apple ra mắt Apple M5: băng thông 153GB/s, mỗi nhân GPU tích hợp thêm Neural Accelerator để xử lý AI

Pnghuy
15/10/2025 13:40Phản hồi: 27
EditEdit
Apple ra mắt Apple M5: băng thông 153GB/s, mỗi nhân GPU tích hợp thêm Neural Accelerator để xử lý AI
Đúng như những gì đã teaser trước đó, Apple chính thức giới thiệu thế hệ Apple Silicon mới nhất dành cho iPad và máy Mac, bắt đầu từ con chip Apple M5, thế hệ chip xử lý M-series mới nhất được sản xuất trên tiến trình 3nm thế hệ 3. Apple M5 sẽ mang lại hiệu suất và khả năng vượt trội cho MacBook Pro, iPad Pro và Apple Vision Pro mới.

“M5 đánh dấu bước nhảy vọt lớn tiếp theo về hiệu suất AI cho Apple silicon,” Johny Srouji, phó chủ tịch cấp cao về Công nghệ Phần cứng của Apple, cho biết.

GPU hoàn toàn mới tối ưu cho AI và đồ họa


Apple-M5-chip-251015-inline.jpg.large-2x.jpg
Điểm khác biệt lớn nhất của GPU trong Apple M5 so với các thế hệ trước đó là Apple tích hợp vào mỗi nhân GPU một bộ tăng tốc AI chuyên dụng (Neural Accelerator). Điều này mang lại hiệu năng tính toán GPU cao gấp hơn 4 lần so với Apple M4 và hiệu suất AI cao gấp hơn 6 lần so với Apple M1.

Về sức mạnh đồ họa thuần túy, GPU 10 nhân của Apple M5 cũng mạnh hơn đáng kể so với M4. Apple cho biết M5 đạt hiệu năng đồ họa cao hơn khoảng 30% so với M4 trong các tác vụ raster 3D thông thường. Đặc biệt, M5 tích hợp engine dò tia (ray tracing) thế hệ 3, cải thiện tới 45% hiệu năng trong các ứng dụng/game dùng ray tracing so với M4.


Điều này đồng nghĩa các khung hình trong game sẽ mượt mà hơn, ánh sáng và bóng đổ được xử lý thực hơn. Apple cũng nâng cấp cơ chế “dynamic caching” lên thế hệ thứ hai, giúp GPU phân bổ bộ nhớ đệm thông minh hơn tùy theo khối lượng công việc, từ đó tối ưu băng thông và giảm độ trễ.

Apple-M5-gaming-Cyberpunk-2077-Ultimate-Edition-251015-big.jpg.large-2x.jpg
Kết hợp các cải tiến này, M5 mang lại trải nghiệm tốt hơn cho cả game thủ và nhà sáng tạo nội dung: ví dụ như chơi các tựa game AAA (như Cyberpunk 2077 bản cho Mac) ở thiết lập đồ họa cao hay render mô hình 3D phức tạp với thời gian rút ngắn đáng kể.

Quan trọng hơn, GPU của APple M5 được tối ưu tích hợp với phần mềm Apple. Các ứng dụng sử dụng framework như Metal, Core ML sẽ tự động tận dụng được sức mạnh tăng thêm của GPU mà không cần chỉnh sửa nhiều. Các nhà phát triển thậm chí có thể lập trình trực tiếp vào các Neural Accelerator trên GPU thông qua API Metal 4 (Tensor API) để khai thác tối đa năng lực AI của chip. Có thể nói, kiến trúc GPU mới giúp M5 trở thành một trong những GPU tích hợp mạnh nhất trong thế giới máy tính cá nhân, đủ sức cạnh tranh với nhiều GPU rời tầm trung, đồng thời mở ra hướng đi mới khi kết hợp khả năng đồ họa và AI trên cùng một kiến trúc một cách liền mạch.

CPU của Apple M5


Apple M5 trang bị CPU với tối đa 10 nhân xử lý, bao gồm 4 nhân hiệu năng cao (performance cores) và 6 nhân tiết kiệm năng lượng (efficiency cores). Cấu hình này tương tự thế hệ M4 trước đó về số nhân, nhưng Apple khẳng định M5 sử dụng vi kiến trúc CPU tiên tiến hơn, giúp đạt tốc độ xung nhịp cao hơn và hiệu quả hơn. Thực tế, Apple tuyên bố các nhân hiệu năng cao trên M5 là “những nhân CPU nhanh nhất thế giới” tại thời điểm ra mắt.

Sự kết hợp giữa 4 nhân hiệu năng cao và 6 nhân tiết kiệm điện cho phép M5 tối ưu đa nhiệm: các tác vụ nặng sẽ chạy trên nhân hiệu năng, trong khi các tác vụ nền nhẹ hơn sẽ giao cho nhân tiết kiệm điện nhằm giảm tiêu thụ năng lượng.

Về hiệu năng CPU, Apple M5 cải thiện cả hiệu năng đơn nhân lẫn đa nhân so với M4. Theo thông cáo báo chí của Apple, CPU Apple M5 cho hiệu năng đa luồng cao hơn khoảng 15% so với M4. Ngoài ra, Apple cũng tăng kích thước bộ nhớ đệm (cache) ở các cấp độ trong những thế hệ gần đây, giúp cải thiện tốc độ truy xuất dữ liệu cho CPU.

Nhìn chung, kiến trúc CPU của M5 tiếp tục định hướng tương tự từ thế hệ M1 cho đến M4, nhưng với thế hệ vi kiến trúc mới nhất từ dòng chip A-series (dựa trên A19) và tối ưu hóa cho hiệu năng cao hơn nữa. Sự cải tiến này đảm bảo rằng M5 có thể xử lý nhanh hơn các tác vụ nặng như biên dịch code, xử lý dữ liệu lớn và vẫn duy trì độ mượt mà trong đa nhiệm thường ngày.

Quảng cáo



Xử lý tác vụ AI và Neural Engine


Xử lý AI là trọng tâm nổi bật trong thiết kế Apple M5. Con chip này được Apple quảng bá là “bước nhảy vọt lớn về hiệu năng AI trên Apple silicon”. Có ba thành phần chính đóng góp vào sức mạnh AI của M5: Neural Accelerator tích hợp trong GPU, Neural Engine 16 nhân thế hệ mới và cải thiện băng thông bộ nhớ để phục vụ các mô hình AI lớn.

Về cơ bản, Apple đã đưa các khối tính toán tương tự Neural Engine vào trong GPU, cho phép GPU xử lý trực tiếp các thuật toán AI song song với tác vụ đồ họa. Kết quả là, như đã nêu, năng lực tính toán AI của GPU M5 cao hơn 4 lần so với M4.

Apple-M5-Draw-Things-251015-big.jpg.large-2x.jpg
Trong thực tiễn, điều này có nghĩa những công việc như chạy mạng neuron sâu, suy luận mô hình học máy sẽ chạy nhanh hơn rõ rệt trên M5 khi tận dụng GPU. Ví dụ, Apple cho biết các ứng dụng như Draw Things (chạy mô hình diffusion để tạo hình ảnh) hay chạy LLM cục bộ qua nền tảng webAI sẽ được tăng tốc đáng kể trên M5 so với thế hệ trước. Thay vì phải dựa hoàn toàn vào CPU hoặc Neural Engine như trước, giờ đây GPU của Apple M5 có thể “gánh” một phần lớn khối lượng tính toán AI, giúp phân bổ công việc hiệu quả hơn trên toàn chip.

Neural Engine 16 nhân trên Apple M5 cũng được cải tiến cho tốc độ cao hơn và hiệu quả năng lượng tốt hơn. Neural Engine (NE) là bộ xử lý AI chuyên dụng đã có từ các chip A-series và M-series trước, nó có thể thực hiện 5-10 nghìn tỷ phép tính AI mỗi giây. Trên Apple M5, Apple vẫn giữ cấu hình 16 nhân NE, nhưng tối ưu về vi kiến trúc để tăng thông lượng và giảm độ trễ. Mặc dù Apple không công bố con số TOPS cụ thể, ta có thể tham khảo: chip A17 Pro (2023, 3nm thế hệ đầu) có NE 16 nhân đạt khoảng 35 TOPS rồi, nên NE trên M5 (dựa trên thế hệ A19 2025) có thể còn cao hơn nữa.

Apple-M5-Writing-Tools-251015-big.jpg.large-2x.jpg

Quảng cáo


Apple nhấn mạnh NE mới giúp các tính năng AI trên thiết bị chạy nhanh và tiết kiệm điện đáng kể – ví dụ trên Apple Vision Pro, tính năng tạo môi trường 3D từ ảnh 2D hay tạo persona ảo đều chạy mượt mà hơn nhờ Neural Engine nhanh hơn. Bên cạnh đó, Apple Intelligence (bộ tính năng AI on-device của macOS) cũng được hưởng lợi: các công cụ như Image Playground phản hồi nhanh hơn và hiệu năng các mô hình AI tích hợp hệ thống được cải thiện nhờ NE mạnh cùng bộ nhớ hợp nhất lớn.

Băng thông bộ nhớ 153GB/s


Apple-M5-LM-Studio-251015-big.jpg.large-2x.jpg
Một yếu tố quan trọng nữa cho AI là băng thông và dung lượng bộ nhớ. M5 có kiến trúc bộ nhớ hợp nhất (unified memory) lên đến 153 GB/s băng thông, cho phép truyền dữ liệu cực nhanh giữa CPU, GPU, NE và các bộ tăng tốc AI. Apple chỉ ra rằng nhờ bộ nhớ hợp nhất tốc độ cao này, các thiết bị như MacBook Pro, iPad Pro, Vision Pro có thể chạy những mô hình AI rất lớn hoàn toàn tại chỗ (on-device) thay vì phải phụ thuộc đám mây.

Ngoài ra, Apple M5 cũng vẫn hỗ trợ tối đa 32GB RAM trong MacBook Pro 14-inch giống MacBook Pro 14-inch M4. Với 32GB RAM, người dùng có thể tải và chạy các mô hình ngôn ngữ lớn hay mô hình thị giác có hàng chục tỷ tham số ngay trên máy, phục vụ các tác vụ AI như chatbot, phân tích dữ liệu, dựng hình ảnh với độ trễ thấp và đảm bảo riêng tư dữ liệu. Apple cũng thiết kế để cả GPU Neural Accelerator lẫn Neural Engine đều có thể truy cập vào vùng nhớ hợp nhất này một cách hiệu quả, tránh tình trạng nghẽn băng thông.

Băng thông tăng được một phần nhờ việc Apple sử dụng chuẩn LPDDR5X thế hệ mới với tốc độ cao hơn. Chẳng hạn, nếu trên Apple M4 dùng LPDDR5 6400MT/s, thì trên Apple M5 nhiều khả năng chuyển sang LPDDR5X ở bus ~8500MT/s, kết hợp bus 128-bit để đạt >150GB/s. Băng thông bộ nhớ lớn đặc biệt quan trọng cho các tác vụ đồ họa độ phân giải cao, xử lý video 8K, hay huấn luyện mô hình machine learning – những công việc đòi hỏi di chuyển lượng dữ liệu khổng lồ mỗi giây.

Với 153GB/s, Apple M5 có thể đồng thời cung cấp dữ liệu cho CPU, GPU và Neural Engine một cách thông suốt mà không gây nghẽn cổ chai. Apple nhấn mạnh điều này cho phép chạy những mô hình AI rất lớn hoàn toàn trên thiết bị – các thành phần CPU/GPU/NE đều truy cập chung một vùng nhớ nhanh, giảm thiểu việc sao chép dư thừa và trễ bộ nhớ.

Hỗ trợ SSD tốc độ nhanh hơn 2 lần


Bên cạnh RAM, SSD trên Apple M5 cũng được Apple nâng cấp. Theo thông tin từ Apple, MacBook Pro 14-inch M5 sử dụng công nghệ lưu trữ mới hỗ trợ tốc độ SSD nhanh hơn gấp 2 lần thế hệ trước. Điều này ngụ ý Apple có thể đã chuyển sang sử dụng NAND flash thế hệ mới hoặc nâng số kênh truy xuất trên controller. Tốc độ đọc có thể đạt ~6-7 GB/s (theo một số tiết lộ Apple đạt ~6,8 GB/s trên SSD M5). SSD nhanh giúp bộ nhớ ảo (swap) hoạt động hiệu quả hơn khi RAM đầy và tăng tốc các tác vụ như load project video, import/export file RAW lớn..

Về độ trễ (latency), việc xử lý AI ngay trên thiết bị với M5 giúp giảm mạnh độ trễ so với phải gửi lên đám mây. Apple nhấn mạnh tầm quan trọng của on-device AI: xử lý ngay tại “biên” (thiết bị cá nhân) vừa bảo mật thông tin người dùng, vừa phản hồi nhanh hơn. Chẳng hạn trên Vision Pro, Apple M5 kết hợp với chip phụ R1 xử lý theo dõi tay mắt để giảm mỗi ms trễ, nâng cao tính immersive (nhập vai) cho AR/VR. Trên MacBook, việc nhận diện giọng nói, gõ dự đoán, hay các hiệu ứng thông minh trong video call đều sẽ tức thì hơn nhờ khả năng AI thời gian thực của M5.

Cuối cùng, xét về năng lực tính toán AI tổng thể, Apple cho biết chip M5 mạnh hơn 4 lần hiệu năng tính toán AI (GPU+NE) so với Apple M4. Điều này đặt nền tảng cho những ứng dụng AI mới trên hệ sinh thái Apple. Các nhà phát triển có thể tận dụng framework Apple Foundation Models và Core ML để chạy mô hình một cách tối ưu trên phần cứng Apple M5.

Hiệu suất năng lượng và quản lý nhiệt


Trên MacBook Pro 14-inch mới, Apple quảng cáo thời lượng pin lên tới 24 giờ cho tác vụ xem video – một con số ấn tượng đối với laptop hiệu năng cao. Đây là mức tăng nhẹ so với thế hệ M4 trước đó, cho thấy M5 đã cải thiện được hiệu quả năng lượng.

Theo Apple, các nhân CPU tiết kiệm điện trên M5 rất hiệu quả trong xử lý tác vụ nền, giúp tiết kiệm pin khi máy ở chế độ nhàn rỗi hoặc tải nhẹ. Đồng thời, ở tải nặng, M5 vẫn duy trì hiệu năng cao với mức tiêu thụ điện thấp hơn chip x86 cạnh tranh, điều này giúp máy MacBook Pro mới ít bị nóng và không cần quạt chạy tốc độ cao thường xuyên.

Với xu hướng AI ngày càng phổ biến, Apple M5 được xem như bước chuẩn bị quan trọng của Apple để thiết bị Mac, iPad có thể đảm đương các tác vụ AI phức tạp (từ sáng tạo nội dung bằng AI, phân tích dữ liệu thông minh đến trải nghiệm AR/VR AI hỗ trợ) hoàn toàn cục bộ.
27 bình luận

Xu hướng

Chả có gì mới mỗi thứ nhỏ giọt, chủ yếu nâng cấp điểm nhấn cái chip AI với gpu, tóm lại M4 rẻ hơn thì vẫn đáng tiền hơn.
"Cpu tăng 15%. GPU tăng 45%"
@nguyenhuynhdinhtan98 Cho nên mấy cái cửa hàng còn hàng tồn mà lên clip nói "không nhất thiết phải mua dòng mới nhất... blad blad blad..." mà giá chỉ lệch có tầm 10% so với dòng mới nhất thì thôi dẹp, điển hình là Think... à mà thôi.
@Nguyễn Đình Minh Thi nó đang ôm hàng đó nên mới văn vở như thế, đặt biệt mấy con mac 8gb ram rớt thảm mà không ai mua. Cái care tụi nó cũng bịp , phải có giấy mới bảo hành được, hàng đó làm gì có giấy. Kênh review việt unsub hết rồi ngày càng pr nhãn hàng quá rõ. Kênh tinh tướng này cũng thế , bài thì chả có chất lượng, copy thì dịch không chịu chỉnh văn phong.
@nguyenhuynhdinhtan98 GPU cải thiện nhiều, chắc Apple hướng tới gaming nhiều hơn rồi
@A0kiji Giờ xu hướng AI mà, mà AI trên laptop làm gì đọ nổi PC chạy local. Ăn ram nữa, thằng apple nó tăng 8gb ram đã ối tiền rồi trong khi đó con pc 64gb ram chạy local còn full. Nên laptop thì AI cloud cho lẹ. Đời nào tăng core cpu giá không đổi là đời đó ngon.
qwarl
TÍCH CỰC
2 tháng
ủa ko để ý lắm dòng M của apple nhưng em nhớ hồi lâu rồi có thấy mn hay nói là băng thông unified memory đã 200GB/s rồi mà nhỉ. hay em nhớ nhầm qua cái khác ta

với cả 32gb thì chạy local mô hình gì đc nhỉ. mấy mô hình 2 30b tham số có 16gb là đủ mà lên nữa hình như 100b đổ lên có vừa 32gb ko
@qwarl 200GB/s là dòng M Pro và cao hơn là M Max bạn ơi
Mạnh nhưng với mình chưa cần thiết để bỏ 2 con M2 pro để lên M5
@smoc123 M3 cũng bỏ qua luôn chứ nói gì M2 Pro bạn =))
bomduc
ĐẠI BÀNG
2 tháng
@Pnghuy Dành cho những ai nâng cấp máy thôi
Cho người dùng phổ thông mà cứ nói mấy cái cao siêu làm gì, người ta cần kết quả cuối cùng phải tốt. Ví dụ sửa ảnh tạo sinh AI thì cần phải có dữ liệu lớn, có sever. Chứ không lẽ bắt người dùng chuẩn bị 1 tỷ tham số để chạy trên máy vì 2 chữ bảo mật viển vông.
@Ngô@ Nhiều người dùng iPad Pro để chứa và làm việc với dữ liệu tài chính, kinh doanh, khoa học mà bạn. Trước đây họ ngại dùng AI trên mây chỉnh tài liệu vì không biết bên cung cấp có đọc lén không thì bây giờ có thể làm ngay trong máy yên tâm hơn hẳn.
@Carl vấn đề ra nó không có tính chính xác thì dùng cũng như không.
Băng thông cực nhanh chuyên AI 153GB/s.

Nhìn sang 3060 laptop ra đời cách đây gần 5 năm có băng thông 336GB/s. Cười và đi ra.
@Penn giật tít? chỗ nào mình giật? Đây là bài thông tin từ Apple, mình có chém các con số đó ra đâu mà kêu giật tít? Muốn check hàng check gì thì đợi có máy rồi check chứ. Còn so sánh thì mình đã có bài test con gpt-oss-20b giữa M3 với RTX 5060 luôn rồi, bạn có thể xem lại bài đó xem token/sec con nào ngon hơn.
@devil214119 bây giờ bạn có con nào ngang giá MacBook Air M4 hay MacBook Pro M5 thì cứ mang ra so sánh, hoặc mang qua đây mình test cho bạn xem, băng thông là 1 phần thôi. Thực tế thì Ryzen AI 9 HX 370 mình đã test gpt-oss-20b so với MacBook Air M3 (mình có ở thời điểm đó) thì nó ngon ngang ngửa nhau. Băng thông lớn ở đây là so với thế hệ trước, chứ có nói 153GB/s là ngon nhất đâu.
@Pnghuy


Không kiếm ra Youtube cho 3060 laptop, thôi dùng đỡ 4060 laptop với bandwidth thấp hơn luôn nhé, bù lại so hẳn với M4 bản 10 core. 4060 nó gấp đôi token/sec luôn.

Các mô hình AI mà chạy local trên laptop thì toàn mô hình bé, sức xử lý của Nvidia laptop GPU hoặc chip M của làm được dễ dàng, nhưng băng thông thấp là cái khiến thằng Apple mãi luôn đi sau ngay cả con GPU phổ thông trên laptop của Nvidia. Nên tôi rất ngứa khi thằng Apple bốc phét về con M bản base của nó. Như kiểu ông đi BMW xong có thằng Kia nó bảo tao ra con Morning mới đua xe ngon lắm 😆

Và tôi cũng đã nói là không ai trách ông, tôi đang lên án thằng Apple chém gió cơ mà, ông cứ bình tĩnh. Ai cũng biết ông chỉ đưa lại lời chém gió của nó thôi.
@Pnghuy mình dùng từ "to" chứ không phải ngon. "To" ở đây tức là 153 Gb/s là chậm, nghẽn cổ chai thường xuyên luôn. Còn băng thông bạn bảo 1 phần thì mình xin nói là 1 phần lớn nhé. Bây giờ GPU bạn tính toán nhanh nhưng bạn phải đợi input đầu vào do băng thông kém và trả về cho đầu ra cũng do băng thông kém thì thế nào. Hiệu quả quyết định bởi thành phần chậm nhất. Còn bạn dùng gpt-oss-20b để test thì chưa có góc nhìn khách quan đâu. gpt-oss không biết dùng kiến trúc gì nhưng rate rất cao, kể cả bản 120b mình dùng qua còn token rate nhanh hơn gemma3 27b. Bạn dùng 1 công việc nhẹ để test thì đương nhiên 2 con đều dư sức. Hãy dùng nhiều loại khác nhau từ nhẹ đến nặng thì mới ra kết quả khách quan hơn nhé
RAM bé thì AI lỏ
Hóng macbook air m5 màn hình 120hz
Gấp GPU NE 4 lần thì kinh rồi.

Xu hướng

Bài mới








  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2025 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: 70 Bà Huyện Thanh Quan, P. Xuân Hoà, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép cung cấp dịch vụ MXH số 134/GP-BVHTTDL, Ký ngày: 30/09/2025