Apple âm thầm phát triển chip AI server “Baltra”, tối ưu cho suy luận để phục vụ Apple Intelligence
Apple từ lâu theo đuổi chiến lược tự cung tưj cấp, tự thiết kế hầu hết vi xử lý trong hệ sinh thái của mình, từ A‑series trên iPhone, M‑series trên Mac đến chip cho Apple Watch. “Baltra” được xem là bước mở rộng chiến lược này lên tầng data center, giúp Apple kiểm soát tốt hơn chi phí, hiệu năng và bảo mật cho các dịch vụ AI.
Theo nguồn tin, Baltra là chip AI dành cho server, được phát triển nhằm xử lý các tác vụ suy luận (inference) cho Apple Intelligence chạy trên cloud, thay vì dùng để huấn luyện các mô hình nền tảng (foundation model) cỡ lớn.
Thay vì tự xây cụm siêu máy tính huấn luyện mô hình hàng nghìn tỷ tham số, Apple hiện đang dựa trên thỏa thuận với Google, sử dụng biến thể tùy biến của Gemini 3 nghìn tỷ tham số để cung cấp các tính năng Apple Intelligence.
Thoả thuận này được cho là có giá trị khoảng 1 tỷ USD mỗi năm, qua đó Apple có thể tập trung vào việc tối ưu lớp suy luận – nơi trực tiếp xử lý yêu cầu của người dùng như soạn email, tóm tắt nội dung hay các tính năng thông minh trong hệ điều hành.
Baltra nhiều khả năng sẽ được sản xuất trên tiến trình TSMC N3E (3 nm cải tiến), với lộ trình triển khai thực tế vào khoảng năm 2027 nếu mọi việc diễn ra đúng kế hoạch.
Apple được cho là hợp tác với Broadcom cho phần kết nối mạng (networking), giúp cụm server AI đạt độ trễ thấp và băng thông cao giữa các chip, giảm phụ thuộc vào giải pháp hạ tầng hoàn chỉnh từ Nvidia.
Định hướng thiết kế Baltra theo phong cách “chip inference chuyên dụng”, ưu tiên:
• Độ trễ thấp để phản hồi nhanh các truy vấn người dùng.
• Thông lượng cao cho lượng yêu cầu song song lớn.
• Hỗ trợ mạnh cho các phép tính độ chính xác thấp như INT8, phù hợp với suy luận hơn là huấn luyện.
Một số thông tin rò rỉ còn gợi ý cấu trúc kiểu “GB300‑style”, với cụm nhiều die (ví dụ khoảng 64 chip) kết nối all‑to‑all, sử dụng bộ nhớ LPDDR băng thông lớn để cân bằng giữa hiệu năng và chi phí, thay vì cấu trúc GPU truyền thống.
Baltra bổ sung vào danh sách chip “cây nhà lá vườn” ngày càng dày đặc của Apple, bên cạnh A‑series, M‑series, modem C1 và các SoC dòng S cho Apple Watch.
Nếu thành công, Baltra sẽ giúp Apple không chỉ tự chủ về hiệu năng và chi phí cho Apple Intelligence trên cloud, mà còn mở đường cho những biến thể AI silicon khác, có thể xuất hiện trên các thiết bị đeo hoặc kính thông minh trong tương lai.
Nếu tham vọng lớn như vậy thì từ lãnh đạo cấp cao tới lính lác làm không hết việc luôn chứ đâu phải như thằng bán bóp sen nói nhân sự rời bỏ Apple vì mảng AI ì ạch.
Chuẩn bị định nghĩa lại AI chăng? Cầm cái iphone ko thấy tính năng AI mẹ nào đáng dùng. Cảm giác đúng chuẩn thế giới ngừng quay khi sài iphone là thật.
Apple âm thầm phát triển chip AI server “Baltra”, tối ưu cho suy luận để phục vụ Apple Intelligence
Apple từ lâu theo đuổi chiến lược tự cung tưj cấp, tự thiết kế hầu hết vi xử lý trong hệ sinh thái của mình, từ A‑series trên iPhone, M‑series trên Mac đến chip cho Apple Watch. “Baltra” được xem là bước mở rộng chiến lược này lên tầng data center, giúp Apple kiểm soát tốt hơn chi phí, hiệu năng và bảo mật cho các dịch vụ AI.
Theo nguồn tin, Baltra là chip AI dành cho server, được phát triển nhằm xử lý các tác vụ suy luận (inference) cho Apple Intelligence chạy trên cloud, thay vì dùng để huấn luyện các mô hình nền tảng (foundation model) cỡ lớn.
Thay vì tự xây cụm siêu máy tính huấn luyện mô hình hàng nghìn tỷ tham số, Apple hiện đang dựa trên thỏa thuận với Google, sử dụng biến thể tùy biến của Gemini 3 nghìn tỷ tham số để cung cấp các tính năng Apple Intelligence.
Thoả thuận này được cho là có giá trị khoảng 1 tỷ USD mỗi năm, qua đó Apple có thể tập trung vào việc tối ưu lớp suy luận – nơi trực tiếp xử lý yêu cầu của người dùng như soạn email, tóm tắt nội dung hay các tính năng thông minh trong hệ điều hành.
Baltra nhiều khả năng sẽ được sản xuất trên tiến trình TSMC N3E (3 nm cải tiến), với lộ trình triển khai thực tế vào khoảng năm 2027 nếu mọi việc diễn ra đúng kế hoạch.
Apple được cho là hợp tác với Broadcom cho phần kết nối mạng (networking), giúp cụm server AI đạt độ trễ thấp và băng thông cao giữa các chip, giảm phụ thuộc vào giải pháp hạ tầng hoàn chỉnh từ Nvidia.
Định hướng thiết kế Baltra theo phong cách “chip inference chuyên dụng”, ưu tiên:
• Độ trễ thấp để phản hồi nhanh các truy vấn người dùng.
• Thông lượng cao cho lượng yêu cầu song song lớn.
• Hỗ trợ mạnh cho các phép tính độ chính xác thấp như INT8, phù hợp với suy luận hơn là huấn luyện.
Một số thông tin rò rỉ còn gợi ý cấu trúc kiểu “GB300‑style”, với cụm nhiều die (ví dụ khoảng 64 chip) kết nối all‑to‑all, sử dụng bộ nhớ LPDDR băng thông lớn để cân bằng giữa hiệu năng và chi phí, thay vì cấu trúc GPU truyền thống.
Baltra bổ sung vào danh sách chip “cây nhà lá vườn” ngày càng dày đặc của Apple, bên cạnh A‑series, M‑series, modem C1 và các SoC dòng S cho Apple Watch.
Nếu thành công, Baltra sẽ giúp Apple không chỉ tự chủ về hiệu năng và chi phí cho Apple Intelligence trên cloud, mà còn mở đường cho những biến thể AI silicon khác, có thể xuất hiện trên các thiết bị đeo hoặc kính thông minh trong tương lai.
Chiều cao màn hình không khả dụng cho nội dung này. Vui lòng xoay dọc màn hình thiết bị.
Apple âm thầm phát triển chip AI server “Baltra”, tối ưu cho suy luận để phục vụ Apple Intelligence
Apple từ lâu theo đuổi chiến lược tự cung tưj cấp, tự thiết kế hầu hết vi xử lý trong hệ sinh thái của mình, từ A‑series trên iPhone, M‑series trên Mac đến chip cho Apple Watch. “Baltra” được xem là bước mở rộng chiến lược này lên tầng data center, giúp Apple kiểm soát tốt hơn chi phí, hiệu năng và bảo mật cho các dịch vụ AI.
Theo nguồn tin, Baltra là chip AI dành cho server, được phát triển nhằm xử lý các tác vụ suy luận (inference) cho Apple Intelligence chạy trên cloud, thay vì dùng để huấn luyện các mô hình nền tảng (foundation model) cỡ lớn.
Thay vì tự xây cụm siêu máy tính huấn luyện mô hình hàng nghìn tỷ tham số, Apple hiện đang dựa trên thỏa thuận với Google, sử dụng biến thể tùy biến của Gemini 3 nghìn tỷ tham số để cung cấp các tính năng Apple Intelligence.
Thoả thuận này được cho là có giá trị khoảng 1 tỷ USD mỗi năm, qua đó Apple có thể tập trung vào việc tối ưu lớp suy luận – nơi trực tiếp xử lý yêu cầu của người dùng như soạn email, tóm tắt nội dung hay các tính năng thông minh trong hệ điều hành.
Baltra nhiều khả năng sẽ được sản xuất trên tiến trình TSMC N3E (3 nm cải tiến), với lộ trình triển khai thực tế vào khoảng năm 2027 nếu mọi việc diễn ra đúng kế hoạch.
Apple được cho là hợp tác với Broadcom cho phần kết nối mạng (networking), giúp cụm server AI đạt độ trễ thấp và băng thông cao giữa các chip, giảm phụ thuộc vào giải pháp hạ tầng hoàn chỉnh từ Nvidia.
Định hướng thiết kế Baltra theo phong cách “chip inference chuyên dụng”, ưu tiên:
• Độ trễ thấp để phản hồi nhanh các truy vấn người dùng.
• Thông lượng cao cho lượng yêu cầu song song lớn.
• Hỗ trợ mạnh cho các phép tính độ chính xác thấp như INT8, phù hợp với suy luận hơn là huấn luyện.
Một số thông tin rò rỉ còn gợi ý cấu trúc kiểu “GB300‑style”, với cụm nhiều die (ví dụ khoảng 64 chip) kết nối all‑to‑all, sử dụng bộ nhớ LPDDR băng thông lớn để cân bằng giữa hiệu năng và chi phí, thay vì cấu trúc GPU truyền thống.
Baltra bổ sung vào danh sách chip “cây nhà lá vườn” ngày càng dày đặc của Apple, bên cạnh A‑series, M‑series, modem C1 và các SoC dòng S cho Apple Watch.
Nếu thành công, Baltra sẽ giúp Apple không chỉ tự chủ về hiệu năng và chi phí cho Apple Intelligence trên cloud, mà còn mở đường cho những biến thể AI silicon khác, có thể xuất hiện trên các thiết bị đeo hoặc kính thông minh trong tương lai.
Nếu tham vọng lớn như vậy thì từ lãnh đạo cấp cao tới lính lác làm không hết việc luôn chứ đâu phải như thằng bán bóp sen nói nhân sự rời bỏ Apple vì mảng AI ì ạch.
Chuẩn bị định nghĩa lại AI chăng? Cầm cái iphone ko thấy tính năng AI mẹ nào đáng dùng. Cảm giác đúng chuẩn thế giới ngừng quay khi sài iphone là thật.
@Hondacodon287
Mấy cái AI của Android hiện nay cũng có tác dụng gì đâu, chỉ làm cho hệ điều hành ì ạch và nhiều lỗi đơ lag hơn.
Chỉ toàn quảng cáo phóng đại là chính.