Trong báo cáo nghiên cứu khoa học mới nhất của Apple, mô tả quy trình huấn luyện mô hình AI nền móng của những ứng dụng thuộc gói Apple Intelligence vừa ra mắt cùng iOS 18.1 Beta, có một chi tiết đã được hé lộ. Apple, thay vì phụ thuộc vào những chip GPU máy chủ của Nvidia như H100 hay H200 để huấn luyện mô hình có tên Apple Foundation Model, họ lại chọn hai phiên bản chip TPU Tensor v4 và v5p của Google, tức là vận hành trên máy chủ Google Cloud, để phục vụ huấn luyện mô hình AI 2.73 nghìn tỷ tham số.
Ở WWDC 2024 diễn ra hồi tháng 6, Apple đã hé lộ AFM, mô hình ngôn ngữ mang tính nền tảng cho những tính năng xử lý AI trên thiết bị và trên máy chủ đám mây. Còn đến thời điểm hiện tại, tài liệu nghiên cứu mô hình AFM mới được công bố, chia sẻ cụ thể những thông số kỹ thuật của mô hình ngôn ngữ được Apple nghiên cứu phát triển.
Đối với phiên bản AFM chạy trên máy chủ đám mây, vận hành những tính năng AI có tên Apple Cloud Compute, Apple cho biết mô hình được huấn luyện dựa trên 6.3 nghìn tỷ token, phát triển từ con số 0, dựa trên “8192 con chip TPUv4 của Google.” Những chip xử lý tăng tốc thuật toán machine learning của Google được cung cấp dịch vụ cho các đối tác theo từng “TPU pod”, mỗi pod là 4096 con chip TPUv4.
Thêm nữa, bên cạnh TPUv4, những mô hình AFM sau này vận hành trên những thiết bị, từ iPhone đến MacBook, cũng như trên máy chủ đám mây còn được huấn luyện trên những chip xử lý TPUv5p của Google. Hiện tại, chip TPUv5p là một phần của hệ thống siêu máy tính Google Cloud AI, được công bố chính thức kể từ tháng 12 năm ngoái.
Ở WWDC 2024 diễn ra hồi tháng 6, Apple đã hé lộ AFM, mô hình ngôn ngữ mang tính nền tảng cho những tính năng xử lý AI trên thiết bị và trên máy chủ đám mây. Còn đến thời điểm hiện tại, tài liệu nghiên cứu mô hình AFM mới được công bố, chia sẻ cụ thể những thông số kỹ thuật của mô hình ngôn ngữ được Apple nghiên cứu phát triển.
Đối với phiên bản AFM chạy trên máy chủ đám mây, vận hành những tính năng AI có tên Apple Cloud Compute, Apple cho biết mô hình được huấn luyện dựa trên 6.3 nghìn tỷ token, phát triển từ con số 0, dựa trên “8192 con chip TPUv4 của Google.” Những chip xử lý tăng tốc thuật toán machine learning của Google được cung cấp dịch vụ cho các đối tác theo từng “TPU pod”, mỗi pod là 4096 con chip TPUv4.
Thêm nữa, bên cạnh TPUv4, những mô hình AFM sau này vận hành trên những thiết bị, từ iPhone đến MacBook, cũng như trên máy chủ đám mây còn được huấn luyện trên những chip xử lý TPUv5p của Google. Hiện tại, chip TPUv5p là một phần của hệ thống siêu máy tính Google Cloud AI, được công bố chính thức kể từ tháng 12 năm ngoái.
Đối với mô hình Apple Foundation Model vận hành trên chip Apple Silicon trong thiết bị tiêu dùng của anh em, vận hành những tính năng như viết lại văn bản hay lựa chọn hình ảnh, Apple chọn phiên bản AFM với 6.4 tỷ tham số, “được huấn luyện từ đầu giống hệt như phiên bản AFM vận hành trên máy chủ đám mây.”
Nhưng thay vì huấn luyện mô hình AI dựa trên chip TPUv4 thế hệ cũ của Google, với phiên bản mô hình vận hành on device, Apple chọn phiên bản chip TPU mới nhất hiện tại của Google, TPUv5p, với 2048 con chip xử lý tăng tốc thuật toán machine learning được sử dụng để huấn luyện AFM 6.4 tỷ tham số.
Những chi tiết khác trong báo cáo nghiên cứu mô hình AI của Apple bao gồm cả bước cân nhắc và đánh giá mô hình để tránh tình trạng tạo ra những câu trả lời gây hại cho người dùng, những chủ đề nhạy cảm, độ chính xác của thông tin mà AI tổng hợp, khả năng làm những phép tính toán học và mức độ thỏa mãn của người dùng khi xem kết quả AI tạo sinh của AFM tạo ra theo từng lệnh của người dùng yêu cầu.
Theo số liệu mà Apple đưa ra, mức độ thỏa mãn của người dùng với kết quả mà AI đưa ra, kể cả hai phiên bản mô hình AFM vận hành trên máy chủ và on device hiện tại đang cao nhất trên thị trường, đặc biệt là ở khía cạnh chặn đứng những nội dung gây hại được AI tạo ra. Lấy ví dụ, mô hình AFM vận hành trên máy chủ đám mây, so sánh với GPT-4, chỉ có tỷ lệ tạo nội dung gây hại 6.3%, thấp hơn rất nhiều so với tỷ lệ 28.8% của GPT-4. Tương tự như vậy, so sánh giữa AFM vận hành on device với Llama 3-8B của Meta, tỷ lệ tạo nội dung gây hại chỉ là 7.5% so với 21.8%.
Theo WCCFTech