IFA 2024

IFA 2024


Nền tảng của Apple Intelligence huấn luyện bằng chip Google chứ không phải Nvidia

P.W
30/7/2024 6:44Phản hồi: 36
Nền tảng của Apple Intelligence huấn luyện bằng chip Google chứ không phải Nvidia
Trong báo cáo nghiên cứu khoa học mới nhất của Apple, mô tả quy trình huấn luyện mô hình AI nền móng của những ứng dụng thuộc gói Apple Intelligence vừa ra mắt cùng iOS 18.1 Beta, có một chi tiết đã được hé lộ. Apple, thay vì phụ thuộc vào những chip GPU máy chủ của Nvidia như H100 hay H200 để huấn luyện mô hình có tên Apple Foundation Model, họ lại chọn hai phiên bản chip TPU Tensor v4 và v5p của Google, tức là vận hành trên máy chủ Google Cloud, để phục vụ huấn luyện mô hình AI 2.73 nghìn tỷ tham số.

Ở WWDC 2024 diễn ra hồi tháng 6, Apple đã hé lộ AFM, mô hình ngôn ngữ mang tính nền tảng cho những tính năng xử lý AI trên thiết bị và trên máy chủ đám mây. Còn đến thời điểm hiện tại, tài liệu nghiên cứu mô hình AFM mới được công bố, chia sẻ cụ thể những thông số kỹ thuật của mô hình ngôn ngữ được Apple nghiên cứu phát triển.

Đối với phiên bản AFM chạy trên máy chủ đám mây, vận hành những tính năng AI có tên Apple Cloud Compute, Apple cho biết mô hình được huấn luyện dựa trên 6.3 nghìn tỷ token, phát triển từ con số 0, dựa trên “8192 con chip TPUv4 của Google.” Những chip xử lý tăng tốc thuật toán machine learning của Google được cung cấp dịch vụ cho các đối tác theo từng “TPU pod”, mỗi pod là 4096 con chip TPUv4.

[​IMG]

Thêm nữa, bên cạnh TPUv4, những mô hình AFM sau này vận hành trên những thiết bị, từ iPhone đến MacBook, cũng như trên máy chủ đám mây còn được huấn luyện trên những chip xử lý TPUv5p của Google. Hiện tại, chip TPUv5p là một phần của hệ thống siêu máy tính Google Cloud AI, được công bố chính thức kể từ tháng 12 năm ngoái.


APPLE-AI-FEATURES-GOOGLE-TPU-MODEL-1456x943.png

Đối với mô hình Apple Foundation Model vận hành trên chip Apple Silicon trong thiết bị tiêu dùng của anh em, vận hành những tính năng như viết lại văn bản hay lựa chọn hình ảnh, Apple chọn phiên bản AFM với 6.4 tỷ tham số, “được huấn luyện từ đầu giống hệt như phiên bản AFM vận hành trên máy chủ đám mây.”

Nhưng thay vì huấn luyện mô hình AI dựa trên chip TPUv4 thế hệ cũ của Google, với phiên bản mô hình vận hành on device, Apple chọn phiên bản chip TPU mới nhất hiện tại của Google, TPUv5p, với 2048 con chip xử lý tăng tốc thuật toán machine learning được sử dụng để huấn luyện AFM 6.4 tỷ tham số.

Những chi tiết khác trong báo cáo nghiên cứu mô hình AI của Apple bao gồm cả bước cân nhắc và đánh giá mô hình để tránh tình trạng tạo ra những câu trả lời gây hại cho người dùng, những chủ đề nhạy cảm, độ chính xác của thông tin mà AI tổng hợp, khả năng làm những phép tính toán học và mức độ thỏa mãn của người dùng khi xem kết quả AI tạo sinh của AFM tạo ra theo từng lệnh của người dùng yêu cầu.

Screenshot 2024-07-30 133957.jpg

Theo số liệu mà Apple đưa ra, mức độ thỏa mãn của người dùng với kết quả mà AI đưa ra, kể cả hai phiên bản mô hình AFM vận hành trên máy chủ và on device hiện tại đang cao nhất trên thị trường, đặc biệt là ở khía cạnh chặn đứng những nội dung gây hại được AI tạo ra. Lấy ví dụ, mô hình AFM vận hành trên máy chủ đám mây, so sánh với GPT-4, chỉ có tỷ lệ tạo nội dung gây hại 6.3%, thấp hơn rất nhiều so với tỷ lệ 28.8% của GPT-4. Tương tự như vậy, so sánh giữa AFM vận hành on device với Llama 3-8B của Meta, tỷ lệ tạo nội dung gây hại chỉ là 7.5% so với 21.8%.

Theo WCCFTech
36 bình luận
Chia sẻ

Xu hướng

ủa tưởng bữa nghe nói lấy cpu m2 siêu Ai gì mà? giờ xài tpu google ah?
@tmquyen tính năng chạy ko mượt nên giờ beta test còn lựa người đăng ký nữa. nên ko mượt nhé. mắc cười iphan và apple thôi. bữa đồn chip m2 làm server training nghe hú hồn.
@ragefighter Ai đồn, apple đồn hả? Rồi mắc gì chửi nó?
@ragefighter Vde Apple đi sau các hãng khá xa với mô hình ngôn ngữ lớn nẻn việc nhanh nhất để rút ngắn khoảng cách là kết hợp với những thứ hiện có. Nhưng điều mình thất vọng nhất có lẽ là vẫn chưa có tiếng Việt nên với AI mới của Apple thì vô dụng.
@tmquyen cứ hết bh là sọc màn hư phím bác nhỉ,hic
tiếc tiền nên mua hàng google sao? mà chip M có nhân gì gì đó siêu mạnh mà phải đi mua hàng ngoài, lạ đời.
Cái tên Tensor của GG làm iphan ám ảnh mà nay chủ Táo lại đú vào ư, có gì nhầm chăng?
@Dragao_ct92 thì nó là máy của GG gắn xài 😆 chứ ai thèm mua con đó về dùng cho dt phế
@Pon nemo đúng rồi. sa gia công mấy con cpu đó đó. iphan sướng ngất ngây
@vn123123 Oừ GG gắn xài để cho thằng táo thuê
Cười vô mặt
@Dragao_ct92 Bạn ko hiểu thôi.
Tensor ở đây có 2 khái niệm cần phân biệt rõ:

1. Tensor gốc là chỉ cụm nhân xử lý Neuron Network do Google phát triển, trước đây được dùng trong TPU là các thiết bị dùng trong Cloud. Sau đó được Google ứng dụng vào các thiết bị Edge khác như Coral board, Pixel Visual Core trong các đời pixel cũ để xử lý ảnh và AI ở device.

2. Chip Tensor lại là một thiết bị khác. Chip này do Samsung làm làm, chạy trên các dòng Pixel từ pixel 6, Nó được gọi là Tensor vì có chứa thành phần là cụm Tensor trên. Vấn đề hiệu năng cũng như tản nhiệt của chip là ở chỗ thiết kế và gia công của SS chưa ổn, quy trình chắc giống Exynos nên bị ae chê.

Tóm lại là TPU chả liên quan gì đến chip Tensor trên Pixel hay Exynos cả. TPU có hiệu năng ngang ngửa với các card Nvidia với giá thành rẻ hơn nhiều.

Vậy tại sao các hãng khác ko dùng mà Apple lại dùng?
Thực ra là có, nhưng vì báo giới viết nhiều về các hãng tạo ra model lớn như OpenAI, Meta... Nên bạn ko biết các hãng khác thế nào.
Đặc điểm là những ông lớn này Train AI nhiều và thường xuyên nên họ sẽ có xu hướng mua thay vì thuê. Cái gì dùng nhiều thì nên mua, dùng ít thì nên thuê. Táo là TH dùng ít, các model của táo là các model nhỏ, training ít, chủ yếu sau này vận hành sẽ là quá trình inference nên thuê TPU là dễ hiểu.
Hun cái nè
Nghe bảo máy chủ đc tạo từ chip Apple Silicon M mà
tưởng dùng M3 Max, M4 Pro train chứ 😔 hix nghe chán chả thèm upgrade nữa
ifan người ta không ý kiến thì thôi chứ mấy ông khác vô khịa vụ chip M làm giề? Chip M là để trang bị trên iPad và Mac dùng để render không cần cắm điện nhé, không rảnh để đi train mấy con AI vớ vẩn
Chip M ultra để chạy xử lý thôi. Chứ train model thì k chịu nổi đâu
> Theo số liệu mà Apple đưa ra, mức độ thỏa mãn của người dùng với kết quả mà AI đưa ra, kể cả hai phiên bản mô hình AFM vận hành trên máy chủ và on device hiện tại đang cao nhất trên thị trường, đặc biệt là ở khía cạnh chặn đứng những nội dung gây hại được AI tạo ra.

Có chặn nội dung woke độc hại không =)))
Mỗi lần vào Tinhte là mỗi lần thấy giọng điệu mỉa mai của những người chả làm nên cái tích sự gì.
@Carl Chỉ có m mới thế
@tmhung Anti bất chấp mà bạn.
Hung hãn lắm.
Mà thôi kệ. Tấu hài ngày đêm.
Ahihi
@tmhung uhm thật, dạo này nhiều thành phần như vậy thật, riết chán không muốn vào tinhte, rác càng ngày càng nhiều.
Chơi hạ tầng của Nvidia thì phải tầm vĩ mô như MS hay bọn enterprise mới cần chứ. Apple tàn tàn cho người dùng cuối cứ chi phí tiết kiệm mà chọn Google thôi, dù gì đã có mấy mống dùng 😆
Chip M bá đạo trong mọi phân khúc, đè đầu cưỡi cổ, đẩy amd, intel xuống biển mà không dám đá nốt Nvidia sao 😔
Apple từng tuyên bố sử dụng NVIDIA trước đó rồi hay sao thế mod nhỉ? Thật ra mình còn tưởng họ sẽ sử dụng hệ thống của AWS chứ không phải Google Cloud sử dụng Tensor nữa
Mọi thứ vô nghĩa khi không hỗ trợ Tiếng Việt
@thuy8x8 Apple không xem trọng thị trường VN
Bài về Apple lên rồi
Anh em vào cắn thôi
Ahihi
Có mỗi cái AI thôi mà qua giờ cả chục bài. Best táo
Đám ifan thiểu năng tung hô chip M1, M2 như thần thánh, AI khủng này nọ. Này thì tung hô, này thì tự chủ phần cứng và phần mềm, dăm ba cái iPhone chỉ phục vụ cho người dùng hướng cá nhân. Giờ thằng ifan nào dám bay vào chửi Google Pixel chạy Google Tensor ko nào. Xin lỗi, ứng dụng AI vào chụp hình trên smartphone thì Pixel tiên phong cả chục năm trước rồi, các hãng khác phải gọi bằng cụ nhé. Hết cãi
tekar
ĐẠI BÀNG
một tháng
Nhiều bác chém hay chê trách mà ko hiểu nhỉ, thằng TSMC đang bị thiếu hụt năng lực sản xuất siêu chip đáp ứng đủ nhu cầu ( như Apple ngoài sản xuất Apple Silicon M để bán, giờ còn phải sản xuất thêm tự xài thì khó chậm, ngoài ra mua Nvidia hay xài Apple Silicon lại tốn thêm khoản đầu tư cực lớn làm DataCenter ( build, xây dựng mô hình hoạt động và phần mềm quản lí tối ưu) thay vì vậy AI đang đi nhanh thì xài lại cho lẹ. Xong hết trend AI thì hết thuê, khỏi phải nhức đầu đầu tư lớn, tập trung phát triển Apple Silicon thêm, tới khi gần bằng hay lợi hơn khi tự làm thì lúc đó mới làm thôi
dù ai nói ngả nói nghiêng, khịa đểu, đến lúc AI của Apple xài ngon tất cả lại quỳ xuống, doanh số IP vẫn top 1, chó nằm nhà ngủ, chủ đi xếp hàng mua IP
Cười vô mặt

Xu hướng

Bài mới










  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019