Nguồn tin giấu tên độc quyền của Reuters cho biết, ByteDance, chủ quản ứng dụng mạng xã hội TikTok cũng như Douyin ở thị trường quê nhà Trung Quốc, họ đang lên kế hoạch phát triển và huấn luyện một mô hình ngôn ngữ AI, sử dụng những hệ thống chip xử lý Ascend do Huawei phát triển và sản xuất.
Kể từ năm 2022, khi chính quyền Mỹ bắt đầu có những động thái đầu tiên chặn nguồn cung chip xử lý AI trên máy chủ đám mây, các doanh nghiệp và tập đoàn công nghệ Trung Quốc đều đã phải có những động thái chuyển dịch nguồn cung chip xử lý chuyên biệt cho AI, lựa chọn những sản phẩm được sản xuất trong nước.
Dĩ nhiên trong số những con chip xử lý AI máy chủ do người Trung Quốc sản xuất, trong mắt phần còn lại của thế giới, nổi tiếng và được ứng dụng nhiều nhất hiện giờ chính là Huawei Ascend 910B.
Vài nguồn tin nội bộ ByteDance đã cung cấp cho Reuters thông tin, rằng hiện tại ByteDance cũng đã đang đặt mua, đã nhận được những đơn hàng đầu tiên và ứng dụng chip Ascend 910B trong những hệ thống data center, nhưng phần lớn chúng được dùng cho những tác vụ machine learning đòi hỏi hiệu năng chip xử lý thấp hơn, không phải nội suy với quá nhiều tham số, chẳng hạn như bước đầu tiên của quá trình huấn luyện mô hình AI để phục vụ tính năng “dự đoán từ khóa tìm kiếm” của người dùng TikTok hay Douyin. Còn vận hành thực tế, ByteDance vẫn tin tưởng những giải pháp của Nvidia phát triển riêng, tuân thủ quy định cấm vận của Mỹ, bán riêng tại thị trường Trung Quốc.
Kể từ năm 2022, khi chính quyền Mỹ bắt đầu có những động thái đầu tiên chặn nguồn cung chip xử lý AI trên máy chủ đám mây, các doanh nghiệp và tập đoàn công nghệ Trung Quốc đều đã phải có những động thái chuyển dịch nguồn cung chip xử lý chuyên biệt cho AI, lựa chọn những sản phẩm được sản xuất trong nước.
Dĩ nhiên trong số những con chip xử lý AI máy chủ do người Trung Quốc sản xuất, trong mắt phần còn lại của thế giới, nổi tiếng và được ứng dụng nhiều nhất hiện giờ chính là Huawei Ascend 910B.
Vài nguồn tin nội bộ ByteDance đã cung cấp cho Reuters thông tin, rằng hiện tại ByteDance cũng đã đang đặt mua, đã nhận được những đơn hàng đầu tiên và ứng dụng chip Ascend 910B trong những hệ thống data center, nhưng phần lớn chúng được dùng cho những tác vụ machine learning đòi hỏi hiệu năng chip xử lý thấp hơn, không phải nội suy với quá nhiều tham số, chẳng hạn như bước đầu tiên của quá trình huấn luyện mô hình AI để phục vụ tính năng “dự đoán từ khóa tìm kiếm” của người dùng TikTok hay Douyin. Còn vận hành thực tế, ByteDance vẫn tin tưởng những giải pháp của Nvidia phát triển riêng, tuân thủ quy định cấm vận của Mỹ, bán riêng tại thị trường Trung Quốc.
Những lợi thế về số nhân xử lý hay công nghệ bộ nhớ HBM vẫn là thứ Nvidia có được so với những sản phẩm nội địa Trung Quốc, như Huawei Ascend 910B. Thành ra có giới hạn tốc độ xử lý theo đơn vị TOPS, hay giảm băng thông bộ nhớ cho GPU vận hành, Nvidia vẫn đang kinh doanh khá ổn tại thị trường tỷ dân. Chỉ có vấn đề là với những giới hạn về hiệu năng do cấm vận của phía chính quyền Mỹ, các đối thủ cạnh tranh đang bắt kịp với những gì chip xử lý của Nvidia, ví dụ như H20 kiến trúc Hopper, có thể làm được.
Hiện tại, ByteDance có một mô hình AI họ đặt tên là Doubao, vận hành như một trợ lý ảo, tìm kiếm hình ảnh, tạo hình nội suy bằng gen AI, cùng những tính năng khác tương đồng với nhiều trợ lý ảo AI khác đang có trên thị trường. Theo nguồn tin của Reuters, nếu sử dụng Ascend 910B để huấn luyện, mô hình AI mới của ByteDance sẽ có tham số thấp hơn Doubao, để đảm bảo quá trình huấn luyện cũng như vận hành.
Doubao được ra mắt từ tháng 8/2023. Bên cạnh ứng dụng trợ lý ảo Doubao AI, nền tảng mô hình ngôn ngữ do ByteDance phát triển còn được dùng để tạo sinh cả video, với hai mô hình chuyên biệt nội suy video mang tên Jimeng AI, vừa được tập đoàn này giới thiệu hồi giữa tháng 9 để cạnh tranh với những giải pháp đang có trên thị trường, ví dụ như Kling AI của những người đồng hương, hay Gen-3 của startup Mỹ RunwayML.
Xét riêng chatbot Doubao AI, hiện tại nó đang là một trong những chatbot AI nhiều người dùng nhất tại Trung Quốc, ước tính mỗi tháng có khoảng 10 triệu người dùng.
Chỉ trong năm 2024 này, theo vài nguồn tin không chính thức, ByteDance đã đặt hàng Huawei sản xuất và giao cho họ hơn 100 nghìn chip Ascend 910B. Nhưng tính đến thời điểm hiện tại, Huawei được cho là mới chỉ giao được khoảng 30 nghìn chip tính đến hết tháng 7/2024. Tốc độ gia công chip của SMIC và Huawei hiện giờ bị cho là quá chậm so với nhu cầu và tốc độ phát triển giải pháp AI tạo sinh của ByteDance.
Chính tình trạng này đã khiến ByteDance phải trì hoãn kế hoạch nghiên cứu phát triển cũng như ứng dụng mô hình AI mới của họ.
Không chỉ đổ tiền tấn mua chip của Huawei, hiện tại ByteDance cũng chính là đơn vị đặt mua nhiều chip xử lý AI máy chủ H20 nhất của Nvidia. Không chỉ dừng ở đó, theo vài nguồn tin không được xác nhận, ByteDance còn là khách hàng lớn nhất của Microsoft tại châu Á, tiếp cận những máy chủ đám mây trang bị những chip H100 hay H200 ở những data center thuộc dịch vụ đám mây Azure của Microsoft để phục vụ nghiên cứu và vận hành AI nữa.
Quảng cáo