Zyphra vừa hợp tác với AMD để giới thiệu Zyphra AI Cloud, một nền tảng AI mã nguồn mở đặt tại Mỹ, được định vị như đối thủ của DeepSeek và vận hành hoàn toàn trên các GPU AMD Instinct MI355X.
Zyphra AI Cloud được tối ưu cho suy luận với các mô hình open-weight cỡ lớn như DeepSeek V3.2, Kimi K2.6 và GLM 5.1, kết hợp kernel tùy biến, thuật toán suy luận ngữ cảnh dài mới và các kỹ thuật song song tiên tiến để mang lại hiệu năng thông lượng cao, độ trễ thấp, phù hợp cho tác vụ agent, nghiên cứu chuyên sâu và các quy trình AI dài hơi. Nền tảng này chạy trên hạ tầng TensorWave, nơi triển khai hàng nghìn bộ tăng tốc AMD Instinct, với tổng công suất tính toán 15MW từ cụm MI355X hiện tại, đồng thời sẵn sàng mở rộng sang các GPU thế hệ sau như MI450, thậm chí xa hơn là MI500.
Không chỉ dừng ở suy luận, Zyphra có kế hoạch biến Cloud thành một nền tảng tích hợp rộng hơn với các khả năng như reinforcement learning và fine-tuning, tận dụng CPU AMD EPYC mới nhất cùng các cụm GPU chuyên dụng. Đại diện TensorWave cho biết mục tiêu của họ là cung cấp hạ tầng tính toán AMD hiệu năng cao cho các công ty AI-native như Zyphra, giúp triển khai AI sản xuất trên các bộ tăng tốc AMD thế hệ mới ở quy mô lớn mà không phải thỏa hiệp.
TensorWave trước đó vào năm 2024, đã công bố kế hoạch xây dựng một trong những cụm GPU AMD lớn nhất thế giới vào năm 2025 với MI300X, MI325X và MI350X, hướng tới quy mô nhiều gigawatt công suất tính toán. Hiện tại, các công ty AI như Zyphra đang tận dụng sức mạnh hạ tầng này để vận hành các workflow Agentic AI cho khách hàng.
Song song với dịch vụ cloud suy luận, Zyphra cũng đã giới thiệu ba mô hình riêng: ZAYA1-8B (tập trung vào reasoning), ZAYA1-74B (mô hình MoE với tối đa 74 tỷ tham số) và ZAYA1-VL, mô hình vision-language đầu tiên của hãng. Toàn bộ nền tảng Zyphra Cloud AI hiện đã mở cửa, người dùng có thể truy cập trang chính Zyphra Cloud để tìm hiểu thêm và sử dụng dịch vụ.
Wccftech.
Zyphra AI Cloud được tối ưu cho suy luận với các mô hình open-weight cỡ lớn như DeepSeek V3.2, Kimi K2.6 và GLM 5.1, kết hợp kernel tùy biến, thuật toán suy luận ngữ cảnh dài mới và các kỹ thuật song song tiên tiến để mang lại hiệu năng thông lượng cao, độ trễ thấp, phù hợp cho tác vụ agent, nghiên cứu chuyên sâu và các quy trình AI dài hơi. Nền tảng này chạy trên hạ tầng TensorWave, nơi triển khai hàng nghìn bộ tăng tốc AMD Instinct, với tổng công suất tính toán 15MW từ cụm MI355X hiện tại, đồng thời sẵn sàng mở rộng sang các GPU thế hệ sau như MI450, thậm chí xa hơn là MI500.
Không chỉ dừng ở suy luận, Zyphra có kế hoạch biến Cloud thành một nền tảng tích hợp rộng hơn với các khả năng như reinforcement learning và fine-tuning, tận dụng CPU AMD EPYC mới nhất cùng các cụm GPU chuyên dụng. Đại diện TensorWave cho biết mục tiêu của họ là cung cấp hạ tầng tính toán AMD hiệu năng cao cho các công ty AI-native như Zyphra, giúp triển khai AI sản xuất trên các bộ tăng tốc AMD thế hệ mới ở quy mô lớn mà không phải thỏa hiệp.
TensorWave trước đó vào năm 2024, đã công bố kế hoạch xây dựng một trong những cụm GPU AMD lớn nhất thế giới vào năm 2025 với MI300X, MI325X và MI350X, hướng tới quy mô nhiều gigawatt công suất tính toán. Hiện tại, các công ty AI như Zyphra đang tận dụng sức mạnh hạ tầng này để vận hành các workflow Agentic AI cho khách hàng.
Song song với dịch vụ cloud suy luận, Zyphra cũng đã giới thiệu ba mô hình riêng: ZAYA1-8B (tập trung vào reasoning), ZAYA1-74B (mô hình MoE với tối đa 74 tỷ tham số) và ZAYA1-VL, mô hình vision-language đầu tiên của hãng. Toàn bộ nền tảng Zyphra Cloud AI hiện đã mở cửa, người dùng có thể truy cập trang chính Zyphra Cloud để tìm hiểu thêm và sử dụng dịch vụ.
Wccftech.
