Computex

Computex


Những tin đồn đầu tiên về DeepSeek R2: Chi phí thấp hơn GPT-4 97%, gần như chỉ dùng GPU Huawei

P.W
27/4/2025 9:56Phản hồi: 51
EditEdit
Những tin đồn đầu tiên về DeepSeek R2: Chi phí thấp hơn GPT-4 97%, gần như chỉ dùng GPU Huawei
Có vẻ như DeepSeek của Trung Quốc sắp tung ra một mô hình mới trên thị trường trong thời gian tới, khi những chi tiết về DeepSeek R2 tiếp theo đã xuất hiện trên mạng.

R1, mô hình suy luận logic đầu tiên của DeepSeek, đã chứng minh được với thế giới phát triển AI phương Tây rằng Trung Quốc không hề tụt hậu trong việc phát triển các mô hình AI cao cấp. Sự ra mắt của mô hình AI từ Trung Quốc này đã gây sốc cho thị trường chứng khoán Mỹ đến mức khiến nó mất hàng tỷ USD giá trị vốn hóa.

Đồng thời, nó cũng chỉ ra rằng việc phát triển các mô hình AI không đòi hỏi chi phí cao như những gì các công ty như OpenAI từng tiết lộ với công chúng. Hiện tại, các phương tiện truyền thông Trung Quốc bắt đầu đưa tin về những đồn đoán xung quanh mô hình AI R2 tiếp theo của DeepSeek, và có thể nói rằng thị trường AI phương Tây có thể chứng kiến một sự phát triển bất ngờ khác đến từ Trung Quốc.

Cụ thể hơn, một tài khoản mạng xã hội X đã chia sẻ những thông số cơ bản của DeepSeek R2:

  • 1.2 nghìn tỷ tham số, vận hành trên 78 tỷ tham số, ứng dụng kiến trúc MoE hybrid
  • Chi phí vận hành rẻ hơn GPT-40 97.3%, 0.07 USD/1 triệu token đầu vào, 0.27 USD/1 triệu token đầu ra
  • Dữ liệu huấn luyện 5.2 Petabyte, đạt điểm số 89.7% trên C-Eval2.0
  • Hiệu suất xử lý hình ảnh tốt hơn, đạt điểm số 92.4% trên COCO
  • Ứng dụng 82% GPU Huawei Ascend 910B

Trước khi đi vào chi tiết, điều quan trọng là phải xem xét những tin đồn này một cách thận trọng, vì DeepSeek vẫn chưa xác nhận các thông số chính thức về mô hình tiếp theo của họ. Các nguồn tin từ Trung Quốc cho biết mô hình R2 dự kiến sẽ áp dụng kiến trúc MoE (Mixture of Experts) hybrid, được cho là phiên bản nâng cao của việc triển khai MoE hiện có, có thể kết hợp các cơ chế gating tiên tiến hoặc sự kết hợp giữa MoE và các lớp dày đặc để tối ưu hóa các tác vụ phức tạp. Với kiến trúc này, DeepSeek R2 dự kiến sẽ có gấp đôi số lượng tham số so với R1, đạt 1.2 nghìn tỷ tham số.

Chỉ dựa trên những con số đó, R2 được cho là sẽ cạnh tranh với GPT-4 Turbo và Gemini 2.0 Pro của Google, nhưng đây không phải là lĩnh vực duy nhất mà DeepSeek có kế hoạch tạo ra tác động. Báo cáo tuyên bố rằng với DeepSeek R2, chi phí để mô hình này xử lý token thấp hơn 97.4% so với GPT-4o. So với chi phí vận hành của OpenAI, mô hình R2 của DeepSeek sẽ là một món hời cho các doanh nghiệp, vì nó sẽ là mô hình tiết kiệm chi phí nhất hiện có. Sự ra mắt này có thể chứng tỏ là một thời điểm quyết định đối với AI và nền kinh tế liên quan đến nó.

Một sự thật thú vị khác được tiết lộ về DeepSeek R2 là mô hình này được cho là đạt mức sử dụng 82% cụm chip Huawei Ascend 910B, với sức mạnh tính toán đo được ở mức 512 PetaFLOPS với format số thực dấu phẩy động FP16. Điều này cho thấy DeepSeek đã quyết định sử dụng tài nguyên nội bộ cho mô hình thương mại tiếp theo của họ.

Chúng ta đều biết rằng công ty AI Trung Quốc rất quan tâm đến chip AI của Huawei và bằng cách huấn luyện R2 với thiết bị nội bộ, DeepSeek về cơ bản đã "tích hợp dọc" chuỗi cung ứng AI. Điều quan trọng cần lưu ý, là những diễn biến xung quanh DeepSeek R2 đều chỉ mang tính suy đoán và mô hình cuối cùng có thể sẽ khác biệt so với những thoogn số kể trên. Tuy nhiên, dựa trên những gì các nguồn tin từ Trung Quốc đưa tin, R2 có thể sẽ tiếp tục gây bất ngờ cho các công ty AI phương Tây.

Theo WCCFTech
51 bình luận
Chia sẻ

Xu hướng

vấn đề là k ai tin tàu nói và tàu làm, màu mè ghê thật xài chùa của Meta thôi mà, chip cùi của hoawera
@Bơm Lốp Tàu Hỏa K hiểu não mấy thằng này chứa gì nữa
@21stAugust dĩ nhiên là chất thải của chính nó r
@Bơm Lốp Tàu Hỏa nó cần mọi người tin quá. Nó bán cho nội địa đủ dùng nhòe rồi
Cười vô mặt
Có mà 😆:
Ứng dụng 82% GPU Huawei Ascend 910B ❌
Ứng dụng 82% GPU Nvidia(Các phiên bản) ✅
Thế này lại nhuộm đỏ sàn tiếp
@grozar Sao chú biết lại nhuộm đỏ sàn, chú Hán nô này suy đoán như thần đấy nhỉ?
@Minh Đức usa Nó chờ bphone tung ra AI Hồng Lạc nó mới biết sức mạnh của công ty nội địa nước mình mà thôi bưng bô.
Có cái đầu buồi. Chém gió như thần. Toàn H200. Cứ Free suốt mới tin là rẻ nv.
Cười vô mặt
Khựa thì chém phầm phập chứ làm đc bao nhiêu đâu.
@baquơ Nổ?? Chú m tìm hiểu kỹ trước khi nói chuyện chưa nhỉ? Từ sau thời cổ đại khái đến thời kỳ trước phục hưng châu á chỉ có vài cái sáng kiến cơ bản, nhưng châu âu là châu lục đầu tiên mới khái quát hóa tổng hợp tốt các lý thuyết toán học tốt, trị thức nhân loại phát triển mạnh nhất ở châu âu. Khoa học có tính kế thừa và họ đã làm rất tốt.
@sốt-xuất-huyết-2025 Bạn muốn có thông tin mật về tàu thì liên hệ @anhlucky2. Tay này cũng là một "Phạm Xuân Ẩn" thứ 2 về tinh báo công nghệ tàu đấy.
Cười vô mặt
Phần cứng thì xài chui của Nvidia.
Phần mềm thì được anh mark xoăn buff cho, gáy mạnh quá.
@8Keo Chứng cứ đâu bạn ?
T chắc 1 điều là mấy con ai của bọn tàu luôn thông minh hơn của bọn tây. Đặt biệt mấy con AI có nhà nước đứng sau hậu thuẫn. Vì sao. Vì data của dân thì nhà nước quản hết. Nhà nước nó muốn huấn luyện AI hay làm gì thì chả đc. Còn bọn tây thì phải thông qua cái này thông qua cái kia. Chưa kể data cá nhân của bọn tây rất nhạy cảm, ko dễ đụng.
@shuchanglove vãi có biết lượng kiến thức nạp vào bộ nhớ dữ liệu của Tây nhiều đến cỡ nào không, ngay cả trung tâm dữ liệu Mỹ còn đang thống trị đấy nhé, chẳng biết cái gì toàn ba cái kiến thức chủ quan của chú đấy. AI Tây nó vẫn mạnh tính sáng tạo hơn, cởi mỡ hơn, ko giấu cái gì cả, mọi vấn đề, mọi chuyện vẫn bàn luận công khai ngay cả chính trị. Thế nhé.
@shuchanglove AI Tây là 7.6 tỉ người đủ mọi sắc tộc chủng tộc ngôn ngữ văn hóa sáng tạo tự do.AI tàu 1.4 tỉ người và chỉ có 1 chủng 1 văn hóa 1 ngôn ngữ chính mà 90% dân sử dụng và sáng tạo trong khuôn khổ mà chú nghĩ thông minh hơn ))
@shuchanglove AI tàu không thông minh hơn các AI khác, nó chỉ dắt mũi, lùa gà hay hơn thôi. Chính phủ muốn lùa sao lùa
@shuchanglove Tôi đồng ý 1 phần AI tàu xâm phạm cá nhân hơn nhưng giới hạn về tư tưởng, chính trị
Tàu quản lý con người theo kiểu nó thích và muốn lấy gì thì lấy
Khựa thì chém phầm phập chứ làm đc bao nhiêu đâu.
Có thể TQ đi sau về ý tưởng, công nghệ, nhưng 1 thời gian bắt chước sao chép thì khoảng cách rút ngắn rất nhanh, nhiều bạn chê bai AI Tàu, nhưng những AI nội địa Tàu phát triển bởi ByteDance, Tencent,... rất mạnh, mình làm việc với Tàu, họ có những tool, ứng dụng, công nghệ mà ko ở đâu có
Thấp hơn 97%... quả mkt khét quá khét!
Kinh vãi
Lại XL. A Tập vừa âm thầm giảm tariff chip còn 0% mà vẫn Xl.
Cười vô mặt
Cứ hỏi thử như sau thì mới thấy Meta AI quá kém!
Lập luận sau có hợp lý không?
… Nói là ngày xưa có người từ bên China đi qua mình bằng ba chiếc xuồng ba lá, cho nên gọi là “Tàu”. Thế là gọi là “ba Tàu”, là tại vì đi qua bằng xuồng ba lá. Thì cái đó không chính xác, đúng không ạ?
Bịa đặt! Người Việt Nam ưa xạo. Nếu mà nói người đó là “ba Tàu” thì tất cả người Mỹ da trắng đều là “ba Tàu” hết, tại vì họ đến nước Mỹ bằng những cái tàu như Mayflower. Vậy người Mỹ cũng là người “Tàu” luôn! Cái đó là bịa đặt, không có thật, chuyện đó bịa ra rồi từ từ có người tin là thật, thế là nó trở thành “thật” – vì nó đi theo cái số đông.
Đúng rồi! Mà người Việt Nam ưa tin những cái phịa lắm, dễ cả tin, tại vì không có trí óc cho chính mình.
T nhớ 20 năm trc so cái đt tàu với cái đt nokia nó như 1 trời 1 vực, rồi 10 năm trở lại đây thì sao? Cách đây 15 năm thị trường có ai đi xe tàu ko, rồi 5 năm gần đây thị trường xe âu mỹ ở toàn cầu đang bị đe doạ bởi thằng nào? Cứ chê tàu chỉ biết coppy nhưng bọn nó vừa coppy vừa học cách làm chủ công nghệ, cái đấy mới là cái nguy hiểm của nó
Mấy ông lo ủng hộ cho đội Tàu nó thành công đi để đội Tây bớt nâng giá lại. Trời ơi bây giờ nhìn 1 con VGA thôi mà giá muốn xĩu. Huawei mà thành công ở mảng chip AI thì hoạ may VGA mới có giá mềm lại.
@HuynhNgLe Chip AI hay GPU VN ko có nhưng ngoài Nvidia còn AMD và Intel đấy.ngon thì ko có giá rẻ.mà rẻ thì ko ngon.ng dùng thì cứ thích chọn cái ngon chứ ko quan tâm đứa nào thành công nhé vì thành công mà giá rẻ thì cũng éo ngon ))
@Cmt dạo Không nói trước được chuyện gì đâu nha, căn bản thì bây giờ nVidia cứ như một mình một chợ cho thị trường GPU highend, ngay cả AMD cũng đuối, Intel thì càng không có cửa, lại thêm nVidia lại đặt trọng tâm vào AI nên để giá VGA cao mút chỉ. Nếu Huawei thành công nghiên cứu ra VGA đỉnh cấp thì với chiến lược tăng doanh số thì cạnh tranh giá là không tránh khỏi. Cứ nhìn vào BYD âm thầm tăng trưởng mà coi, ngay cả Tesla cũng phải lao vào cuộc chiến về giá với nó đấy.
@HuynhNgLe Heo nghiên cứu ra VGA đỉnh cấp thì giá lại như Nvidia.còn VGA Nvidia thành đồ phế bán lại chả ai mua như AMD và Intel)) lúc đó bạn lại than ủng hộ Nvidia để heo quay bớt nâng giá thôi ))
@Cmt dạo Đúng rồi, cạnh tranh luôn là điều tốt.
Nhiều người cứ nói sài chui GPU Nvidia, sài chùa mã nguồn mở Meta. Phải biết deepseek là cái gai cực lớn với chính phủ và tập đoàn Mỹ, sao họ vẫn để chuyện này xảy ra và tiếp tục phát triển deepseek. Còn nhiều vấn đề hậu trường chỉ 2 quốc gia này biết và họ đang chơi game sao cho win-win, sao cho tất cả quốc gia khác nạp tiền game. Không có đồng minh hay kẻ thù vĩnh viễn, chỉ có lợi ích là vĩnh viễn.
dùng thử deepseek thấy cũng đâu hơn gì chatgpt tính ra còn dở hơn, có nhiều nghi ngờ deepseek cũng xài phần cứng của nvidia để huấn luyện chứ không phải của heo quay
Đang chờ thực hư. Mẽo phản ứng gì.
Tàu ghê thật, nhưng chủ yếu thừa hưởng cái có sẵn của mấy con AI có sẵn và tinh chỉnh lại cho phù hợp phần cứng yếu, cái này hay nên rất hoan nghênh!!!
nghe đồn tàu cộng sản xuất dc động cơ máy bay thương mại

Xu hướng

Bài mới








  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2025 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019