IBM ra mắt Granite 3.0: Mô hình AI hiệu suất cao được thiết kế dành cho doanh nghiệp

PTW_Dark
22/10/2024 4:1Phản hồi: 13
EditEdit
IBM ra mắt Granite 3.0: Mô hình AI hiệu suất cao được thiết kế dành cho doanh nghiệp
IBM đang đẩy mạnh chiến lược mở rộng lĩnh vực trí tuệ nhân tạo (AI) dành cho doanh nghiệp của mình với việc ra mắt thế hệ thứ ba của các mô hình ngôn ngữ lớn (LLMs) Granite 3.0. Đây là một bước tiến quan trọng trong nỗ lực tăng trưởng nhanh chóng trong lĩnh vực AI generative của IBM, hiện đã đạt doanh thu hơn 2 tỷ USD, và công ty đang tập trung phát triển các giải pháp AI hiệu quả, tiết kiệm chi phí cho doanh nghiệp.

Granite 3.0 là gì

Granite 3.0.webp
Granite 3.0 là mô hình AI mới nhất của IBM, được thiết kế để hỗ trợ các doanh nghiệp tối ưu hóa hoạt động và giảm chi phí. Các mô hình mới bao gồm các phiên bản:
Mục đích chung / Ngôn ngữ:
  • Granite 3.0 8B Instruct
  • Granite 3.0 2B Instruct
  • Granite 3.0 8B Base
  • Granite 3.0 2B Base
An toàn:
  • Granite Guardian 3.0 8B
  • Granite Guardian 3.0 2B
Mixture-of-Experts (MOE):
  • Granite 3.0 3B-A800M Instruct
  • Granite 3.0 1B-A400M Instruct
  • Granite 3.0 3B-A800M Base
  • Granite 3.0 1B-A400M Base
Antoan.webp
Granite Guardian 3.0 có mức độ an toàn cao hơn so với các mô hình khác
Các mô hình Granite 3.0 mới bao gồm các tùy chọn với kích thước 2 tỷ và 8 tỷ tham số, cùng các mô hình Mixture-of-Experts (MoE) như Granite 3.0 3B A800M Instruct và Granite 3.0 1B A400M Base. IBM cũng phát triển các phiên bản Granite Guardian 3.0 với các tính năng bảo vệ nhằm đảm bảo an toàn và độ tin cậy, giúp ngăn chặn việc mô hình bị lạm dụng để tạo nội dung không mong muốn. Các mô hình Granite 3.0 này sẽ có sẵn trên nền tảng watsonX của IBM, cũng như trên Amazon Bedrock, Amazon Sagemaker và Hugging Face. Điều này mang lại cho khách hàng khả năng truy cập và tích hợp dễ dàng các mô hình AI tiên tiến của IBM vào hệ thống hiện có của họ.

Điểm mạnh của Granite 3.0

Hiệu suất cao và chi phí thấp

Một trong những điểm nổi bật của Granite 3.0 là hiệu suất hoạt động cao và chi phí thấp. IBM tuyên bố rằng Granite 3.0 có thể mang lại hiệu suất vượt trội so với các mô hình AI hiện có từ Google, Anthropic và các đối thủ khác, đồng thời chi phí cho mỗi token được tạo ra thấp hơn 95% so với các mô hình khác. Điều này giúp doanh nghiệp có thể triển khai AI một cách hiệu quả và kinh tế hơn, thúc đẩy việc áp dụng AI vào các tình huống thực tiễn như dịch vụ khách hàng, tự động hóa, BPO, phát triển ứng dụng và an ninh mạng.
Granite 3.0 nhanh và tốn chi phí ít hơn nhiều so với các mô hình ngôn ngữ lớn khác.webp
Granite nhanh và tốn ít chi phí hơn nhiều so với các mô hình khác
IBM cũng đã sử dụng Granite 3.0 để phát triển các ứng dụng AI nội bộ, giúp các công ty như Camping World tăng 33% hiệu suất hỗ trợ khách hàng, Coca-Cola tiết kiệm hơn 40 triệu USD trong chi phí mua sắm, và chính IBM đã tiết kiệm được 150 triệu USD trong vấn đề chuỗi cung ứng. Nhìn chung, IBM đã tiết kiệm 2 tỷ USD nhờ việc tối ưu hóa các hoạt động bằng AI.

Dữ liệu và kiến trúc huấn luyện cải thiện

IBM.webp
Các mô hình Granite đã được huấn luyện trên siêu máy tính BlueVela mới của IBM, được trang bị Nvidia H100.
Granite 3.0 được huấn luyện dựa trên 12 nghìn tỷ token dữ liệu từ nhiều ngôn ngữ và mã nguồn, sử dụng siêu máy tính BlueVela mới của IBM, được trang bị GPU Nvidia H100 và kết nối InfiniBand để tăng tốc độ huấn luyện. IBM cũng đã cải tiến chất lượng dữ liệu và kiến trúc huấn luyện, giúp mô hình này đạt được các tiêu chuẩn hiệu suất cao nhất trên thị trường.
Điều khác biệt của Granite 3.0 so với các thế hệ trước không chỉ ở hiệu suất mà còn nằm ở việc kết quả trả về được đảm bảo an toàn và độ tin cậy. Theo IBM, các mô hình Granite Guardian giúp ngăn ngừa việc mô hình bị lạm dụng, đảm bảo rằng AI không tạo ra nội dung gây hại. Điều này giúp các doanh nghiệp yên tâm khi triển khai AI vào các ứng dụng thực tiễn.

Mã nguồn mở

Một trong những yếu tố quan trọng khiến Granite 3.0 trở nên hấp dẫn đối với doanh nghiệp là IBM đã phát hành các mô hình này dưới giấy phép Apache 2.0 được Open Source Initiative (OSI) phê duyệt. Điều này giúp các đối tác của IBM có thể xây dựng thương hiệu và tài sản trí tuệ dựa trên các mô hình Granite mà không gặp rào cản về bản quyền. Khác với các mô hình mở khác như Llama của Meta, Granite 3.0 mang lại tính linh hoạt cao nhất cho các doanh nghiệp trong việc phát triển các giải pháp dựa trên AI.

Hướng tới tương Lai: Generative Computing

[​IMG]
Nhìn về tương lai, IBM đang hướng tới một khái niệm mới gọi là generative computing. Hướng đến một cách lập trình mới, trong đó thay vì viết ra các hướng dẫn chi tiết, người dùng chỉ cần cung cấp các ví dụ hoặc hướng dẫn đơn giản để máy tính tự suy luận và tạo ra kết quả. Điều này mở ra một phương thức lập trình hoàn toàn mới, và IBM sẽ đầu tư mạnh mẽ để phát triển các mô hình thế hệ tiếp theo cùng các framework mới dựa trên generative computing.
Theo ông Dario Gil, Phó chủ tịch cấp cao kiêm giám đốc nghiên cứu của IBM cho biết đây là bước tiến quan trọng tiếp theo trong cuộc cách mạng Gen AI và sẽ tạo điều kiện để doanh nghiệp triển khai các ứng dụng AI một cách toàn diện và nhanh chóng hơn.

Tạm kết

Với việc ra mắt Granite 3.0, IBM đang tạo ra một bước ngoặt trong cách doanh nghiệp áp dụng trí tuệ nhân tạo. Những cải tiến vượt trội về hiệu suất, chi phí và tính linh hoạt của Granite 3.0 sẽ giúp các công ty tận dụng tối đa tiềm năng của AI, từ đó tạo ra giá trị kinh doanh thực sự. Đồng thời, chiến lược mã nguồn mở và hướng đi mới với generative computing của IBM hứa hẹn sẽ mở ra một tương lai mới cho việc phát triển và ứng dụng trí tuệ nhân tạo trong mọi lĩnh vực.
Nguồn: IBM, forbes, venturebeat
13 bình luận

Xu hướng

Hot trend nhất trong 3 ngày qua là bitnet kết hợp 1 mô hình LLM chứ ko phải thứ củ chuối nửa vời đến từ thg IBM này 😆))
@GLES kết hợp là sao cơ bác nhỉ? tưởng bitnet là 1 mô hình LLM rồi b ?
@zixzaxzo bác phải dùng kèm bitnet với 1 LLM khác là llama hay gemini chẳng hạn, vì nó chỉ là inference framework
@GLES cám ơn bác
@GLES Mình vẫn chưa nắm rõ về bitnet của MS. Bitnet có chạy được các mô hình trên huggingface không hay chỉ chạy được các mô hình tham số nhỏ hoặc mô hình được tạo riêng cho bitnet ạ ?
@TheShinichi cơ bản nó dành cho mô hình nhỏ về cái inference trên máy low spec enduser á bác, còn bác muốn dùng model lớn vẫn được nhưng ko thể hiện rõ sức mạnh
IBM như c*t , doanh nghiệp ở vn muốn đăng ký cái tài khoản cloud mà bắt xác minh đủ kiểu , qua azure cho lẹ
@nefertem có tiền mua lại thg red hat thôi chứ giờ ko ai nhớ nó có tác động gì đến thị trường IT =)))

điển hình là bài này có 3 lượt comment =))
@GLES đăng ký có được đâu mà xài , sau nó là thằng oracle
Cười vô mặt
@nefertem OCI ok mà bạn. Tui đang xài Azure và OCI 😁
@TheShinichi OCI nó ok mà nhưng cách quản lý nó quá lu bu
haha để từ từ dịch bài của nhân viên IBM luôn, cty lạc hậu lắm rồi
Hóng xem

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2026 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: 351/56 Lê Văn Sỹ, P. Nhiêu Lộc, Tp HCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép cung cấp dịch vụ MXH số 134/GP-BVHTTDL, Ký ngày: 30/09/2025