Cuộc đua tạo ra một trợ lý ảo AI hoàn hảo

P.W
23/5/2024 9:40Phản hồi: 16
Cuộc đua tạo ra một trợ lý ảo AI hoàn hảo
Tuần vừa rồi, ở đại bản doanh của Google tại Mountain View, Marc Rebillet, DJ nổi tiếng người Mỹ mặc bộ áo ngủ 7 sắc cầu vồng đã tạo ra sự háo hức trước khi keynote thuộc sự kiện I/O 2024 diễn ra, khi kết hợp với công cụ AI MusicFX DJ để tạo ra những bản nhạc bắt tai:



Ở 20 phút pre-show ấy, Rebillet mô tả việc công cụ MusicFX DJ tự tạo giúp cho anh những đoạn nhạc dựa trên những câu lệnh như tên nhạc cụ hay tên những bộ synth quen thuộc với dân làm nhạc. Thứ mà Rebillet mô tả chính là một trợ lý AI, một con bot được cá nhân hóa, giúp ích cho công việc, liên lạc và sáng tạo tốt hơn mỗi ngày, và tương tác với thế giới số cho người dùng.

Những sản phẩm này, dù đã hay chưa ra mắt, đều đang là xu hướng chiếm vị trí trung tâm trên những trang báo và trang tin công nghệ nước ngoài, thu hút sự chú ý gần như tuyệt đối trong hai tuần vừa qua, với những sản phẩm mới được DeepMind của Google và OpenAI được Microsoft hậu thuẫn công bố.

Google Astra, và OpenAI GPT-4o


Chỉ trong vòng hai ngày, cả Google lẫn OpenAI đều giới thiệu hàng loạt những công cụ AI được nâng cấp, với “đa tính năng”, nhận diện được gần như mọi dạng dữ liệu đầu vào, từ văn bản, code lập trình, giọng nói, hình ảnh cho tới cả video clip. Rồi chúng còn có cả khả năng ghi nhớ để lên kế hoạch phục vụ con người, cũng như thực hiện những tác vụ phức tạp như dịch thuật theo thời gian thực.

Trong video trình diễn, trợ lý ảo AI Astra đang thử nghiệm của Google, vận hành dựa trên mô hình Gemini, đã phản hồi những lệnh giọng nói của người dùng, dựa trên những hình ảnh mà thiết bị kính thông minh hoặc camera điện thoại ghi được xung quanh không gian người dùng. Nó xác định được những dòng code lập trình, nhận ra khu vực King's Cross ở London qua ống kính camera, rồi nhắc người dùng vị trí họ bỏ quên cặp kính thông minh.



Còn bên OpenAI, hôm thứ 2 tuần trước, giám đốc công nghệ Mira Murati cùng các đồng sự của cô đã trình diễn GPT-4o, mô hình AI phiên bản mới, có sức mạnh thế nào khi dịch thuật theo thời gian thực, tương tác với người dùng thông qua tông giọng tự nhiên để xử lý văn bản, hình ảnh, video và code lập trình. Cô Murati nói với tờ Financial Times: “Điều này vô cùng quan trọng vì chúng ta đang nhìn vào tương lai của việc con người và máy móc tương tác với nhau.”

Những trợ lý ảo thông minh vận hành nhờ sức mạnh của mô hình ngôn ngữ đã được nghiên cứu phát triển trong gần chục năm nay, nhưng đến tận bây giờ, những tiến bộ mới nhất trong quá trình nghiên cứu đã tạo ra những tương tác mượt mà và xử lý nhanh hơn, cũng như khả năng máy móc hiểu con người tốt hơn nhiều nhờ những mô hình ngôn ngữ lớn.

Cuộc chạy đua trở thành việc hãng nào sẽ tung ra thị trường trợ lý ảo AI phục vụ người dùng trước tiên, và tập đoàn nào sẽ hưởng lợi nhiều nhất từ công nghệ và giải pháp mới.

Bản thân CEO Sundar Pichai của Google thì gọi đây là “những hệ thống thông minh”, “với khả năng lý luận, lên kế hoạch và có trí nhớ, có khả năng xử lý logic vài bước, vận hành xuyên suốt các phần mềm và hệ thống, để làm xong việc cho con người.”

SP-SocialShare-Update.width-1300.jpg

Quảng cáo


Giống hệt như Google và OpenAI, Apple cũng được cho là một cái tên sẽ thay đổi cuộc chơi. Những người trong ngành và các nhà phân tích thị trường công nghệ kỳ vọng Apple sẽ có bản cập nhật lớn cho Siri, bên cạnh những chip xử lý mới có sức mạnh xử lý AI mạnh hơn trước, tất cả phần cứng và phần mềm đều được Apple tự phát triển.

Còn trong khi đó, Meta, chủ quản những nền tảng hàng tỷ người dùng trên toàn thế giới như Facebook, Instagram hay WhatsApp thì đã tung ra trợ lý AI từ hồi tháng 4.

Những startup như Rabbit và Humane thậm chí còn tạo ra những chiếc máy chạy bằng mô hình ngôn ngữ kết nối với data center, để những chiếc máy nhỏ gọn ấy trở thành trợ lý ảo phục vụ con người hàng ngày.

4-1280x720.jpg

Dù rằng nhiều nhà phân tích cho rằng, hầu hết những công nghệ và tuyên bố mới từ Google và OpenAI đều chưa đến được tay người dùng trên toàn thế giới, đều mới chỉ là ý tưởng thay vì sản phẩm thực tế, nhưng có một điều rõ ràng: Trợ lý ảo AI sẽ là thứ sản phẩm đem công nghệ trí thông minh nhân tạo đến với tất cả mọi người.

Mustafa Suleyman, nhà sáng lập DeepMind, giờ là giám đốc Microsoft AI: “Không cần nghi ngờ gì, bây giờ là thời điểm của trí thông minh nhân tạo phục vụ cá nhân. Silicon Valley luôn luôn nói công nghệ là một công cụ giúp làm mọi việc hiệu quả và nhanh hơn. Nhưng cũng thấy ấn tượng, những công cụ ấy giờ đang nằm trong tay những nhà sản xuất sản phẩm thương mại. Công nghệ đã trưởng thành đủ để trở thành nền tảng phát minh ra những thứ mới, và giờ là lúc chúng ta được nhìn thấy sản phẩm.”

Quảng cáo


Cuộc đua từ tập đoàn lớn đến startup nhỏ


Trong gần 1 thập kỷ qua, các tập đoàn công nghệ đã cạnh tranh để đem AI đến người tiêu dùng, thông qua những trợ lý ảo như Siri của Apple, Cortana của Microsoft và Alexa của Amazon.

Google thì có trợ lý ảo từ tận năm 2016. Khi ấy CEO Pichai vẽ ra một tương lai hậu smartphone, nơi trí thông minh nhân tạo được tích hợp vào mọi thứ, từ kính thông minh đến loa thông minh. Nhưng 8 năm sau, hiện tại, smartphone vẫn cứ là nền tảng tương tác chủ yếu của hàng tỷ người trên thế giới để họ liên lạc với nhau, để làm việc và tương tác với thế giới công nghệ. Những trở ngại của công nghệ trợ lý ảo là độ trễ khi tương tác, tốc độ trả lời chậm chạp, rồi cả những lỗi trong quá trình nhận diện giọng nói của người dùng, dẫn tới việc xử lý sai hoặc không xử lý được lệnh con người đưa ra.

google-io-2018-google-assistant-7136.webp

Năm 2017, bước ngoặt được các nhà nghiên cứu AI hàn lâm tạo ra. Nó được gọi là Transformer, công nghệ đang gắn liền với mọi mô hình AI phổ biến nhất hiện tại, với khả năng tăng tốc độ xử lý ngôn ngữ tự nhiên. Nhưng theo nhà phân tích Ben Thompson, để trợ lý AI đủ sức mạnh và chất lượng để thuyết phục tất cả mọi người sử dụng, “thứ quan trọng nhất là tốc độ. Sau khi vượt qua hai hàng rào tốc độ và độ trễ, công nghệ này dùng mới vui được. Cảm giác tuyệt vời khi bạn nhận được câu trả lời gần như ngay lập tức rất khác với việc nói xong ngồi đợi máy móc xử lý.”

Thompson chỉ ra một cải tiến của Google và chế độ tìm kiếm trực tuyến có sự trợ giúp của AI, gọi là Search Generative Experience, đưa ra những thông tin AI tạo sinh bên cạnh danh sách đường link tổng hợp từ câu lệnh tìm kiếm truyền thống: “Tốc độ càng lúc càng nhanh và chất lượng ổn định, nên tôi đang sử dụng tính năng này nhiều hơn, dùng ChatGPT ít hơn. Google hiểu rõ điều này hơn ai hết, rằng ngay cả vài mili giây nhanh hơn hay chậm hơn cũng tạo ra khác biệt trong cách người dùng ở lại với một dịch vụ.”

Đương nhiên công cụ cao cấp mà OpenAI vừa công bố cũng không phải dạng vừa. Phiên bản GPT-4o có thể dịch thuật qua lại giữa tiếng Anh và tiếng Ý ngay trong khi cuộc đối thoại diễn ra. Thompson cho rằng, cải tiến lớn nhất với OpenAI là trải nghiệm người dùng và sản phẩm ChatGPT. Những gì được trình diễn là thứ cần để thu hút người tiêu dùng, thay vì chỉ thu hút những doanh nghiệp.

IntroducingGPT-4o5-27screenshot-1280x720 copy.jpg

Apple đang chờ đợi


Các nhà đầu tư đương nhiên đang háo hức chờ đợi xem tại WWDC 2024, Apple sẽ đem tới sự kiện này những nâng cấp AI nào cho những hệ điều hành và các thiết bị công nghệ mà họ bán ra thị trường. Một phần cũng vì sự chậm chân này, nên giá cổ phiếu Apple cũng sụt giảm so với đà tăng trưởng của Microsoft lẫn Alphabet, chủ quản Google.

Tuần trước, OpenAI tuyên bố đã đạt được thỏa thuận với Apple để macOS có ứng dụng ChatGPT riêng. Cùng lúc, những thông tin không chính thức cũng nói rằng Apple đang tìm cách ứng dụng những mô hình GPT mà OpenAI phát triển hoặc Gemini do Google phát triển cho những chiếc iPhone. Cùng lúc, họ cũng đang thuê hàng loạt nhân sự cấp cao và đầu tư mạnh tay để tự nghiên cứu những giải pháp mô hình AI xử lý on device, không cần máy chủ đám mây.

Apple M4: Hệ quả vội vàng của việc Apple chậm chân trong cuộc chạy đua AI?

Giờ này vị trí của Apple hay chính bản thân Tim Cook có lẽ thực sự đang rất áp lực và mệt mỏi, mình đoán vậy. Cơ bản là như thế này. Apple luôn có một mục tiêu quan trọng nhất đối với hệ sinh thái thiết bị công nghệ mà họ tạo ra…
tinhte.vn

Phòng nghiên cứu Zurich của Apple: Lôi kéo hàng loạt kỹ sư và giám đốc Google về phát triển AI

Financial Times đã tiến hành theo dõi hàng chục tài khoản mạng xã hội LinkedIn kết nối doanh nghiệp, và phát hiện ra rằng Apple trong thời gian qua đã tuyển dụng rất nhiều chuyên gia về trí thông minh nhân tạo ở Google…
tinhte.vn


Những nhà phân tích nói rằng, lợi thế của Apple chính là hệ sinh thái các thiết bị iPhone, MacBook và iPad khổng lồ trên toàn thế giới, với hơn 2.2 tỷ thiết bị đang vận hành. Vị thế của Apple đủ để điều khiển cả quá trình thị trường ứng dụng những công cụ tạo sinh vào trợ lý ảo để phục vụ cho cuộc sống của mọi người.

siri.jpg

Theo Dan Ives của Wedbush, có thể Apple sẽ hợp tác với OpenAI để tạo ra “công nghệ Siri thế hệ mới”. Siri giờ sẽ trở thành một trợ lý ảo đủ khả năng xử lý những tác vụ cực kỳ phức tạp trên iPhone, rồi sau đó có thể biến thành một dịch vụ thu phí hàng tháng để trang trải cho chi phí vận hành data center của Apple, giống như những gì họ đang làm với iCloud, với Apple TV+ hay Apple Music.

Hôm thứ 2 tuần trước, sau khi OpenAI công bố GPT-4o, các nhà phân tích thị trường của Bank of America đã nhắc lại xếp hạng cổ phiếu Apple, nói rằng công bố của OpenAI có tiềm năng ứng dụng cho trợ lý ảo và những tính năng AI phục vụ cho các nhà phát triển ứng dụng trên App Store. Hệ sinh thái ứng dụng này đang đem về cho Apple từ 6 đến 7 tỷ USD mỗi năm, theo SensorTower.

Trợ lý ảo AI có phải hữu ích 100%?


Lợi thế của Google đối với trợ lý ảo AI nằm ở hàng loạt những ứng dụng phục vụ cuộc sống và công việc của hàng tỷ người dùng, từ thư điện tử đến lịch trực tuyến. Mọi công cụ đó đều có thể tích hợp AI.

Demis Hassabis, CEO Google DeepMind: “Lúc nào chúng tôi cũng nắm một luồng dữ liệu khác nhau, để giải mã và tạo ra quyết định cho người dùng các dịch vụ. Hãy tưởng tượng những trợ lý ảo có thể nhìn và nghe những gì chúng ta ra lệnh, hiểu được ngữ cảnh của những lệnh ấy, rồi nhanh chóng trả lời người dùng, tạo ra những tương tác vừa nhanh vừa tự nhiên.”

Cũng sẽ phải mất một khoảng thời gian trước khi điều này có thể trở thành hiện thực.

omid-armin-AGRtDoZlpYw-unsplas-8991-9381-1682856197.jpg

Ngành phát triển AI tạo sinh vẫn còn khá non trẻ, và những mô hình, dù có nhiều tham số tới đâu đi chăng nữa, thì vẫn có khả năng xảy ra tình trạng “loạn ngôn”, hay “hallucination”, nơi mô hình AI tạo ra những thông tin không có thực, không có nguồn gốc rõ ràng. Dùng AI hỗ trợ quá trình sáng tạo thì không nhiều vấn đề nghiêm trọng. Nhưng nếu trợ lý AI phục vụ công việc hàng ngày, nơi cần sự chính xác, thì AI sẽ phải cải thiện nhiều.

Theo Mustafa Suleyman, thử thách kế tiếp là mở rộng vận hành trợ lý AI cho hàng tỷ thiết bị trên toàn thế giới: “Đó sẽ là một ngành cạnh tranh vô cùng khốc liệt, khi mọi người quan tâm tới cả thương hiệu lẫn khả năng vận hành. Apple và Google, vì thế, sẽ có lợi thế rất lớn.”

Bret Taylor, chủ tịch hội đồng quản trị OpenAI thì cho rằng, việc giao diện trợ lý ảo hay chatbot thay thế cho những phần mềm và ứng dụng khác đang mang lại cơ hội cho nhiều công ty: “Ở thời điểm công nghệ đang có những thay đổi lớn như thế này, các startup hoàn toàn có cơ hội trở nên nổi bật và thành công, vì hiện tại gần như chưa có cái tên nào dẫn đầu thị trường cả.”

Trưởng khoa học gia mảng AI của Meta, Yann LeCun tháng 4 vừa rồi có tuyên bố như thế này ở một sự kiện tổ chức tại London: “Trong tương lai, mọi tương tác giữa con người và thế giới số đều sẽ thông qua trợ lý AI hoặc một ứng dụng tương tự. Chúng ta sẽ nói chuyện rất nhiều với những trợ lý ảo ấy. Mọi thứ tương tác với thế giới số đều sẽ được hệ thống AI quản lý.”

Theo FT
16 bình luận
Chia sẻ

Xu hướng

AI càng mạnh ứng dụng vào các thiết bị tiêu dùng tự động hóa hàng ngày thì quá tiện lợi
Từ lâu đã tự động hoá công việc với Power Automate. Chỉ đợi Mic tích hợp copilot vào Power Automate desktop. Copilot trong bản power Automate Office đã quá ngon rồi.
@Doof Heinz Nếu dùng AI trên điện thoại thì có app của thằng nào tiện nhất không bác nhỉ, hiện thỉnh thoảng cần mình toàn lên trình duyệt để dùng thằng Gemini hoặc Copilot mà thấy k được tiện lắm
Táo chậm chân hơn trong cuộc đua AI chung nhưng có vẻ bắt kịp trong AI local rồi ,
@hoanglong0712 AI local táo có dc thành tựu gì vậy
Không biết Mac có multi clipboard hay chưa chứ copy paste bên win sắp có AI rồi
@EvilArtist Có trên power toys rồi mà thấy bắt nhập gì gì đó OpenAI ms dùng đc
@EvilArtist paste trên win có AI rồi đó nhưng phải cài thêm PowerToys và mua credit của OpenAI API mới dùng đc
Screenshot (52).png
tmhung
TÍCH CỰC
23 ngày
Đúng ở chỗ thằng Apple có thể trễ về AI, nhưng nó là thằng có năng lực đưa AI vào cuộc sống người dùng ngon nhất. Đợt vừa rồi mình cũng mua S24u nhưng mấy tính năng AI của nó nói thiệt là chả bao giờ dùng tới, cái mình kỳ vọng nhất là ghi âm cuộc họp rồi chuyển thành văn bản ... cái này nó sai bấy nhầy, không thể dùng được, ba cái chỉnh sửa ảnh trực tiếp như xoá đối tượng hay generate background thì rất hiếm khi để sử dụng, rất nhiều function của giới android chỉ để bán hàng. Công nghệ là 1 phần, làm sao cho nó thích hợp để sử dụng là chuyện khác, cái này Apple thực sự làm tốt nhiều năm nay.

Còn về AI thì thằng Gemini chuối hơn ChatGPT thực sự, giá API rẻ thì có rẻ, nhưng tính toán và xử lý số liệu sai quá sai, ChatGPT nó top thị trường này rồi.
@tmhung AI gì của thằng táo ứng dụng vào cuộc sống vậy
tmhung
TÍCH CỰC
22 ngày
@Dragao_ct92 Đôi khi chịu khó đọc một chút: :nó là thằng có nặng lực nhất:. Nó đã làm chuyện đó trước giờ, ứng dụng công nghệ và thay đổi nhiều trải nghiệm người dùng trở nên tốt lên rồi. Cái thời nó ra cái điện thoại cảm ứng đa điểm, màn hình slide to unlock, rồi đến cảm biến vân tay, khuôn mặt, rồi thì 64bit trên di động .... những lúc đó android đâu mất rồi.
@tmhung thì kiếm bài nào viết về nó rồi nổ ai cấm, còn cái nào ko làm được thì tốt nhất im lặng.
tmhung
TÍCH CỰC
22 ngày
@Dragao_ct92 nói chuyện như thằng ngào thực sự 😆
Google+ Samsung+ BKAV mà phối hợp với nhau sẽ tạo ra 1 AI toàn năng ko thể tin nổi
@Doãn_Chí_Bình Bạn nói chuẩn thế nhỉ, và nên đề nghị đuổi thằng Apple ra khỏi danh sách này, chưa có gì mà lại viết “đang chờ đợi” tôi thà vote cho BKAV VÔ ĐỊCH THIÊN HẠ còn hơn 😆
Táo cóp giờ phải thỏa thuận để bâu trên lưng mấy thằng Open và GG thôi chứ ko đáng để nhắc đến tên trong cuộc đua AI

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019