Trí thông minh nhân tạo của Microsoft đã thắng con người, giành điểm tuyệt đối khi chơi Pac Man

ND Minh Đức
15/6/2017 7:57Phản hồi: 65
Trí thông minh nhân tạo của Microsoft đã thắng con người, giành điểm tuyệt đối khi chơi Pac Man
Mặc dù có cách chơi đơn giản, dễ nắm bắt, dễ điều khiển nhưng trong suốt gần 40 năm lịch sử của trò chơi Pac-Man, vẫn chưa có ai trong số nhân loại “phá đảo” được trò chơi này với điểm số tuyệt đối. Trớ trêu thay, điều đó mới đây lại được thực hiện không phải con người mà lại là máy tính, chính xác hơn là hệ thống trí thông minh nhân tạo (AI) phát triển bởi Maluuba - một nhóm công nghệ deep learning do Microsoft mua lại hồi đầu năm nay. Bằng cách sử kết hợp công nghệ máy học tăng cường với thuật toán chia để trị, AI của Maluuba đã đạt được điểm số tối đa 999.900 trong trò chơi Pac-Man, điều chưa hề có một game thủ nào trong lịch sử làm được.


Trên thực tế, các nhà nghiên cứu AI luôn có thiên hướng dùng các video game để test công nghệ machine leaning. Nguyên nhân vì các trò chơi này có thể mô phỏng lại sự hỗn loạn của thế giới thật trong một môi trường có kiểm soát tốt hơn so với những tựa game đánh cờ vốn đầy sự "tĩnh lặng”. Vào năm 2015, AI trí thông minh nhân tạo của DeepMind thuộc Google đã có thể học được cách chơi 49 game của Atari bằng công nghệ học tăng cường (reinforcement learning - RL), trong đó có thể đưa ra những phản hồi tích cực hoặc tiêu cực trong mỗi lần AI đưa ra quyết định nhằm giải quyết một vấn đề nào đó.

Dù đã chiến được khá nhiều tựa game hồi xưa những vẫn còn một số games có những đặc tính riêng về cách chơi mà AI chưa thể bá đạo được, Pac Man là một thí dụ điển hình cho điều đó. Nguyên nhân đơn giản vì game cố tình không đưa ra những thứ có thể dự đoán, thành ra con người chơi game này xưa giờ giỏi hơn máy tính nhiều. Tuy nhiên, nhiều game thủ dũng cảm đã có gắng phá đảo trò chơi này nhưng vẫn chỉ dừng lại ở kỷ lục (đối với con người) là xấp xỉ 266.330 điểm trên phiên bản Atari 2600. Còn số điểm tuyệt đối 999.900 chỉ có thể đạt được nếu chơi ăn gian.


Lần này, nhóm phát triển Maluuba chọn cách tiếp cận dùng AI để chiến thắng trò chơi bằng cách xé nhỏ các tác vụ ra thành những công việc nhỏ hơn và giao cho 150 nhân tố xử lý. Họ dạy AI dùng kiến trúc gọi là Phần thưởng lai (Hybrid Reward Architecture) - trong đó là sự kết hợp giữa học tập tăng cường với phương pháp chia để trị. Mỗi nhân tố xử lý sẽ được gán cho một phần tác vụ, thí dụ như tìm một hạt cụ thể, và cùng nhau đạt được mục tiêu lớn hơn. Sau đó, Maluuba thiết kế ra một nhân tố xử lý cao nhất với nhiệm vụ thu lấy đề nghị từ tất cả những nhân tố bên dưới nhằm đưa ra một quyết định cho từng bước đi trong Pac Man.

Kết quả thu được sẽ là tốt nhất khi mỗi nhân tố xử lý hành động một cách ích kỷ nhất và nhân tố quản lý sẽ tập trung vào việc chọn ra cái gì là tốt nhất cho cả nhóm, nghĩa là không chỉ quan tâm tới việc có bao nhiêu nhân tố muốn đi theo một hướng cụ thể nào đó mà quan trọng hơn là hướng đi đó sẽ có ảnh hưởng gì tới toàn cục. Thí dụ như dù chỉ có vài nhân tố xử lý muốn chạy tránh bọn ma nhưng đối khi quản lý lại coi trọng việc đó hơn là số đông nhân tố xử lý muốn ăn hạt. Harm Van Seijen, nhà nghiên cứu tại Maluuba cho biết: “Có sự tác động qua lại khá tuyệt vời ở đây. Đó là tác động giữa việc cách làm việc giữa mỗi cá nhân trong mối liên hệ với sự hợp tác dựa vào mức độ ưu tiên của tất cả các cá nhân, đồng thời, mỗi cá nhân cũng chỉ thực hiện 1 vấn đề duy nhất. Từ đó sẽ tạo nên lợi ích cho toàn cục.”

Nhóm phát triển Maluuba cho biết phiên bản AI Hybrid Reward Architecture sẽ có nhiều ứng dụng quan trọng, thí dụ như giúp dự đoán doanh số bán hàng của một công ty hoặc hỗ trợ hiệu quả cho quá trình xử lý ngôn ngữ tự nhiên.

Tham khảo Theverge, Bandai
65 bình luận
Chia sẻ

Xu hướng

Tuyệt
Trò này ngày xưa cũng nghiện, mới chơi toàn bị chết, sau này khôn hơn chút thì chơi cũng thích! Giờ thi thoảng cũng ôn lại tuổi thơ trên iPad với game này 😁
(Sent from CRAZYSEXYCOOL1981 using Blackberry PASSPORT.se)
vtchung123
ĐẠI BÀNG
7 năm
@crazysexycool1981 Bác ngày xưa đi xe bus hay viết tên lên ghế gần cuối xe ah?
Con người đúng là ngu hơn máy tính, thật đáng xấu hỗ
cuong642
TÍCH CỰC
7 năm
@sonnguyenpro chú lại phán bừa rồi, cái máy nó đc lập trình, tính toán để chơi game. giờ chú tính nhẩm, với tính bằng máy tính cái nào nhanh hơn. hay lại bảo máy tính thông minh hơn
@sonnguyenpro
1: đừng quên con ng tạo ra chúng
2: cho AI chơi gane online xem mọi thứ nó có khác không
Nói như bn chả khác j chống lại con ng, nói cách khác là khih rẻ đồng loại
Aduckuba
@cuong642 Thế chơi cờ tướng sao mà lập trình trước được, nói mà không suy nghĩ gì hết, thua cả AI nữa, đúng là con người quá ngu dốt
TtMn
Trứng
7 năm
@sonnguyenpro Con người tạo ra máy tính để giúp chúng ta làm việc hiệu quả hơn! Nên việc chúng ta ngu hơn nó cũng chả có gì là đáng xấu hổ cả!
Vãi thật
cuong642
TÍCH CỰC
7 năm
@trung tranquang có gì đâu. nó đc lập trình để chơi. nên mọi hoạt động của nó chính xác 100% thôi.
Klq nhưng mới coi Kamen rider cũng có pacman 😁
heorung52
TÍCH CỰC
7 năm
Mấy ông đọc bài chưa đó?
@heorung52 Xem rồi có sao ko cụ? Cần biết lý do à? Xem hết video youtube chưa?
heorung52
TÍCH CỰC
7 năm
@tuanminhxd1 Lấy top rồi xem video sau ah?
nibiru
TÍCH CỰC
7 năm
Tóm lại ai đang đi đầu ???!!!! Google, M$, IBM, Amazon, hay Apple ....
Cho AI xem phim JAV nhiều thì nó sẽ học được điều gì nhỉ :p
@Bạn và 500 Anh Em gặp ai cũng đòi ...ịch 😁
vucv
ĐẠI BÀNG
7 năm
@Bạn và 500 Anh Em Nó sẽ phân tích hình ảnh, tiếng động... đưa ra thời gian trung bình cho 1 lần quan hệ thế nào là tốt nhất, tư thế nào phổ biến nhất, dễ lên đỉnh nhất, nhịp độ nhanh chậm thế nào, màn dạo đầu, phương pháp tối ưu, đâu là lời rên giả tạo, đâu là thật...vân vân và mây mây!
Thế thì ghê rồi. Mấy nữa nó còn tự suy nghĩ tổng hợp sáng tạo ra những cái mà nhiều năm nữa con người mới tìm ra thì he he
Hạn hán lời
@Phùng Minh Thiện Cô bé khô lời
dạo này cụm từ “trí thông minh nhân tạo” đang bị lạm dụng, riết rồi ai cũng nghĩ đó là trí thông minh thật, trong khi thực chất đây chỉ là phương pháp “tìm phương án tối ưu” thôi
Từ từ thì NÓ cũng thắng "tất cả" khi đấu với con người thôi...
Giờ chỉ là muỗi, là dấu hiệu ban đầu thôi!
@MrDuc2010 Sau này ai giỏi sẽ đc nó thuê để làm osin, dốt thì nó sa thải 😆)))))
Trò này cần thông minh, nghĩ nhanh và 60% là thao tác nhanh. Vậy con người so với máy tính là không công bằng vì máy tính nghĩ được là gần như điều khiển tức thời luôn. Con người từ nghĩ đến bấm phím để đổi hướng đã có độ trễ tương đối rồi.
SuperBuLL
ĐẠI BÀNG
7 năm
Ngày đó không còn xa ((= [​IMG]
OxJade
TÍCH CỰC
7 năm
ở đâu có sonnguyenpro ở đó có biến mà sao các huynh đệ dễ mất bình tĩnh thế :v
kamikazeq
ĐẠI BÀNG
7 năm
Khúc 2:22, ko chịu đi đường kia ăn cho rồi, đứng chờ ăn sát rạt con ma vậy đó hẻ.
Ko biết người lập có cho phép "nó" mạo hiểm ko ta?
@kamikazeq Cái video bác coi là fake. Còn video của tinhte đưa đầu post mới là thật
a2tanhtuan
ĐẠI BÀNG
7 năm
Không phải noá ngày càng thông minh hơn mà con người ngày càng ngu đi.
Có nên xem đó là thành công??^^
macinPhone
TÍCH CỰC
7 năm
nhầm nhò gì với AI khựa, vãi nó đòi trị vì thay anh Trump đầu bạc, AI mà cũng nổ to như dân tộc khựa

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019