MediaTek, Samsung, Qualcomm, Apple và gần như mọi hãng làm chip khác đều có gắng tích hợp nhân xử lý AI (trí tuệ nhân tạo) vào SoC của họ. Trước đây việc này thường diễn ra ở thị trường di động, nhưng giờ đến cả laptop cũng đã có rồi. Vì sao các hãng lại tích hợp vô làm gì?
Ngày nay người ta chọn điện thoại rất đơn giản: chụp hình đẹp, quay phim ngon, chơi mạng xã hội ổn, chạy mấy ứng dụng phổ biến ngon và pin lâu là đủ rồi. Trong số đó, những thứ về phần mềm và app thì sức mạnh của các con SoC hiện nay, từ tầm trung đến cao cấp, đều đã dư sức đáp ứng. Chỉ có phần chụp hình quay phim là cần nhiều sự hỗ trợ.
Trước đây chúng ta thường nghĩ tới việc camera chụp hình đẹp thì phải có phần cứng tốt. Đúng, nhưng chưa đủ. Ống kính tốt, cảm biến tốt chỉ mới giúp được cho việc ghi nhận ánh sáng vào máy, nhưng còn từ khâu ánh sáng cho đến khi ra thành file ảnh mà bạn có thể sử dụng được thì phải nhờ vào phần mềm. Ngay từ những ngày đầu của thế giới ảnh số, người ta đã phải phát triển nhiều thuật toán để biến dữ liệu ghi nhận từ các pixel đơn lẻ thành một tấm ảnh cuối cùng. Ngày nay, các thuật toán đó ngày càng phức tạp hơn ở từng bước xử lý, và người ta cũng thêm nhiều bước hơn.
Chụp ảnh đẹp, chụp ảnh đẹp, chụp ảnh đẹp
Ngày nay người ta chọn điện thoại rất đơn giản: chụp hình đẹp, quay phim ngon, chơi mạng xã hội ổn, chạy mấy ứng dụng phổ biến ngon và pin lâu là đủ rồi. Trong số đó, những thứ về phần mềm và app thì sức mạnh của các con SoC hiện nay, từ tầm trung đến cao cấp, đều đã dư sức đáp ứng. Chỉ có phần chụp hình quay phim là cần nhiều sự hỗ trợ.
Trước đây chúng ta thường nghĩ tới việc camera chụp hình đẹp thì phải có phần cứng tốt. Đúng, nhưng chưa đủ. Ống kính tốt, cảm biến tốt chỉ mới giúp được cho việc ghi nhận ánh sáng vào máy, nhưng còn từ khâu ánh sáng cho đến khi ra thành file ảnh mà bạn có thể sử dụng được thì phải nhờ vào phần mềm. Ngay từ những ngày đầu của thế giới ảnh số, người ta đã phải phát triển nhiều thuật toán để biến dữ liệu ghi nhận từ các pixel đơn lẻ thành một tấm ảnh cuối cùng. Ngày nay, các thuật toán đó ngày càng phức tạp hơn ở từng bước xử lý, và người ta cũng thêm nhiều bước hơn.
Để đáp ứng được yêu cầu sức mạnh như vậy cần 1 con chip mạnh hơn. Nhưng nếu chỉ dùng CPU, GPU không thì vẫn chưa đủ, các thuật toán computer vision và kết hợp thuật toán machine learning vẫn cần nhiều sức xử lý hơn để hoàn thành công việc trong thời gian ngắn, không ảnh hưởng đến trải nghiệm chụp hình của người dùng. Thế nên người ta mới nghĩ đến việc sử dụng một bộ phận riêng nằm trong SoC để tăng cường khả năng xử lý riêng cho các tác vụ trí tuệ nhân tạo.
Trước đó, nhiều công ty cũng đã sử dụng các bộ xử lý riêng để tăng cường khả năng xử lý cho một số tác vụ nhất định. Intel có co-processor Xeon Phi, Google có các bộ xử lý TPU (hình dưới), NVIDIA thì tận dụng GPU của họ và bổ sung thêm các tính năng cần thiết để tăng tốc xử lý cho những bài toán khó. Các bộ xử lý này được xây dựng, thiết kế ngay từ đầu cho những bài toán cụ thể, ở đây là bài toán về AI, về computer vision, về machine learning, thế nên bọn chúng có thể giải các bài này rất hiệu quả. Trong khi đó, CPU và GPU thì làm được nhiều thứ, đa tài, nhưng lại không sâu ở một mảng duy nhất nên khi xử lý các bài toán AI thì nó kém hiệu quả hơn.
Những giải pháp nói trên ngày xưa chủ yếu dùng cho máy tính và server, chứ không dùng cho di động vì kích thước to, tốn nhiều năng lượng. Còn bây giờ, nhờ sự tiến bộ của việc sản xuất chip, điển hình là việc thu nhỏ kích thước chip, người ta giờ đã có thể tích hợp bộ xử lý tăng tốc vào trong SoC, bên cạnh CPU và GPU. Bộ xử lý đó vì được tối ưu cho bài toán về AI, nên thường được gọi là nhân xử lý trí tuệ nhân tạo.
Quay trở lại thực tế, hiện nay gần như mọi hãng làm chip từ MediaTek, Qualcomm đến Samsung, Apple đều cố gắng tối ưu luồng xử lý ảnh trên SoC của họ cho ảnh đẹp hơn, sáng hơn, cố gắng tách chủ thể ra khỏi nền để có thể điều chỉnh màu sắc, ánh sáng cho chủ thể mà không làm ảnh hưởng tới tổng thể bức hình. Rồi người ta còn cố gắng xóa phông, thay phông bằng hình ảnh khác, chống rung, ghép nhiều ảnh vào làm một… Các bộ xử lý AI giúp rất nhiều cho khâu này, nếu chỉ dùng CPU và GPU để xử lý thôi thì sẽ chậm hơn, hao pin hơn.
Chẳng phải ngẫu nhiên mà khi iPhone ra mắt, khi Galaxy ra mắt, trong các sự kiện ra mắt của MediaTek, Qualcomm thì họ đều dành nhiều thời gian để nói về SoC của họ giúp cho điện thoại chụp ảnh đẹp như thế nào.
Chụp đêm, chụp đêm, chụp đêm
Trong tất cả những mảng mà AI có thể giúp cho ảnh đẹp hơn, việc cải thiện ảnh chụp thiếu sáng là một điểm nhấn mạnh trong khoảng 3 năm trở lại đây. Không cần phải có phần cứng quá khủng, vẫn có thể cho ra những tấm ảnh chụp thiếu sáng cực kì ấn tượng, nói vui là “sáng như ban ngày”. Mở đầu cho trào lưu này là Google Pixel với ứng dụng Google Camera, thậm chí nó còn không cần bộ xử lý AI để có thể làm được chuyện đó. Sau này Google bổ sung thêm bộ xử lý AI riêng cho các máy Pixel để góp phần giúp tính năng chụp ảnh, trong đó có việc xử lý ảnh thiếu sáng, thêm nhanh chóng.
Quảng cáo
Các giải pháp mà những hãng làm chip hoặc hãng sản xuất điện thoại thường làm để cải thiện ảnh chụp đêm là:
- Chụp nhiều ảnh, sau đó dùng thuật toán để cân chỉnh cho ảnh khớp và ghép lại với nha. Như vậy có thêm dữ liệu để xử lý, và có thêm chi tiết trong ảnh
- Tăng khả năng xử lý noise: sử dụng thuật toán để phát hiện các vùng bị noise nhiều, lấy mẫu vùng đó để đè lại noise, đồng thời nhận diện đường nét chủ thể để tăng độ nét, tránh bị bệt
- Tăng thời gian phơi sáng, và dùng AI để hạn chế rung tay
Để xử lý đoạn này, cần vừa mạnh vừa nhanh, chứ không thì thời gian cần để ra được tấm ảnh hoàn chỉnh sẽ rất lâu. Thế nên những con chip mới ra mắt như Snapdragon 888, MediaTek Dimensity 1200 đều được nhà sản xuất quảng cáo rằng chúng giúp chụp ảnh ở chế độ thiếu sáng nhanh hơn, mở rộng tính năng chụp thiếu sáng ra cho ảnh góc rộng, ảnh panorama…
Nhận diện hình ảnh, xử lý giọng nói và những thứ râu ria khác
Đây là những tính năng bổ sung nên mình tạm gọi nó là “râu ria”. Các tính năng mới của Android, iOS cần khá nhiều thứ liên quan tới AI, ví dụ như:
- Nhận diện giọng nói để dùng Google Assistant và Siri
- Nhận diện hình ảnh để phân loại ảnh, nhận diện mặt người trong ảnh, tự nhóm ảnh theo người
- Nhận diện chữ trong ảnh (như Google Translate, LiveText trên iOS 15)…
Những chức năng này nghe qua thì có vẻ đơn giản, nhưng chúng cũng đều là những thuật toán AI phức tạp cần sức mạnh lớn từ SoC. Việc có mặt một bộ xử lý AI giúp các tính năng này trở thành hiện thực, chứ nếu không có thì trải nghiệm sẽ chậm lắm và nhà sản xuất sẽ không triển khai nó rộng rãi. Như LiveText của iOS 15 chẳng hạn, bạn cũng phải sở hữu iPhone, iPad chạy chip A12 Bionic trở về sau mới dùng được, chứ máy cũ hơn là không xài được đâu.
Quảng cáo
Mở rộng ra hơn, các app bên thứ 3 cũng ngày càng dùng nhiều về AI, nhất là trong khâu xử lý ảnh. Những mô hình machine learning dùng trong các app này cũng cần phải được xử lý tốt nhờ con chip, và nhiều thư viện xây dựng mô hình machine learning hiện nay cũng có tối ưu cho một số bộ xử lý AI. Nên chuyện phải có AI processor là tất yếu thôi.
Sự quan trọng của những tính năng liên quan đến AI chính là lý do mà các bộ xử lý AI xuất hiện ngày càng nhiều trong những SoC di động, và đây là một hướng đi tốt.