Photoshop đã có AI, bản cập nhật thú vị nhất từ trước đến nay

Nhà Của Cáo
24/05/2023 21:05Phản hồi: 75
Photoshop đã có AI, bản cập nhật thú vị nhất từ trước đến nay
Adobe công bố bản cập nhật lớn dành cho Photoshop, có rất nhiều tính năng mới, hay ho, nhưng mình thấy hay nhất là phần AI Generative Fill. Trong video mình sẽ thử một vài tính năng cơ bản của Generative Fill trên Photoshop mới, xem nó làm được gì.



Cài đặt


[​IMG]
Logo mới bên trái, logo cũ bên phải.

Adobe ra hẳn một phần mềm mới có tên là Photoshop (Beta) logo mới, phần mềm cũ - phiên bản mà chúng ta vẫn đang dùng thì tên là Adobe Photoshop 2023. Bạn chỉ cần vào Adobe Creative Cloud tìm đến phần App và bấm cài đặt “Photoshop (Beta)”.


Thông tin cơ bản


Photoshop-cập-nhật-ai-2.jpg
Bản cập nhật mới sẽ có thêm một thanh công cụ di động, nhìn hiện đại hơn, chủ yếu hỗ trợ chúng ta tạo vùng chọn nhanh hơn.

Photoshop-cập-nhật-ai-3.jpg
Muốn dùng AI Generative Fill thì trước tiên phải tạo vùng chọn, sau khi tạo vùng chọn thì thanh công cụ mới sẽ có nút “Generative Fill” hoặc vào Edit => Generative Fill…

Tại Generative Fill bạn có thể điền prompt hay không, ví dụ như xoá chủ thể, xoá vật thể, mở rộng ảnh thì không cần điền, còn thêm vật thể, đổi background… thì cần điền prompt.

Photoshop-cập-nhật-ai-4.jpg
Mỗi lần generate bạn sẽ nhận được 3 kết quả, và có thể generate đến khi nào bạn thấy được kết quả ưng ý.

Xoá chủ thể


Photoshop-cập-nhật-ai-5.jpg
Tính năng đầu tiên mình thử là xoá chủ thể, bạn chỉ cần tạo vùng chọn chủ thể cần xoá, kinh nghiệm của mình là nên chọn Expand rộng ra tí xoá sẽ đẹp hơn. Sau khi tạo vùng chọn thì chọn Generative Fill => Generate và chờ nhận kết quả.

Quảng cáo


Photoshop-cập-nhật-ai-6.jpg
Trong các lần mình dùng thử thì tính năng này có các ưu điểm như sau:
  • Tốc độ ổn, không quá chậm.
  • Xoá khá sạch, có một vài kết quả cũng hơi lem nhem, nhưng đa phần là mình sẽ ưng được 1 trong 3 kết quả nhận được.
  • Nhận diện ánh sáng tốt, kết quả trả về có ánh sáng khớp với ảnh gốc, giả lập hướng ánh sáng, tính chất ánh sáng, và hay ở chỗ là nắng chiếu qua các tán lá, lốm đốm vẫn giả lập được, điểm cộng lớn.
  • Giả lập bề mặt chất liệu tốt, ví dụ như nền xi măng, sần sùi, lỏm chỏm, trông rất thật.

Photoshop-cập-nhật-ai-7.jpg
Sau khi thử xoá người thì mình cũng có thử xoá vật thể “rác” trong ảnh, ví dụ ảnh chụp hải đăng của mình, có một cái lan can xi măng không đẹp lắm.

Mình chỉ cần tạo vùng chọn vào cái lan can đó, và generate là xong, nhận được kết quả khá bất ngờ. PS đã giả lập phần thân hải đăng tốt, hợp lý, phần ánh sáng của tán cây in lên hải đăng vô cùng hợp lý. Phần lá cây, và cửa của hải đăng cũng được làm rất chi tiết, hướng sáng rõ ràng, vùng sáng tối phân biệt tốt.

Mở rộng hình ảnh


Photoshop-cập-nhật-ai-8.jpg
Tính năng “Mở rộng hình ảnh” cho phép bạn tuỳ ý thêm các phần không có thật vào ảnh, theo bất cứ tỉ lệ nào bạn muốn. Đơn giản là dùng công cụ Crop, mở rộng ảnh, tạo vùng chọn cho khu vực không có pixel và bấm Generate.

Quảng cáo


PS sẽ tự động nhận diện các đặc điểm của ảnh gốc và trả về kết quả phù hợp, ngay lần generate đầu tiên mình đã nhận được kết quả ưng ý.

Photoshop-cập-nhật-ai-9.jpg
Mình sẽ dùng tính năng này để biến ảnh dọc, thành một tấm ảnh ngang, ví dụ ảnh đang là 2:3 thì biến nó thành 3:2 hoặc 4:3 hay bất cứ tỉ lệ nào mình cần, vừa giữ lại toàn bộ ảnh gốc vừa mở rộng thêm ở hai bên.

Đây là giải pháp cứu cánh khi bạn cần ảnh làm cover, thumbnail nhưng chỉ có ảnh dọc mà thôi.

Tính năng này cũng cho ra kết quả chính xác, nhìn rất hợp lý, và đặc biệt là nó nhận diện được tiêu cự của ảnh gốc và kết quả có tiêu cự khá trùng khớp.

Thay đổi Background


Photoshop-cập-nhật-ai-10.jpg
Tương tự như các tính năng trên bạn chỉ cần tạo vùng chọn background bằng cách chọn “select subject” sau đó invert vùng chọn là được.

Photoshop-cập-nhật-ai-11.jpg
Lúc này trước khi bấm Generate thì bạn cần phải nhập prompt để AI có thể xác định được bạn cần gì. Ví dụ như ảnh này mình nhập “City” thì kết quả trả về liên quan đến thành phố, con đường, con phố…

Mình nghĩ tính năng này mình sẽ ít dùng, vì thay cả background thì đa phần các trường hợp sẽ mất tự nhiên và mình thường muốn giữ lại “tinh thần” của bản gốc.

Thay đổi quần áo


Photoshop-cập-nhật-ai-12.jpg
Bên trái là ảnh gốc, hai ảnh bên phải là generate.

Tương tự như thay background, mình chỉ cần chọn vào quần áo, và nhập prompt để thay đổi quần áo trong ảnh. Ví dụ như ảnh trên mình thử đổi thành quần jean, thì đơn giản là nhập prompt là jeans là ra. Các kết quả trả về mặc dù có ánh sáng tốt, chi tiết ổn, nhưng về tỉ lệ, độ thẩm mỹ, và sự trùng khớp thì không cao lắm, cần phải generate nhiều lần để có kết quả ưng ý.

Nhược điểm


Photoshop-cập-nhật-ai-13.jpg
Nhược điểm đầu tiên có thể nhận thấy là các phần generate có độ phân giải thấp, mặc dù có chi tiết tốt, mô tả các vùng chọn hợp lý nhưng các vùng này chỉ có độ phân giải cạnh dài (long edge) là 1024px. Nhìn tổng thể thì rất ổn nhưng khi bạn zoom lên thì sẽ nhận ra rõ ràng sự chênh lệch độ phân giải, mặc dù các ảnh sử dụng bên trên đa phần là chụp từ điện thoại.

Photoshop-cập-nhật-ai-14.jpg
Thứ hai là vẫn còn tồn tại nhiều vấn đề về giải phẫu học, bàn tay, bàn chân, mắt cá, tỉ lệ cơ thể vẫn còn nhiều lỗi thường gặp.

Photoshop-cập-nhật-ai-15.jpg
Thứ ba là nhìn tổng quan thì thấy ổn nhưng khi zoom vào, thì các chi tiết nó bất bình thường, nó như một mớ hỗn độn không phân biệt được là vật thể gì. Nhìn cận vào thì chắc chắn bạn sẽ không nhận ra bạn đang nhìn vào cái gì, nó chỉ đơn giản là các mảng màu sáng tối, để tạo cho ta cảm giác trùng khớp với ảnh gốc mà thôi.

Kết


Chắc chắn rằng mức độ ứng dụng của một tính năng AI trên PS là cao hơn rất nhiều so với các AI đơn lẻ khác. Chắc chắn rằng thời gian và công sức sẽ được tiết kiệm đi nhiều, nhưng cần phải cho nó thời gian, để tiếp tục phát triển khắc phục các lỗi và đặc biệt là nâng cao độ phân giải nữa là ngon.

Hãy mạnh dạn chia sẻ review về một món đồ, một dịch vụ mà bạn thấy hài lòng nhé. Thông tin của bạn giúp được cho rất rất nhiều người luôn đó, cảm ơn bạn trước :x

75 bình luận

Xu hướng

lâu quá mới thấy mod đăng bài
Dần sau này tất cả các app hậu kỳ đều có AI hỗ trợ, ko chuyên đều sẽ sớm sử dụng dễ dàng thuận tiện hơn.
Nó thay cái xe trong 1 nốt nhạc mặc dù nhiều lỗi lắm 😁 Nếu không dùng Photoshop Beta thì anh em có thể dăng ký trải nghiệm Firefly để thử mấy tính năng này.
DSC05157.jpg
@Booooozyer gấu vậy h ah a
@Booooozyer Beta mà.
Cơ mà ông mod này có nội dung chưa ok lắm. Adobe chưa đổi logo Photoshop nhé.
Bộ logo có nền ô-li là style đại diện cho phiên bản beta.
Image 5-25-23 at 19.36.jpg
Đỉnh thiệt 😁
Cái này giống upsample vậy, thông tin mở rộng là vô nghĩa, chỉ để đánh lừa cảm giác của người dùng.
Cười vô mặt
hay vậy để thử cám ơn mod
Screenshot 2023-05-25 at 3.40.13 PM.jpg
@Nam Air sao em không thấy cái BETA nhỉ
@akunemedia Đỉnh
@K I N G . P R T C có mà acc mình không cài đc
Screenshot_1.jpg
akunemedia
ĐẠI BÀNG
13 ngày
@Nam Air Em góp vui phát nữa nhé!
Này AI tự sáng tạo, em không kiểm soát được, các chủ tịt đừng đứm em!
Untitled-1.jpg
Saga0803
ĐẠI BÀNG
14 ngày
Sợ AI thiệt
100% các ứng dụng sử dụng AI được phát triển dựa trên OPEN AI.
May ko dùng hàng của Google ko lại phế
@tinhdg cho xin thống kê 100% đó
ndlehd
ĐẠI BÀNG
13 ngày
@tinhdg mô hình transfomer của Google phát triển mà bạn, chưa kể dreambooth, rồi xformers của Facebook đâu riêng gì OpenAI...
@tinhdg Ông ko biết thì ông im mợ đi, ko thì hỏi ngay chatgpt đi.
Sự phát triển của 1 công nghệ ko phải là hoàn toàn là công sức của 1 công ty làm ra, mà nó còn là kế thừa mồ hôi nước mắt của những công nghệ đi trước. Trong trường hợp này, rất may mắn là những model đi trước đều được opensource vì mục tiêu phát triển chung. Còn đến giờ kiếm tiền rồi thì OpenAI ko còn open nữa

Đây là câu trả lời của ChatGPT, bạn có thể thử, bớt nói nhăng nói cuội đi.

HỎI: "Liệt kê các models NLP quan trọng, bao gồm mốc thời gian và công ty làm ra nó"
TRẢ LỜI:

"Dưới đây là danh sách các mô hình NLP quan trọng, bao gồm công ty chịu trách nhiệm và mốc thời gian:

1. Word2Vec (2013) - Google: Word2Vec là mô hình được Google phát triển để nhúng từ vựng thành các vector số học, giúp hiểu được ngữ nghĩa và mối quan hệ giữa các từ.

2. LSTM (Long Short-Term Memory) (1997) - Hochreiter & Schmidhuber: LSTM là một kiến trúc mạng nơ-ron tái phát đặc biệt, được thiết kế để giải quyết vấn đề mất mát thông tin dài hạn trong việc xử lý ngôn ngữ tự nhiên.

3. Transformer (2017) - Google: Mô hình Transformer đã đóng góp quan trọng cho lĩnh vực xử lý ngôn ngữ tự nhiên, giới thiệu cơ chế trích xuất thông tin từ ngữ cảnh dựa trên sự chú ý tập trung (self-attention) và cấu trúc mã hóa - giải mã.

4. GPT (Generative Pre-trained Transformer) (2018) - OpenAI: GPT là một kiến trúc mạng nơ-ron sử dụng Transformer và được huấn luyện trước trên dữ liệu không giám sát lớn. Phiên bản đầu tiên của GPT đã đạt được sự tiến bộ đáng kể trong việc xử lý ngôn ngữ tự nhiên và tạo ra văn bản tự động.

5. BERT (Bidirectional Encoder Representations from Transformers) (2018) - Google: BERT là một mô hình học sâu sử dụng Transformer, đã thay đổi cách chúng ta xử lý ngôn ngữ tự nhiên. BERT được huấn luyện trên dữ liệu không giám sát lớn và có khả năng hiểu được ngữ cảnh từ trái sang phải và từ phải sang trái.

6. GPT-3 (2020) - OpenAI: GPT-3 là phiên bản tiếp theo của GPT, với kích thước mô hình lên đến 175 tỷ tham số. Đây là một trong những mô hình NLP lớn nhất và có khả năng tạo ra văn bản tự động chất lượng cao trên nhiều lĩnh vực.

7. T5 (Text-To-Text Transfer Transformer) (2019) - Google: T5 là một mô hình Transformer đa nhiệm, được phát triển bởi Google. Không giống như các mô hình trước đây, T5 không chỉ tập trung vào một tác vụ cụ thể, mà có khả năng thực hiện nhiều tác vụ xử lý ngôn ngữ tự nhiên bằng cách thay đổi dữ liệu đầu vào và đầu ra. T5 đã thể hiện khả năng xuất sắc trong nhiều tác vụ như dịch máy, tổng hợp văn bản, trích xuất thông tin và nhiều hơn nữa.

8. ELMo (Embeddings from Language Models) (2018) - Allen Institute for Artificial Intelligence: ELMo là mô hình ngôn ngữ được huấn luyện trước dựa trên mạng nơ-ron tái phát (RNN) và sử dụng các biểu diễn từ vựng phức tạp hơn. Nó cung cấp biểu diễn từ vựng đa chiều, chứa thông tin ngữ nghĩa và ngữ cảnh, làm cơ sở cho nhiều tác vụ xử lý ngôn ngữ tự nhiên.

9. RoBERTa (Robustly Optimized BERT approach) (2019) - Facebook AI: RoBERTa là một biến thể của BERT, được huấn luyện trên một lượng lớn dữ liệu không giám sát từ các nguồn trực tuyến. Nó đã cải thiện hiệu suất của BERT trên nhiều tác vụ, nhờ áp dụng các phương pháp tinh chỉnh và tối ưu hóa.

10. XLM (Cross-lingual Language Model) (2019) - Facebook AI: XLM là một mô hình học sâu cho việc hiểu và sinh văn bản đa ngôn ngữ. Nó sử dụng cơ chế mã hóa tổng quát và huấn luyện trên dữ liệu song ngữ hoặc đa ngôn ngữ để tạo ra biểu diễn chung cho các ngôn ngữ khác nhau.

11. GPT-2 (2019) - OpenAI: GPT-2 là phiên bản trước của GPT-3, với kích thước mô hình lên đến 1,5 tỷ tham số. Nó đã gây chú ý với khả năng tạo ra văn bản tự động đáng kinh ngạc và là một bước tiến quan trọng trong việc phát triển mô hình NLP.

12. ALBERT (A Lite BERT) (2019) - Google Research: ALBERT là một phiên bản nhẹ hơn của BERT, tối ưu hóa kích thước mô hình và tăng hiệu suất đào tạo. ALBERT đạt được hiệu suất tương đương hoặc vượt qua BERT trong nhiều tác vụ xử lý ngôn ngữ tự nhiên.

13. GPT-Neo (2021) - OpenAI: GPT-Neo là một phiên bản nhỏ hơn của GPT-3, nhưng vẫn có khả năng tạo ra văn bản tự động chất lượng cao.

14. ELECTRA (Efficiently Learning an Encoder that Classifies Token Replacements Accurately) (2020) - Google Research: ELECTRA là một mô hình dựa trên kiến trúc Transformer và sử dụng phương pháp đào tạo không giám sát. ELECTRA đạt được hiệu suất tương đương hoặc vượt qua các mô hình trước đó như BERT và RoBERTa trong nhiều tác vụ xử lý ngôn ngữ tự nhiên.

15. GPT-4 (dự kiến ra mắt vào năm 2023) - OpenAI: GPT-4 là phiên bản tiếp theo của dòng mô hình GPT, dự kiến có kích thước mô hình và khả năng tạo ra văn bản vượt trội. Mô hình này được mong đợi sẽ mang đến những cải tiến đáng kể trong việc hiểu và sản xuất ngôn ngữ tự nhiên.

Lưu ý rằng danh sách này vẫn không bao gồm tất cả các mô hình NLP quan trọng và chỉ tập trung vào một số mô hình nổi tiếng và có ảnh hưởng. Công ty và mốc thời gian có thể thay đổi, và còn rất nhiều công ty và tổ chức khác cũng đã đóng góp vào việc phát triển các mô hình NLP."
Cười mặt nồi
@BlackMan00x Qua list trên có thể thấy Transformer là một backbone rất quan trọng trong hầu hết các model phát triển sau này. Nó giống như động cơ đầu tiên được phát minh vậy. Sau này các hãng có thể phát triển nhiều loại động cơ khác nhau có hiệu quả kinh ngạc, nhưng cơ bản nó vẫn là cây mọc lên từ gốc
@tinhdg bất cứ tuyên bố nào: "100%.... " đều xạo....
Công việc của mình đa số liên quan đến việc tách nền và lấy vật thể/người thôi 😁 thì cái tính năng bấm ăn sẵn này giúp mình khá nhiều :D
image.jpg
sẽ có 1 lúc nào đó PTS tích hợp micro vào, user mở tấm hình lên chỉ việc nói "xóa cây", tăng sáng,...." là nó tự làm hết 😁
bài viết chất lượng nhen
PTS kết hợp A.I khiếp quá
Hổ mọc thêm cánh
lịch sự dữ dị chòi =)))))))))
6440962_Photoshop-cap-nhat-ai-14.jpg
@NhunNhun1305 "Bạn cần có kiến thức, kinh nghiệm và trải nghiệm"
Mới bị ghệ kêu giống TC 😭
@Nhà Của Cáo trải nghiệm kiểu dị hong
Screenshot 2023-05-25 at 16.16.45.jpg
fox94
ĐẠI BÀNG
14 ngày
@NhunNhun1305 Nhìn mặt giống thái công vc =))
Chờ final cut pro có AI đề tinhte có bài đề viết
Hóng bản PS 2023 có AI full .....
@anhlucky2 đoán là ko có
[email protected] xài được không nhỉ 😁😁
@BenGlo khả năng cao là không
@BenGlo Khả năng cao nó phải dùng máy chủ nên có thể bị block tính năng
Rồi sau công cụ này là thoải mái đi du lịch sống ảo khắp nơi trên thế giới r =)) , ăn sơn hào hải vị, mặc những bộ cánh sang trọng checkin trong những ks gái gú . Mấy anh đa cấp chắc chắn khoái
@quytocdo_tl đúng luôn bác

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2023 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02862713156
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019