
Midjourney v5: Hình ảnh càng lúc càng chân thực
Midjourney vừa công bố phiên bản v5 của hệ thống trí tuệ nhân tạo (AI) dựng hình ảnh của họ. Người dùng đã mua dịch vụ của Midjourney hiện có thể trải nghiệm phiên bản AI v5 thông qua kênh Discord chính thức của họ.
Julie Wieland, một nhà thiết kế đồ họa thường chia sẻ tác phẩm của Midjourney trên Twitter, đã đánh giá cao chất lượng hình ảnh mà thuật toán machine learning có thể tạo ra từ một câu lệnh của người dùng. Cô nói, “Midjourney v5 với tôi giống như một trải nghiệm đeo kính sau khi đã có một thời gian thị lực kém. Bất thình lình, bạn cảm nhận mọi thứ ở độ phân giải 4K, mang đến một sự ấn tượng kỳ diệu và đáng kinh ngạc.“
Cô Wieland đã chia sẻ một số hình ảnh mà Midjourney v5 tạo ra. Một số trong số này so sánh ba phiên bản của Midjourney từ khi nó được giới thiệu vào tháng 3/2022 và nhanh chóng trở thành một hiện tượng trên nhiều mạng xã hội, nhờ khả năng tái hiện hình ảnh từ kiến thức mà thuật toán AI đã học trước đó. Phiên bản v3 ra mắt vào tháng 8/2022, phiên bản v4 vào tháng 11/2022, và phiên bản v5 gần đây. Để tạo ra những tác phẩm dưới đây, câu lệnh sử dụng là “một chiến binh barbarian cơ bắp cầm vũ khí đứng bên cạnh TV chiếu sáng màu điện ảnh, độ phân giải 8K, ánh sáng studio.”
Về cách hoạt động, Midjourney tương tự như Stable Diffusion hoặc DALL-E của OpenAI, tạo ra hình ảnh dựa trên mô tả ngôn ngữ chung, được gọi là “câu lệnh,” sử dụng một mô hình AI được đào tạo trên hàng triệu hình ảnh do con người tạo ra. Gần đây, Midjourney cũng đã thu hút sự quan tâm vì có người sử dụng ChatGPT để tạo lời kể, và sau đó, Midjourney tạo hình minh họa cho một cuốn sách thiếu nhi và bán trên Amazon để kiếm tiền.
Những hình ảnh khác mà cô Wieland chia sẻ cho thấy mức độ chi tiết của hình ảnh do Midjourney v5 tạo ra, đặc biệt là khi thuật toán AI được điều chỉnh với nhiều tham số để tạo ra những hình ảnh không thua kém so với những tấm hình chụp thực tế. Điều duy nhất có thể làm cho họ phân biệt được đó là mức hoàn hảo quá đáng.
Sau khi trải nghiệm phiên bản v5 trong một ngày, cô Wieland đã chia sẻ về những cải tiến đáng kể trong hình ảnh. Chất lượng của làn da được tái hiện với sự phức tạp tối đa, bao gồm cả chi tiết của gương mặt. Ánh sáng cũng trở nên chân thực hơn, với hình ảnh phản chiếu chi tiết hơn, bao gồm cả những vùng sáng và bóng đổ. Cả đôi mắt của các nhân vật được tạo ra bởi trí tuệ nhân tạo cũng gần như hoàn hảo hơn, không còn cảm giác vô hồn như trước.
Tuy nhiên, điểm đáng chú ý nhất có lẽ là khả năng vẽ bàn tay. Midjourney v5 hiện đã có khả năng tái hiện bàn tay với 5 ngón, thay vì 7 hoặc 10 ngón như trong phiên bản trước đó, và không còn lỗi khi vẽ.
Trên Discord của Midjourney, đội ngũ phát triển thuật toán AI này cho biết phiên bản v5 có khả năng tạo ra hình ảnh dựa trên “nhiều câu lệnh mang tính sáng tạo” hơn so với v4, và đã giảm đi sự nhạy cảm với các câu lệnh. Hình ảnh không còn bị mất đi ý nghĩa vì thuật toán không hiểu hoàn toàn câu lệnh, và độ phân giải hình ảnh đã tăng gấp đôi.
Nếu có điểm yếu nào đó của Midjourney v5, thì có thể là việc nó tạo ra tác phẩm đạt đến mức hoàn hảo nhờ vào trí tuệ nhân tạo. Điều này có nghĩa là cảm giác của những người sử dụng phiên bản v4 sẽ biến mất, gần giống như cảm giác khi chơi bài cờ bạc, chờ đợi phần mềm tạo ra hình ảnh ưng ý sau vài lần nhập câu lệnh, nhưng kết quả vẫn chưa đạt được 100% mong muốn.
Theo ArsTechnica
Tag:ehomeai, midjourney v5
1 Comments