Midjourney có rất nhiều công cụ tuyệt vời. Một trong những tính năng thực sự đáng chú ý là công cụ “remix”. Tôi sẽ giải thích lý do tại sao, nhưng trước hết, hãy để tôi lùi lại và chia sẻ đôi chút, như cách tôi thường làm trong các bài viết của mình.
Tôi luôn bị cuốn hút bởi cụm từ “suy nghĩ ngoài chiếc hộp”. Vấn đề là, tôi là một người hay mất tập trung và cũng có phần ngốc nghếch; có lẽ vì thế mà tôi chưa bao giờ sở hữu một chiếc hộp riêng để suy nghĩ trong đó. Thực ra, tôi thường tự hỏi làm thế nào để có được chiếc hộp đó, nó mang lại điều gì, và liệu tôi có nên cảm thấy bị bỏ lại phía sau vì không có nó.
Nhưng tôi nhận thấy rằng, thường thì, tôi suy nghĩ và tiếp cận vấn đề khác với hầu hết mọi người. Dĩ nhiên, hầu hết thời gian, điều đó chỉ gây rắc rối. Phương pháp yêu thích của tôi để khám phá mọi thứ — “scientific poking” (khám phá bằng cách thử nghiệm) — chỉ làm tình hình thêm phức tạp. Cảm ơn các vị thần, tôi có đôi chân dài (đặc biệt là chân trái); tôi đã không thể đếm được bao nhiêu lần chúng giúp tôi thoát khỏi những gì có thể gọi, một cách tích cực và nhẹ nhàng, là “vùng nguy hiểm của sự hủy diệt hoàn toàn”.
Nhưng cũng có những lúc tôi khám phá ra cách sử dụng công cụ theo cách mà ít người khác làm và hiếm khi được mô tả trong các hướng dẫn. Cũng thường xuyên, các hướng dẫn lại cấm sử dụng những công cụ đó theo cách này vì lý do nào đó. Bạn biết đấy, giống như việc sử dụng bật lửa để làm đòn bẩy theo nguyên lý của Archimedes để mở nắp chai bia.
Điểm mấu chốt là, các công cụ của Midjourney có thể được sử dụng theo nhiều cách khác nhau, và tôi thích thử nghiệm chúng để khám phá những gì chúng có thể làm ngoài những điều hiển nhiên. Nhưng cũng quan trọng không kém, tôi muốn tìm ra cách sử dụng các công cụ đó, hoặc kết hợp chúng, để làm chính xác những gì tôi muốn, chứ không phải chỉ là người tiêu thụ thụ động những gì Midjourney tạo ra.
Bây giờ, hãy quay lại với công cụ remix và giải thích tại sao tôi nghĩ nó tuyệt vời.
Trong các bài viết trước của mình, tôi đã đề cập rằng cách tiếp cận tốt nhất khi tạo ra thứ gì đó với AI tạo sinh là hãy nghĩ về bản thân như một đạo diễn phim. Bạn đang chỉ đạo một đội ngũ — cameraman, nghệ sĩ ánh sáng, thiết kế sân khấu, diễn viên — để thực hiện tầm nhìn của mình. Chỉ khi đó, bạn mới thực sự là người sáng tạo. Prompt chỉ là điểm khởi đầu. Nếu so sánh với việc làm phim, prompt giống như việc nói: “OK, hãy quay cảnh này với diễn viên này và diễn viên kia, với một chút gì đó phía sau họ.”
Đó chỉ là hướng dẫn tổng quát, chưa phải là chỉ đạo thực sự. Đó là lúc remix phát huy tác dụng.
Hãy minh họa điều này bằng một ví dụ. Tôi rất thích những robot retro-futuristic (tương lai cổ điển). Không biết tại sao, có lẽ là do một dạng liên tưởng tâm lý nào đó với những thứ đã lỗi thời, rỉ sét hoặc gì đó. Dù sao thì, hãy tạo ra một hình ảnh về nó.
Tôi đã nói trong các bài viết trước (và nếu bạn chưa đọc, tôi khuyên bạn nên đọc chúng) rằng những hình ảnh tốt không chỉ hiển thị đối tượng mà còn kể câu chuyện về những gì các đối tượng đó đang làm ở đó. Tôi sẽ không phức tạp hóa vấn đề ở đây và sử dụng một ví dụ đơn giản:
“Một robot retro-futuristic già cỗi, bị tổn hại ngồi trên vách đá, suy tư về khung cảnh rộng lớn bên dưới.” Tôi sẽ sử dụng V6, tỉ lệ hình ảnh 16:9 và đặt tham số stylize ở mức 200.
Tham số stylize rất quan trọng. Giá trị cao sẽ tạo ra những hình ảnh bóng bẩy, đẹp mắt và nghệ thuật hơn nhưng cũng khiến Midjourney khó tuân theo prompt của bạn. Nếu bạn muốn điều khiển hình ảnh của mình theo ý muốn, hãy sử dụng giá trị stylize thấp: 100, tối đa 200.
Hãy gửi prompt đó và xem điều gì xảy ra. Tôi thường chạy lại prompt ba lần. Thường thì lần chạy lại thứ hai sẽ cho kết quả tốt nhất, nhưng đôi khi lần thứ ba cũng có thể mang đến điều gì đó tốt hơn. Tôi đã chọn một hình ảnh từ lần chạy lại thứ hai mà tôi khá thích.
Đáng tiếc là, với hầu hết người dùng Midjourney, đây sẽ là điểm dừng với hình ảnh và prompt này. Họ có thể cố gắng tái thiết kế prompt, thêm các yếu tố khác vào, nhưng về cơ bản, họ sẽ bắt đầu lại từ đầu với một hình ảnh hoàn toàn khác.
Với tôi, đây mới là lúc bắt đầu chỉ đạo. Tôi đã chọn hình ảnh của mình vì tôi thích bố cục và hình dáng của robot. Nhưng đây chưa phải là hình ảnh tôi muốn. Robot của tôi chưa thể hiện nhiều sự suy tư.
Lâu rồi, khi tôi còn làm việc ở Hollywood, tôi đã nghe thấy đạo diễn hét lên với một diễn viên phụ ở hậu cảnh: “Hãy làm gì đó đi, đừng đứng đó như một bức tượng già cỗi!” Rất sinh động và mang tính giáo dục.
Tôi cần robot của mình làm điều gì đó. Khi suy tư về điều gì đó, tôi thường thích ngồi với một điếu xì gà và một chai bia thủ công; hãy lấy đó làm cảm hứng, bấm nút “remix” và sửa đổi prompt:
“An elderly, rusted, vintage, battered retro-futuristic robot sitting on the cliff, smoking cigar, beer bottle next to him, contemplating vast landscape below.”
Điều tuyệt vời về remix là bố cục và phong cách cơ bản của hình ảnh vẫn giữ nguyên; tôi không phải bắt đầu lại từ đầu với một hình ảnh hoàn toàn khác. Tôi đã có robot của mình ở cùng một vị trí, cùng một loại phong cảnh, với xì gà và bia.
Và tôi có thể tiếp tục làm việc với hình ảnh của mình, thử nghiệm ánh sáng và màu sắc hoặc thêm các yếu tố khác vào đó. Chỉ đạo hình ảnh của tôi. Biến nó thành hình ảnh của tôi.
Khi tôi đã hài lòng với nội dung của hình ảnh, tôi có thể remix lại với cùng prompt nhưng tăng giá trị stylize. Có khả năng nó sẽ thay đổi bố cục của hình ảnh và có thể sắp xếp lại và thậm chí loại bỏ một số yếu tố trong đó, nhưng đôi khi cũng đáng để thử.
Tại thời điểm này, điều quan trọng cần nhớ là bạn có thể sử dụng các công cụ khác nữa. Bạn có thể remix với giá trị stylize cao hơn, nhưng cũng có thể sử dụng một trong các thế hệ trước đó làm tham chiếu hình ảnh để giới hạn các biến thể.
Bạn có thể sử dụng các hình ảnh tham chiếu phong cách trong remix để ảnh hưởng đến bảng màu hoặc ánh sáng hoặc độ tương phản thay vì dựa vào từ ngữ trong prompt. Hãy nghĩ về nó như một đạo diễn đưa ra một bức ảnh mẫu cho nghệ sĩ ánh sáng của mình thay vì chỉ cho họ biết đặt đèn ở đâu.
Có những cách khác để kiểm soát cách hình ảnh được tạo và tái tạo trong Midjourney. Một trong những cách tốt nhất để làm điều này là tìm ra số seed ngẫu nhiên của hình ảnh bạn thích và muốn tinh chỉnh, sau đó sử dụng số seed đó trong prompt của bạn.
Chỉ có điều là tôi chưa biết cách làm điều này trên trang web Midjourney alpha, mà tôi thích sử dụng hơn so với Discord. Nếu bạn có mẹo nào, hãy để lại trong phần bình luận bên dưới.
Ngoài ra, bạn có thể sử dụng các công cụ inpainting của Midjourney nếu việc prompt trong remix không mang lại kết quả như mong muốn khi xây dựng hình ảnh của bạn. Đôi khi, thêm một chi tiết nhỏ cuối cùng bằng inpainting sẽ dễ dàng hơn là điều chỉnh lại toàn bộ hình ảnh.
Cuối cùng, tôi sử dụng các tùy chọn zoom và pan để có thêm không gian trong hình ảnh và điều chỉnh bố cục theo ý thích bằng cách cắt hình ảnh trong Photoshop hoặc Canva hoặc Photopea theo quy tắc một phần ba hoặc tương tự.
Vậy đó, remix và các công cụ khác cho phép bạn tạo ra một hình ảnh mang tính cá nhân hơn, hình ảnh mà bạn đã tưởng tượng và muốn tạo ra. Bạn không phải phụ thuộc vào sự sáng tạo của Midjourney để hoàn thành công việc.
Vì vậy, hãy ngồi vào chiếc ghế đạo diễn, cầm lấy loa phóng thanh và bảng chỉ đạo, và bắt đầu chỉ đạo những hình ảnh của bạn.
Hãy bấm thích nếu bạn thấy bài viết này hữu ích .
Nguồn từ: https://medium.com/