fbpx

Tháng năm 2

Chuyên sâu /describe vs. CLIP Interrogator

Tuần trước, các nhà phát triển đã thêm một lệnh mới vào Midjourney — /describe. Dưới đây là một cái nhìn sâu hơn về nó là gì, nó hoạt động như thế nào và bạn cần nó để làm gì.

Tóm lại

/describe làm cho Midjourney “đi lùi”. Thay vì quy trình chuyển văn bản thành hình ảnh thông thường, bạn tải lên một hình ảnh và Midjourney sẽ phân tích hình ảnh đó và “đoán” lời nhắc.

Chúng tôi đã thực hiện một nghiên cứu về một công cụ tương tự—CLIP Interrogator 2. Đây là một công cụ miễn phí có sẵn trực tuyến và được tạo tập trung vào lời nhắc Khuếch tán ổn định. Nhưng như nghiên cứu đã chỉ ra, nó cũng hoạt động tốt với Midjourney. Nó tạo ra các lời nhắc dài dòng, phức tạp và thường vô nghĩa nhưng kết quả rất gần với hình ảnh gốc.

Tuy nhiên, giờ đây chúng tôi có một công cụ chuyên dụng—dành cho Midjourney và theo Midjourney.

futuristic portrait by Gareth Pugh –v 5
Original generation

paper women neos rex, in the style of sci-fi inspired futurism, monochrome portraits, marvel comics, sony alpha a1, faceted forms, medieval-inspired, strong facial expression –v 5
 
/describe

a close up of a person wearing a costume, an ambient occlusion render, inspired by Marek Okon, digital art, diamond plated superhero, futuristic woman portrait, vektroid album cover, minimal design armor style, sculpture of cate blanchett, fantasy character photo, angry female alien, holly herndon origami statue, nvidia and behance, perfect android girl –v 5
 
CLIP Interrogator
 

Trong nghiên cứu này, chúng tôi so sánh cả hai—chức năng được chỉ định tích hợp sẵn và công cụ bên ngoài được tạo cho một AI chuyển văn bản thành hình ảnh khác.

Thông tin nhanh

1

Nó cực kỳ dễ sử dụng: nhập /mô tả, nhấn Enter và tải hình ảnh lên. Điều đó dẫn đến bốn lời nhắc theo các kiểu khác nhau—mà Midjourney đã đoán ra sau khi phân tích thông tin đầu vào của bạn. Với CLIP Interrogator bạn truy cập trang Hugging Face↗︎ và chỉ cần kéo hình ảnh của bạn vào một trường được chỉ định.

blueprint holographic design of futuristic Midlibrary –v 5
thế hệ ban đầu

technology research and industry background concept stock photo, in the style of fairy academia, illuminated interiors, hyper-realistic sci-fi, studyplace, light azure, bibliopunk, scientific diagrams –v 5
/describe

a room filled with lots of blue lights, futuristic scientific laboratory, futuristic laboratory, in futuristic laboratory room, futuristic space ship interrior, sci – fi interior, inside a futuristic army base, futuristic chemistry lab, science fiction scene, surreal sci fi set design, futuristic room, futuristic government chambers, futuristic setting, futuristic production facility, 3 d render of a scifi spaceport –v 5
 
CLIP Interrogator
2

Nếu Midjourney tìm thấy phong cách của một nghệ sĩ trong ảnh ban đầu và thêm tên của họ vào lời nhắc, thì tên đó sẽ trở thành một liên kết đến Google Tìm kiếm! Tuy nhiên, nó không làm như vậy (hiện tại) với các kỹ thuật nghệ thuật, chuyển động nghệ thuật và các công cụ sửa đổi phong cách khác.

3

Mỗi lời nhắc được liên kết với một nút Tạo được đánh số để nhanh chóng gửi lời nhắc mong muốn hoạt động. Nếu chế độ Remix được bật, Midjourney cho phép bạn điều chỉnh lời nhắc trước khi gửi.

4

Hiện tại không có tham số bổ sung nào cho /describe. Trong khi đó, CLIP Interrogator cung cấp ba chế độ (Tốt nhất, Cổ điển và Nhanh) và cài đặt Hương vị Tối đa của Chế độ Tốt nhất—số lượng từ khóa và biểu thức mà AI sẽ dừng phân tích hình ảnh—từ 2 đến 24. Đối với thử nghiệm này, chúng tôi sẽ sử dụng giá trị trung vị là 12.

5

/describe của Midjourney rất nhanh, chỉ mất vài giây cho mỗi hình ảnh. Đó là một điểm khác biệt nữa với Bộ dò tín hiệu CLIP cần 25–30 giây đến vài phút, tùy thuộc vào số lượng hương vị và độ phức tạp của hình ảnh đầu vào.

 

VÒNG MỘT:
‍Midjourney Generations

Đối với thử nghiệm đầu tiên, tôi đã cung cấp cho Midjourney các thế hệ của chính nó để xem cách nó tự “giải mã”. Những hình ảnh tương tự đã đến CLIP Interrogator.

deer in the magical forest of elves by Ryohei Hase –v 5
Original

an digital painting of deer in woodland, in the style of alexander jansson, primordial creatures, white and bronze, aleksi briclot, whimsical character design, james paick, baroque animals –v 5
 
/describe

a painting of a deer in a forest, by Bastien L. Deharme, by WLOP, fantasy art behance, beautiful digital artwork, by Jesper Ejsing, beautiful fantasy art, god of the forest, forest spirit, by Yang J, anthropomorphic deer, wojtek fus, realistic fantasy illustration, fantasy digital painting –v 5
CLIP Interrogator

Nói tóm lại, cả hai mô hình đều “nói ngôn ngữ AI”. Nó tự nhiên không giống con người, và trong nhiều trường hợp dường như không có ý nghĩa. Nhưng khi bạn “nói” ngôn ngữ này trở lại Midjourney, điều này sẽ xảy ra:

unimaginable portrait of a female, with extraordinary mask, in style of Vivienne Westwood –v 5
Original generation

a close up of a person wearing a mask, a character portrait, baroque, erwin olaf, old lady cyborg merchant, jean-sebastien rossbach, stefan koidl inspired, full face and body portrait, in a baroque style, metallic skin, photoshop render, album –v 5
/describe

a lady is wearing a costume with a gold mask, in the style of realistic hyper-detailed portraits, sven nordqvist, gabriel metsu, dark silver and light cyan, alessio albi, twisted characters, spectacular show of ages –v 5
CLIP Interrogator
 

Và ngay cả khi Midjourney hoặc/và CLIP Người thẩm vấn “bỏ lỡ”, kết quả có thể là một khám phá nghệ thuật tuyệt đẹp!

Tyrus Wong’s painting depicting closeup portrait of spring flowers witch by William Morris and Charles Angrand –v 5
Original generation

chinese women and daffodils, 2014, in the style of atmospheric and dreamy, teal and gold, dreamlike portraiture, tender depiction of nature, layered imagery, referential painting, soft and dreamy –v 5
/describe

a painting of a woman surrounded by flowers, inspired by Lin Liang, trending on cg society, figurative art, tyrus wong, daffodils, yellow and blue and cyan, by tom bagshaw, vietnamese woman, song dynasty, she –v 5
CLIP Interrogator
 

Cả hai mô hình đều rất hiệu quả trong những gì chúng được thiết kế để thực hiện, thường cho thấy kết quả tuyệt vời như nhau.

the close up of magical mushroom plant, with colorful flowers around, plants and greenery, view from below, in the forgotten forest by Albrecht Durer –v 5
Original generation

a painting titled’mystery’ shows different colors of mushrooms, in the style of northern renaissance, highly detailed foliage, wimmelbilder, vignetting, light red and dark gray, flower and nature motifs –v 5
/describe
a painting of mushrooms and other plants in a forest, by Maria Sibylla Merian, magic realism, jean-sebastien rossbach, 256×256, esao andrews and yoshitaka amano, niels otto møller, discovered photo, trending ,, mid 1 9 th century, by Joseph binder –v 5
CLIP Interrogator
 

Tuy nhiên, nếu bạn làm điều đó đủ lâu, bạn sẽ nhận thấy rằng lời nhắc của Bộ dò tín hiệu CLIP trả về kết quả tốt hơn một chút, thú vị hơn và chi tiết hơn—đặc biệt là với các hình ảnh nguồn phức tạp.

Tsutomu Nihei’s illustration depicting intricate biopunk mask by Kris Kuksi –v 5
Original generation

an abstract drawing of a head with a spider, in the style of stephan martinière, detailed costumes, daniel arsham, made of vines, chromepunk, yanjun cheng, multi-layered figures –v 5
/describe

a black and white drawing of a robot, a detailed drawing, by Todd Lockwood, synthetic maw, david kassan, intricate oil details, visible head, pastel, 4k. detailed drawing, bo xun ling, intricate wiring, azathoth, yanjun chengt, ellen jewett, no type –v 5
CLIP Interrogator
 

Tôi có thể nói rằng CLIP Người thẩm vấn làm tốt hơn một chút trong vòng này. Ít nhất là với các thế hệ Midjourney làm hình ảnh nguồn—điều đó có thể khá độc đáo. Làm thế nào về hình ảnh nổi tiếng hơn? /describe và CLIP Interrogator có nhận ra những hình ảnh nổi tiếng không?

 

VÒNG HAI:
‍TÁC PHẨM NỔI TIẾNG

Trong thử nghiệm tiếp theo, tôi đã chọn một số tác phẩm nghệ thuật nổi tiếng—từ những bức tranh cổ điển đến những cảnh điện ảnh mang tính biểu tượng—và để cả hai người mẫu thực hiện phép thuật của họ.

{

Niko Pirosmani. Fisherman in a Red Shirt (1908)
Original painting

{

a painting of a man holding a fishing bucket, in the style of dark orange and black, rural china, folkloric realism, naive childlike, qajar art, life-size figures, 1918–1939 (interwar) –v 5
/describe

{

a painting of a man with a bucket and a fish, farmer, inspired by Moïse Kisling, joseph todorovitch ”, anton, inspired by Max Pechstein, contemporary art, folk art, boy, inspired by Marianne von Werefkin, in style of henri rousseau, inspired by José Malhoa, in style of niko pirosmani –v 5
CLIP Interrogator
 

Và thử nghiệm đầu tiên mang lại một quan sát thú vị. CLIP Người thẩm vấn đã nhận ra tác giả của bức tranh gốc—nghệ sĩ vĩ đại người Gruzia Niko Pirosmani. Tuy nhiên, đầu ra của Midjourney với lời nhắc của CLIP Bộ dò tín hiệu nằm xa hơn so với hình ảnh nguồn. Trong trường hợp này, đó là vì MJ không biết phong cách của Pirosmani. Và do đó, lời nhắc của /describe trung thực hơn với hình ảnh gốc.

Đây là một nhiệm vụ kép: một đầu bếp kiến trúc vĩ đại—Trung tâm Pompidou của các kiến trúc sư Renzo Piano, Richard Rogers, Peter Rice, Gianfranco Franchini, Su Rogers và Mike Davies—được chụp bởi nhiếp ảnh gia tài năng Nisian Hughes.

Pompidou Centre by Renzo Piano, Richard Rogers, Peter Rice, Gianfranco Franchini, Su Rogers, Mike Davies. Photograph by Nisian Hughes
Original photograph

paris, france 3d printed building from aerial video stock footage & royaltyfree footage, in the style of turquoise and indigo, felipe pantone, sarah sze, majestic ports, red and azure, dark sky-blue and light yellow, street art sensibilities –v 5
/describe

an aerial view of a city with lots of tall buildings, a hyperrealistic painting, paris school, blue and red color scheme, apartment complex made of tubes, courtesy of centre pompidou, video, abcdefghijklmnopqrstuvwxyz, colorful building, cars parked underneath, technology, splendid haussmann architecture, chromatic, mario –v 5
CLIP Interrogator
 

Tim Walker’s là một trong những phong cách chụp ảnh yêu thích của tôi ở Midjourney. Gần như tôi ngưỡng mộ phong cách đời thực, nguyên bản của anh ấy!

Dame of Thrones. Kristen McMenamy by Tim Walker (2012)
Original photograph

{

a man dressed in black posing for a picture, by Elmyr de Hory, white cyborg fashion shot, tilda swinton, 2003, fashion editorial photography, award winning costume design, gandalf as a woman, patrick westwood style, with shoulder pads, arms extended, style of kieran yanner, pointed hoods, tetsuya nomura –v 5
/describe

{

a woman in an outfit with gloves and a mask, in the style of asymmetrical geometry, gothcore, associated press photo, mote kei, androgynous, elongated forms, mallgoth –v 5
CLIP Interrogator
 

Còn phim thì sao? Trong trường hợp với cảnh mang tính biểu tượng trong các tác phẩm kinh điển của Vương Gia Vệ, cả hai mẫu đều mang lại kết quả đẹp (mặc dù cả hai đều không quá gần với bản gốc). Và Midjourney thậm chí còn nhận ra đạo diễn!

Chungking Express. Director: Wong Kar-wai, cinematography: Christopher Doyle and Andrew Lau (1994)
Original movie still

Copied!
i think she’s crying, in the style of wong kar-wai, imaginative prison scenes, yellow and white, mirror rooms, stockphoto, rumiko takahashi, traincore –v 5
/describe

a couple of people sitting on top of an escalator, a picture, inspired by Zhang Xiaogang, eating spaghetti from a bowl, ((yellow magic orchestra)), admiring her own reflection, high resolution movie still, siamese twins, 2004, huang yuxing and aya takano, [[fantasy]], jingna zhang, elevator, competition winning –v 5
CLIP Interrogator

Thật khó hiểu về khả năng của cả hai, chẳng hạn như trong trường hợp (đầy thách thức) này với một đoạn trích từ một trong những cuốn sách minh họa nổi tiếng nhất trong lịch sử nghệ thuật—Bản thảo Voynich.

{

“Voynich Manuscript” fragment (carbon-dated to the early 15th century)
Original illustration fragment

{

a large sketch of a dragon titled le monde romin à l’origine médicienne à chihon, 1537, in the style of light green and red, alchemical symbolism, assemblage art, ottoman art, mesmerizing optical illusions, otherworldly beings –v 5
/describe

{

a close up of a drawing of a dragon, an album cover, by Johannes Martini, occult diagram, orrery, ffffound, color illustration, monster, real image –v 5
CLIP Interrogator
 

Và đây là một tác phẩm cổ điển hiện đại hơn đã tạo ra một dấu nhắc CLIP Bộ dò tìm (và bất kỳ dấu nhắc nào khác) tuyệt vời nhất trong nghiên cứu này. Có, với biểu tượng cảm xúc. 🙂

{

“Rick and Morty.” Justin Roiland, Dan Harmon (2013–ongoing)
Original animation still

rick and mort in a space vehicle, in the style of dark brown and light aquamarine, lively facial expressions, animated exuberance –v 5
/describe

rick rick rick rick rick rick rick rick rick rick rick rick rick rick rick rick rick rick, a cartoon, from rick and morty, photograph credit: ap, delorean, in a crashed spaceship, getty images, (smoke), 🦩🪐🐞👩🏻🦳, chicago, intense emotion, 4 d, may) –v 5
CLIP Interrogator

Và một hoạt hình khác—lần này, một cảnh trong anime huyền thoại (spoiler: kết quả thật đáng lo ngại… ((o____O)) CLIP Người thẩm vấn và phim hoạt hình có vấn đề gì vậy??

“Spirited Away.” Hayao Miyazaki (2001)
Original movie still

the no face, girl sitting on a train with two people, in the style of anime influenced, dark emerald and light cyan, movie still, light red and light gray, sparse and simple, chilling creatures, uniformly staged images –v 5
/describe

spirited spirited spirited spirited spirited spirited spirited spirited spirited spirited spirited spirited spirited spirited spirited spirited spirited spirited, a picture, by Miyazaki, no faces visible, a person standing in front of a, sitting, iconic film character, arasaka, gelbooru anime image, pareidolia, kano), on ship, diy, son, distant full body view –v 5
CLIP Interrogator
 

Cố gắng giải mã một bức tranh cổ điển khác, một kiệt tác đau lòng của August Friedrich Schenck, cả hai mô hình đều trả về kết quả giống với bản gốc một cách đáng kinh ngạc—chỉ khác ở các chi tiết (tuy nhiên, hãy lưu ý rằng cả hai sinh vật đều giống nhau một cách kỳ lạ). Điều gây ấn tượng là cách cả hai thí sinh nắm bắt được giai điệu và bầu không khí của bản gốc. Những cú đánh hoàn hảo.

August Friedrich Schenck. Anguish (c. 1878)
Original painting

a painting of a sheep being writhes by crows, in the style of frieke janssens, shwedoff, mort künstler, 19th century, contrast of scale, symbolic overload, poignant –v 5
/describe

a painting of a sheep surrounded by crows, by Petrus Van der Velden, tumblr, alexey egorov, sorrow, by jim bush and ed repka, dore, 2 0 2 4, jean-sebastien rossbach, mourning family, polar, victor einrich –v 5
CLIP Interrogator
 

Việc làm tròn này cho thấy rằng cả Midjourney’s /describe và CLIP Interrogator đều biết các tác phẩm kinh điển từ các lĩnh vực nghệ thuật rất khác nhau. Tuy nhiên, việc biết tài liệu nguồn và chỉ ra nó trong lời nhắc không phải lúc nào cũng có nghĩa là Midjourney sẽ trả về kết quả mà bạn mong đợi. 🙂

 

Vòng ba:
‍Hình ảnh của tôi

Đối với nghệ sĩ thị giác, /describe và CLIP Interrogator mang đến cơ hội tuyệt vời—để xem tác phẩm của họ bằng con mắt của AI (không có ý định chơi chữ).

{

From “Faces of A.Picolo” series (2012). Yes, it’s the same series Francis D.’s portrait comes from 😉
Original photograph

{

man in camouflage shirt on a dark background, in the style of native american, first nations, and alaska native art, cinematic lighting, feminine portraiture, new american documentary photography, hyper-realistic details, frostpunk, asymmetrical framing –v 5
 
/describe

{

a close up of a person wearing a jacket, a portrait, flickr, shin hanga, portrait of a navy seal soldier, skilled warrior of the apache, yuli ban, long chin, 2 0 2 2 photo, jon kuo, adam driver, nepal, benjamin vnuk, artists portrait –v 5
CLIP Interrogator
 

Hoàn hảo cho ảnh cận cảnh, đối thủ cạnh tranh của chúng ta sẽ xử lý thế nào với ảnh trung bình—và ảnh chân dung bận rộn hơn? Để kiểm tra điều này, đây là một bức chân dung tự chụp từ lo-o-ong trước.

Andrei Kovalev by Andrei Kovalev (2011)
Original photograph
 
the room is full of decorations, in the style of sacha goldberger, studio portrait, cluttered, studio light, neil gaiman, industrial photography, alex russell flint –v 5
/describe

man standing with camera in his hand, in the style of handcrafted objects, dramatic portraits, portraits with soft lighting, east village art, juxtaposition of objects, troubadour style, tabletop photography –v 5
CLIP Interrogator

CLIP Interrogator gần gũi hơn về mặt phong cách. Nhưng bạn ơi, tôi có thích cách giải thích của /mô tả về bản thân mình không!

Các bức ảnh rộng hơn hoạt động tốt khi chúng đủ tối giản và không chứa quá nhiều chi tiết và hành động.

Jimsher whisky advertising (2016)
Original photograph

a man stands on the side of a mountain, in the style of olivier valsecchi, klaus wittmann, neo-traditionalist, elisabeth sonrel, light black, neo-classical symmetry, anglocore –v5
/describe

a man standing on top of a mountain, an album cover, by Andrei Kolkoutine, wearing black overcoat, anna kovalevskaya, volcano in background, portrait mode photo, hasan piker, portrait full body, portrait of mélenchon, 4k high res, monk, andes, peter capaldi, morning light –v 5
CLIP Interrogator
 

Tuy nhiên, những bức ảnh phức tạp hơn có thể dễ dàng gây nhầm lẫn cho cả hai AI.

Poster art for “Baron Munchausen” theatrical play in Pyotr Fomenko Workshop Theatre. Director: Sergey Diachkovsky, actor: Karen Badalov (2018)
Original photograph

two people playing an instrument and sitting next to someone, in the style of characterful animal portraits, theatrical lighting, fantastical contraptions, clever wit, historical reproductions, tabletop photography, charming character illustrations –v 5
/describe

a man standing next to a teddy bear holding a sheet of paper, a portrait, cg society contest winner, vanitas, band playing instruments, new cats movie, studio shot, magic and steam – punk inspired, mixture between an! owl and wolf, triumphant pose, press photo, gregoire and manon, from below, costume, harmony of –v 5
CLIP Interrogator
 

Cuối cùng, hãy xem điều gì sẽ xảy ra nếu chúng ta đưa một số ảnh cận cảnh rõ ràng vào một bức ảnh đầu vào.

Key visual for “The Zoo Story,” a play at Mikhail Tumanishvili Theatre. Director: Mamuka Tkemaladze. Actors: Malkhaz Abuladze and Nikusha Tserediani (2017)
Original photograph

{

a man stands on the side of a mountain, in the style of olivier valsecchi, klaus wittmann, neo-traditionalist, elisabeth sonrel, light black, neo-classical symmetry, anglocore –v5
/describe

{

a couple of men standing next to each other, a portrait, by Edi Rama, antipodeans, promo shot, anomalisa, on black background, wintermute, stanly kubrick, catalog photo, production photo, heavy vignette!, greg rutkowski and edgar maxence, artur bordello, with wart, actors –v 5
CLIP Interrogator

Tôi không thể ngừng ngạc nhiên trước những gì mà Midjourney V5 có thể làm được bằng tay ngay bây giờ!

Nhìn chung, cả /describe và CLIP Interrogator đều mang lại kết quả tuyệt vời trên mọi danh mục. Và với sự tập trung của V5 Alpha vào chủ nghĩa ảnh chân thực điên cuồng, tôi chắc chắn sẽ đề xuất như một công cụ khám phá sáng tạo (và chuyên nghiệp!) không chỉ cho tất cả các nhiếp ảnh gia đồng nghiệp của tôi mà còn cho tất cả các nghệ sĩ thị giác đồng nghiệp của tôi ngoài kia.

 

Các khả năng

Để kết thúc nghiên cứu này, tôi muốn nhanh chóng điểm qua một số siêu năng lực mà /mô tả và đối tác của nó mang lại cho chúng ta. Hoặc: chúng ta có thể sử dụng chúng để làm gì?

1

TÌM HIỂU CÁC CHIẾN LƯỢC THÚC ĐẨY MỚI VÀ MỞ RỘNG TỪ VỰNG MJ CỦA BẠN
Midjourney chủ yếu sử dụng những từ mà nó biết và có thể diễn giải bằng hình ảnh để mô tả hình ảnh. Vì vậy, trong hầu hết các trường hợp, nếu /describe sử dụng một từ, một biểu thức hoặc một công cụ sửa đổi kiểu, chúng ta có thể sử dụng nó trong lời nhắc của riêng mình.

2

KHÁM PHÁ NGHỆ SĨ MỚI
Điều tương tự cũng xảy ra với các nghệ sĩ Midjourney “nhận ra” (thường là do nhầm lẫn :)) trong các hình ảnh đầu vào. Mỗi tên trong dấu nhắc đầu ra có nghĩa là (trong HẦU HẾT các trường hợp) mà MJ biết nghệ sĩ.

3

NHẮC KỸ THUẬT NGƯỢC LẠI
Midlibrary là viết tắt của việc chia sẻ kiến thức—bí quyết, hiểu biết sâu sắc, mẹo và thủ thuật, và tất nhiên là gợi ý—trong nghiên cứu của chúng ta.

/describe, CLIP Interrogator và các công cụ tương tự đã tạo ra các lời nhắc kỹ thuật đảo ngược siêu dễ truy cập. Giờ đây, việc tìm hiểu các công cụ sửa đổi kiểu dáng và khơi gợi ý tưởng từ bất kỳ hình ảnh nào do AI tạo ra giờ đây trở nên dễ dàng hơn bao giờ hết. Và tôi hy vọng điều đó bằng cách nào đó sẽ khiến mọi người bớt bí mật hơn về lời nhắc của họ. 😉

4

CUỐI CÙNG, NÓ LÀ MỘT TRONG NHỮNG CÔNG CỤ TỐT NHẤT ĐỂ CHỈNH LẠI TÁC PHẨM CỦA RIÊNG BẠN
Đối với người sáng tạo, /describe và CLIP Interrogator là những mỏ vàng sáng tạo! Nếu bạn muốn xem tác phẩm nghệ thuật trực quan của mình được AI diễn giải lại, hãy xem xét nó từ một góc nhìn mới hoặc lấy cảm hứng từ những cách mới và độc đáo để phát triển tác phẩm của bạn hơn nữa—những công cụ này là phần bổ sung bắt buộc phải có trong hộp công cụ của bạn.

Và người chiến thắng là… *đánh trống lảng*

Lệnh /describe (và các công cụ AI chuyển hình ảnh thành văn bản nói chung) là một món quà tuyệt đối dành cho nghệ sĩ Midjourney. Nó cho phép bạn đi sâu hơn, làm được nhiều hơn, trích xuất các chiến lược gợi ý mới và công cụ sửa đổi phong cách cũng như tìm hiểu tên của các nghệ sĩ chưa được khám phá.

Đối với sự cạnh tranh (không hề nghiêm trọng) của chúng tôi: sau khi “cung cấp” hơn 100 hình ảnh cho cả hai kiểu máy, kinh nghiệm của tôi là CLIP Interrogator thực hiện công việc tốt hơn một chút so với /describe. Nó thường sẽ giải mã nhiều hơn một chút, tạo ra các lời nhắc chi tiết và đặc biệt hơn.

“Faces Of Bagrationi 1882” advertising campaign (2020)
Original photograph

a person in the jungle with colorful lights on her, in the style of kodak aerochrome, unreal engine 5, romanticized femininity, futuristic victorian, cinematic sets, 32k uhd, made of mist –v 5
/describe

a woman standing in the middle of a lush green forest, by Emma Andijewska, romanticism, purple volumetric lighting, jungle around him, film stills, julian ope, prince, purple – tinted, lut, neon jungle, hannibal, detailed picture, ji-min, fauna, luts, tyler, flume –v 5
CLIP Interrogator
 

Nhưng trong nhiều trường hợp, sự khác biệt này là nhỏ. Và chắc chắn, /desribe—vừa được giới thiệu—sẽ phát triển và lớn mạnh.

Cả hai mô hình đều hoạt động tốt với nguồn tài liệu đơn giản, nhưng thường gặp khó khăn với những hình ảnh phức tạp. Và thậm chí đừng để tôi bắt đầu về những lời nhắc mà họ tạo ra. Nhắc người theo chủ nghĩa thuần túy / người theo chủ nghĩa tối giản trong tôi khóc! >____<

Nhưng—thật kỳ diệu!—chúng hoạt động! Và cung cấp những cơ hội đáng kinh ngạc cho bất kỳ nghệ sĩ AI nào (và bất kỳ nghệ sĩ thị giác nào, về vấn đề đó). Vì vậy, hãy chắc chắn để thử những công cụ tuyệt vời đó. <3

Bạn có thể giúp chúng tôi duy trì và mở rộng Midlibrary và sản xuất nội dung giáo dục thường xuyên hơn với chất lượng cao hơn. Và giữ nó miễn phí cho tất cả!

 

 

Nguồn từ: https://medium.com/


Tags


Có thể bạn sẽ quan tâm

>