Và bí mật của sự lặp lại
Generative AI được tạo ra nhằm làm cho việc sáng tạo hình ảnh trở nên dễ tiếp cận với tất cả mọi người. Và thực sự, nó đã làm được điều đó. Midjourney đặc biệt giỏi trong việc tạo ra những hình ảnh có chất lượng kỹ thuật tốt.
Nhưng một hình ảnh kỹ thuật tốt không giống như một hình ảnh tuyệt vời mà mọi người sẽ yêu thích. Phần “kỹ thuật tốt” đến từ công cụ; phần “tuyệt vời” đến từ người sáng tạo.
Nó giống như máy ảnh kỹ thuật số hiện đại. Những thứ này tự động lấy nét vào đối tượng; chúng tự động chọn cài đặt phù hợp cho độ phơi sáng và khẩu độ, và thay đổi độ nhạy cảm biến theo yêu cầu. Người dùng của máy ảnh hiện đại không cần phải biết về các kỹ thuật chụp ảnh.
Phần lớn thời gian, máy ảnh kỹ thuật số hiện đại sẽ tạo ra những hình ảnh hoàn hảo về mặt kỹ thuật — sắc nét, đủ sáng, màu sắc chính xác. Và hoàn toàn không có giá trị nghệ thuật.
Khi có cùng một chiếc máy ảnh, một nhiếp ảnh gia chuyên nghiệp sẽ ngay lập tức bắt đầu điều chỉnh tất cả các nút, menu và chế độ, sau đó sẽ cúi xuống trong tư thế kỳ cục, nheo mắt và xoay ống kính, lẩm bẩm về ánh sáng và bố cục.
Cuối cùng, người nhiếp ảnh gia điên rồ đó sẽ nhấn nút và tạo ra một bức ảnh tuyệt vời. Sự khác biệt không nằm ở công cụ, hay ở mức độ thông minh của công cụ đó. Sự khác biệt nằm ở kiến thức về cách sử dụng nó cũng như hiểu biết về những gì làm nên một bức ảnh tuyệt vời.
Tất cả điều này cũng áp dụng cho generative AI nói chung và Midjourney nói riêng. Bạn có thể sử dụng nó như một chiếc máy chụp ảnh đơn giản (hoặc “prompt-and-flop,” như người ta nói), hoặc bạn có thể điều chỉnh và áp dụng một chút kiến thức để tạo ra điều gì đó tuyệt vời.
Tin vui là điều này không phải là khoa học tên lửa và không đòi hỏi phải nhớ quá nhiều thứ phức tạp, số liệu và các mối quan hệ giống như nhiếp ảnh thực tế.
Nó chỉ đòi hỏi một sự hiểu biết cơ bản về các nguyên tắc, một từ vựng đúng, và một chút trí tưởng tượng.
Trên thực tế, hầu hết các bài viết của tôi về Midjourney đều xoay quanh những điều đó, dưới một hình thức nào đó. Bài viết này cũng không ngoại lệ và sẽ giải thích về tiêu cự nông, cách nó hoạt động và lý do tại sao nó rất hiệu quả trong nhiếp ảnh macro và micro, cũng như lý do tại sao những yếu tố này lại tuyệt vời khi tạo ra những hình ảnh đẹp bằng Midjourney.
Một Chút Lý Thuyết
Trước khi chúng ta đi vào các kỹ thuật hấp dẫn về tiêu cự nông, sẽ tốt hơn nếu nhắc đến một điều quan trọng về Midjourney, một điều biện minh cho việc học lý thuyết đôi chút nhàm chán.
Midjourney, khi được yêu cầu sáng tạo với giá trị tham số stylize cao, hoạt động giống như một nghệ sĩ thời trang sau khi hút vài làn khói của một thứ gì đó thú vị nhưng bị cấm bởi chính phủ. Nó trở nên vô cùng sáng tạo, nhưng với khoảng chú ý ngắn của một nghệ sĩ đang say, Midjourney có xu hướng bỏ qua hầu hết những chi tiết tinh tế trong prompt.
Để làm cho Midjourney lắng nghe, cách duy nhất là lặp lại hướng dẫn theo nhiều cách khác nhau. Việc lặp lại cùng một từ vài lần trong prompt sẽ không hiệu quả. Nhưng việc lặp lại khái niệm bằng cách sử dụng từ đồng nghĩa và các mô tả khác nhau sẽ dần dần hướng Midjourney đi đúng hướng.
Nhưng để làm được điều đó, trước tiên bạn cần hiểu khái niệm. Vì vậy, việc học một chút lý thuyết là điều cần thiết.
Tiêu cự nông trong nhiếp ảnh không quá khó để hiểu, mặc dù các thuật ngữ có thể gây nhầm lẫn và phiền phức. Dù sao thì, mọi thứ đều bắt đầu với ống kính.
Không có cái gọi là ống kính hoàn hảo. Vật lý và những khiếm khuyết về hình dạng và vật liệu đảm bảo rằng không phải mọi tia sáng đều có thể được hội tụ đúng trên cảm biến. Và những tia sáng đi lệch đó sẽ tạo ra hiện tượng mờ. Điều này đúng với máy ảnh cũng như với đôi mắt của bạn.
Khi bạn nhìn xung quanh, chỉ những thứ mà bạn tập trung vào mới có độ nét cao. Những thứ ở xa hơn hoặc gần hơn sẽ trở nên mờ. Bạn có thể thử nghiệm điều này bằng cách tập trung vào ngón tay duỗi thẳng của mình, trong khi giữ một ngón tay khác gần mũi. Ngón tay gần mũi sẽ bị mờ. Và nếu bạn tập trung vào ngón tay gần mũi, ngón tay còn lại sẽ trở nên mờ.
Cho đến đây thì mọi thứ đều ổn. Nhưng đây là điều quan trọng: trong một căn phòng tối, hiệu ứng này sẽ rõ ràng hơn, và ngoài trời, dưới ánh sáng mạnh, hiệu ứng sẽ ít rõ ràng hơn. Điều này xảy ra do hiệu ứng mống mắt (hoặc khẩu độ trong nhiếp ảnh).
Khi ở ngoài trời, dưới ánh sáng mặt trời mạnh, mống mắt của bạn co lại, để lại một lỗ nhỏ nhất có thể để ngăn ánh sáng không làm chói mắt bạn. Nó cũng ngăn các tia sáng từ mọi hướng đi qua ống kính của mắt bạn và làm gián đoạn độ sắc nét của hình ảnh.
Với mống mắt co lại, bạn có thể nhìn rõ các vật thể ở khoảng cách rất rộng — như núi xa, con bò ở giữa cánh đồng, và thậm chí cả cây cối gần bạn.
Trong bóng tối, mống mắt của bạn mở rộng để cho càng nhiều ánh sáng vào mắt càng tốt, nhưng không phải tất cả các tia sáng đều có thể được bẻ cong đúng cách bởi ống kính của mắt để hội tụ, và trong khi chúng làm cho những thứ ít được chiếu sáng rõ ràng hơn, chúng làm mất đi độ tương phản và tạo ra hiện tượng mờ. Phạm vi khoảng cách mà bạn có thể nhìn thấy bất kỳ vật thể nào một cách sắc nét sẽ giảm đáng kể. Trên thực tế, hầu hết mọi thứ sẽ bị mất nét; chỉ những thứ mà bạn nhìn thẳng vào mới có độ sắc nét hợp lý.
Tiêu cự của bạn, với mống mắt mở rộng, trở nên nông. Nó còn được gọi là độ sâu trường ảnh hẹp.
Đây chính là cách nó hoạt động trong nhiếp ảnh. Thay vì mống mắt, ống kính có khẩu độ — một cơ chế dạng màng ngăn thay đổi kích thước của lỗ hở mà ánh sáng có thể đi vào. Kích thước của lỗ hở này được đo bằng f-stop, trong đó số f-stop nhỏ có nghĩa là khẩu độ mở rộng và do đó độ sâu trường ảnh rất nông, và số f-stop lớn tương ứng với khẩu độ đóng và phạm vi độ sâu trường ảnh rộng.
Với một ống kính đủ tốt, phạm vi f-stop có thể từ 2.8 đến 22 hoặc hơn. Với những ống kính đặc biệt tốt, f-stop có thể xuống tới 0.8. Những ống kính này có thể tạo ra hình ảnh với rất ít ánh sáng, nhưng phải trả giá bằng việc có một phạm vi tiêu cự rất hẹp, đôi khi chỉ đo được trong vài milimét.
Và trong nhiếp ảnh macro, khi chúng ta cố gắng tiến gần hơn đến một đối tượng nhỏ, phạm vi tiêu cự trở nên thậm chí nhỏ hơn. Có nhiều tia sáng không liên quan gây hiện tượng mờ và ít tia sáng có thể được hội tụ hơn. Cần có các ống kính đặc biệt để có thể lấy nét vào những vật thể rất nhỏ ở khoảng cách rất gần.
Những ống kính này rất đắt, nhưng chúng có khả năng tạo ra một số hình ảnh đẹp nhất mà bạn từng thấy. Các nhiếp ảnh gia sẽ sẵn sàng bán các thành viên lớn tuổi trong gia đình, linh hồn của họ, và thậm chí một quả thận để có thể sở hữu một trong những ống kính này.
Tuy nhiên, khi làm việc với Midjourney, chúng ta không cần những ống kính đắt đỏ đó, mà chỉ cần một chút kiến thức rẻ tiền về cách thức và lý do chúng hoạt động để có thể ra lệnh cho Midjourney tạo ra những hình ảnh có độ sâu trường ảnh rất nông.
Ví dụ, một prompt có thể được định dạng như sau:
Prompt này hướng dẫn Midjourney theo bốn cách khác nhau để giữ mọi thứ trong phạm vi tiêu cự hẹp, và thậm chí với giá trị stylize cao, nó vẫn tạo ra loại hình ảnh mà chúng ta mong muốn.
Hình ảnh Macro
Bây giờ chúng ta đã biết cách ra lệnh cho Midjourney tạo ra những hình ảnh với tiêu cự nông, chúng ta có thể bàn về lý do tại sao chúng ta muốn làm điều đó ngay từ đầu.
Một điều mà những hình ảnh tuyệt vời thường có chung là khả năng thu hút ánh nhìn của người xem vào chủ thể. Các nghệ sĩ và nhiếp ảnh gia sử dụng nhiều kỹ thuật khác nhau để làm điều này, như sử dụng đường dẫn hướng, mẹo bố cục, ánh sáng, và các yếu tố khác, nhưng không có kỹ thuật nào mạnh mẽ bằng tiêu cự nông.
Khi hậu cảnh và tiền cảnh rất mờ, chủ thể của bức ảnh sẽ hiện ra rõ ràng như từ một lớp sương mù. Những hình ảnh này cuốn hút và mê hoặc vì không có gì khiến người xem bị phân tâm. Thực tế, các hình ảnh sử dụng tiêu cự nông hoạt động giống như chủ nghĩa tối giản, nhưng không cần phải đơn giản hóa quá mức các chi tiết quan trọng.
Và khi nói đến hình ảnh macro — tức là hình ảnh của các đối tượng chụp rất gần — hiệu ứng này còn được nhân lên nhiều lần. Bạn có thể nhìn thấy, có lẽ lần đầu tiên, các vật thể mà bạn nghĩ mình biết rõ với chi tiết rất tinh tế, mà không bị phân tâm bởi môi trường xung quanh.
Hãy lấy một ví dụ đơn giản: hoa bồ công anh. Chủ thể của hàng triệu bức ảnh. Cây cỏ đơn giản này, đối với nhiều người chỉ là cỏ dại và là một điều phiền toái lớn, thay đổi hoàn toàn diện mạo khi được chụp bằng kỹ thuật tiêu cự nông, và trở thành một đối tượng tuyệt vời.
Nhưng khi bạn tiến xa hơn một bước nữa vào nhiếp ảnh macro và phóng to xung quanh những hạt giống của cây bồ công anh này, bức ảnh sẽ trở nên càng mê hoặc và kỳ ảo hơn.
Hầu hết những thứ quen thuộc khi nhìn qua ảnh macro trở nên lạ lẫm và đầy hấp dẫn. Chúng có thể là nguồn cảm hứng bất tận cho những bức ảnh tuyệt vời, ví dụ như một chiếc lông vũ chẳng hạn.
Hình ảnh Micro
Nhưng với Midjourney, chúng ta có thể tiến thêm một bước nữa vào lĩnh vực nhiếp ảnh siêu vi (microphotography).
Cách đây một thời gian, khi làm việc trong lĩnh vực nhiếp ảnh tính toán, tôi đã phải học cách thiết kế và tạo ra những ống kính tùy chỉnh của riêng mình. Một trong số đó là ống kính dành cho nhiếp ảnh vi mô, một món đồ vô cùng đắt đỏ, đã ngốn mất gần một năm để tôi thiết kế và chế tạo. Nhưng nó cho phép tôi khám phá ra một thế giới mới, đẹp đẽ và vô cùng hấp dẫn.
Ở mức độ phóng đại đó, những thứ quen thuộc hàng ngày biến thành những thế giới kỳ diệu và lạ thường. Được tăng cường bởi sự kỳ diệu của tiêu cự cực nông, các cấu trúc lạ lùng xuất hiện từ lớp sương mù đầy màu sắc với các đặc điểm, hình dạng và màu sắc kỳ lạ và không ngờ tới.
Đường, hoặc muối đơn giản, trở thành một đống báu vật lấp lánh quý giá. Các khoáng chất đơn giản mà bạn có thể tìm thấy dọc theo con đường bỗng trở thành những thế giới kỳ ảo với các lâu đài pha lê cao vút.
Và sau đó là những thứ mà hầu hết mọi người không hề nghe đến hoặc quan tâm nhiều vì chúng vô hình với mắt thường. Nhưng dưới độ phóng đại của kính hiển vi, hoặc trong trường hợp của chúng ta, với Midjourney, chúng đột nhiên trở thành những đối tượng tuyệt vời cho các bức ảnh.
Hãy lấy phấn hoa làm ví dụ. Nó có vô số hình dạng và cách trình bày khác nhau..
Hoặc thậm chí tốt hơn, đó là tảo cát. Tảo cát là một loại vi tảo được biết đến với các vách tế bào độc đáo, phức tạp làm từ silica, tạo nên các cấu trúc giống như thủy tinh vô cùng đẹp mắt. Chúng là sinh vật đơn bào được tìm thấy ở đại dương, sông suối và đất đai.
Nhưng vỏ của chúng… giống như những tác phẩm hình học nghệ thuật được “cường hóa” với trí tưởng tượng bay bổng, thêm vào đó là chút mơ màng từ nấm ảo. Chúng có vô số hình dạng và cấu trúc khác nhau, và tất cả đều rất đẹp mắt.
Có những sinh vật khác trong thế giới vi mô. Protists là những sinh vật vi mô tạo ra các hoa văn và hình dạng kỳ diệu, tạo ra những hình ảnh trừu tượng mà có thể khiến các tác phẩm của Pollock trở nên lu mờ.
Với thế giới vi mô, đối với chúng ta, nó hoàn toàn lạ lẫm và kỳ diệu. Điều tuyệt vời là Midjourney có thể tạo ra, nếu không chính xác, thì ít nhất cũng là những hình ảnh ngoạn mục, hấp dẫn và đầy ấn tượng về thế giới đó, đặc biệt là khi được điều khiển bởi các lệnh về tiêu cự nông.
Và đây là điều thú vị: tất cả các hình ảnh trong bài viết này đều được tạo ra chỉ với một prompt duy nhất. Đúng, tôi đã thay đổi chủ đề, và khi cần thiết, tôi đã sử dụng micro thay vì macro. Tôi cũng đã sử dụng các mã cá nhân hóa khác nhau; danh sách chúng được liệt kê bên dưới.
Kết Luận
Bài viết này có thể rất ngắn: “Này các bạn, đây là một prompt mà bạn có thể sử dụng để tạo ra những bức ảnh đẹp.” Prompt đó sẽ hoạt động mà không cần bạn biết lý do tại sao nó hoạt động.
Nhưng việc giải thích chi tiết cách tôi đi đến prompt đó có thể mang lại giá trị lớn hơn nhiều so với việc chỉ cho bạn thấy cách tôi tạo ra những hình ảnh tiêu cự nông. Nó cho thấy rằng kiến thức và sự hiểu biết không chỉ giúp ích với Midjourney mà còn với bất kỳ ứng dụng AI nào khác, từ generative AI đến LLM, và cách suy nghĩ cùng phương pháp tôi sử dụng cũng có thể áp dụng cho bất kỳ loại AI nào.
Và mỗi người trong chúng ta đều là chuyên gia trong một lĩnh vực nào đó, bất kể nó là gì. Vì vậy, điều này có thể giúp bạn tìm ra cách sử dụng chuyên môn của mình để biến AI thành một công cụ hữu ích, thay vì chỉ là một trò chơi với prompt mà không đạt được kết quả như mong đợi.
Nguồn từ: https://medium.com/