Trí tuệ nhân tạo (AI) đã được giao một nhiệm vụ mới trong thời gian gần đây – chiếm lĩnh thế giới nghệ thuật. Sau thành công vang dội của OpenAI’s Dall-E 2, đã có một loạt các chương trình AI bất ngờ tìm cách biến một người bình thường thành một Picasso thời hiện đại.
Mặc dù có rất nhiều công ty để lựa chọn, nhưng một trong những công ty lớn nhất (và được cho là độc nhất) được gọi là Midjourney. Không giống như các đối thủ cạnh tranh nguyên sơ của nó như Dall-E hoặc Google’s Imagen, Midjourney muốn thêm một chút bùng nổ vào lời nhắc của bạn.
Đắm chìm trong tông màu tối, chủ đề giả tưởng và bầu không khí mà Edgar Allen Poe sẽ tự hào, Midjourney là công cụ tạo AI dành cho những người sáng tạo đang tìm cách hướng dẫn hành trình viết sách, trò chơi hoặc khoa học viễn tưởng tiếp theo của họ. Nhưng Midjourney là gì, nó hoạt động như thế nào và bạn có thể sử dụng nó không?
Midjourney là gì và nó có thể làm gì?
Midjourney là một trong nhiều trình tạo hình ảnh AI đã xuất hiện gần đây. Không giống như Dall-E 2 hoặc một số đối thủ cạnh tranh khác của nó, Midjourney mang đến phong cách nghệ thuật đẹp như mơ hơn theo yêu cầu của bạn.
Nó có thể sẽ thu hút những người làm việc trong lĩnh vực văn học hoặc tác phẩm nghệ thuật khoa học viễn tưởng đòi hỏi cảm giác gothic hơn. Trong khi các trình tạo AI khác nghiêng về ảnh nhiều hơn, thì Midjourney giống một công cụ vẽ hơn.
Như trang web của thương hiệu tuyên bố, nó nhằm mục đích ‘khám phá các phương tiện tư duy mới và mở rộng sức mạnh trí tưởng tượng của loài người’.
Midjourney yêu cầu bạn nhập lời nhắc có lời cho một hình ảnh, ví dụ: ‘một con cáo đội mũ chóp theo phong cách minh họa của Roald Dahl’ và trong vài giây, bạn sẽ được trả về nhiều lần thử hình ảnh này.
Mọi thứ có thể không ổn với hình ảnh của bạn và mô hình không hoàn hảo. Ví dụ: nó có thể khó tạo ra bàn tay hoặc các đối tượng phức tạp khác và nền thường có thể bị mờ hoặc nhầm lẫn, nhưng đây là những vấn đề bạn sẽ gặp phải với bất kỳ mô hình nào trong số này.
Làm thế nào bạn có thể đăng ký Midjouney?
Midjourney hoạt động hơi khác so với hầu hết các công cụ AI. Mặc dù bạn có thể đăng ký trực tiếp thông qua trang web của công ty, nhưng việc sử dụng phần mềm sẽ yêu cầu bạn tải xuống và sử dụng Discord – một ứng dụng kiểu diễn đàn trò chuyện.
Khi bạn đã được chấp nhận tham gia Midjourney’s Beta, bạn sẽ được gửi lời mời tham gia Midjourney Discord. Điều này có vẻ khá khó hiểu nếu bạn chưa từng sử dụng bất kỳ thứ gì tương tự trước đây nhưng những điều cơ bản thì rất dễ dàng.
Bạn nhận được 25 truy vấn miễn phí và sau đó, nếu muốn tiếp tục sử dụng phần mềm, bạn cần đăng ký tư cách thành viên trả phí (chi phí từ 8 đến 60 đô la một tháng tùy thuộc vào gói bạn chọn).
Khi bạn đang ở trong Discord, chỉ cần đi tới bất kỳ kênh ‘người mới’ nào được liệt kê ở phía bên trái. Sau đó, nhập ‘/imagine’ theo sau là lời nhắc mong muốn của bạn. Bot sẽ phản hồi với bốn phiên bản của lời nhắc này trong vòng một phút.
Bạn có thể chọn nhận các phiên bản thay thế của bất kỳ hình ảnh nào trong số này hoặc nâng cấp một trong số chúng thành hình ảnh lớn hơn, chất lượng cao hơn.
Trong các kênh bot nơi bạn yêu cầu hình ảnh của mình, những người khác cũng sẽ đưa ra yêu cầu. Nó có thể hơi bận rộn trong đó, vì vậy hãy theo dõi vị trí của hình ảnh của bạn.
Bạn có thể xem bất kỳ hình ảnh nào bạn yêu cầu trên trang web của Midjourney.
Midjourney hoạt động như thế nào?
Đối với hầu hết các trình tạo hình ảnh AI chính, những người sáng tạo đã cung cấp hàng loạt thông tin về cách chúng hoạt động, cùng với việc xuất bản mã nguồn của chúng – đây không phải là trường hợp của Midjourney. Nhóm đằng sau nó đã giữ im lặng phần nào về nền tảng và quá trình đào tạo của nó.
Tuy nhiên, rất có thể Midjourney sử dụng một hệ thống tương tự cho cả Dall-E 2 và Stable Diffusion, đặc biệt là khi cả hai công ty đã giải thích chi tiết về phương pháp đào tạo của họ.
Những mô hình này đã được dạy về mối quan hệ được chia sẻ giữa một hình ảnh và văn bản được sử dụng để mô tả chúng. Trước đây, Midjourney đã tuyên bố rằng, giống như các đối thủ cạnh tranh của mình, họ đã tìm kiếm trên internet các hình ảnh và văn bản để mô tả chúng, sử dụng hàng triệu hình ảnh đã xuất bản để đào tạo.
Phần lớn các trình tạo hình ảnh AI có mã nguồn công khai tạo ra những hình ảnh này thông qua một quá trình được gọi là khuếch tán. Về cơ bản, các mô hình này hoạt động bằng cách thêm nhiễu vào hình ảnh, giảm nó thành một mớ hỗn độn pixel.
Sau đó, nó học cách khôi phục dữ liệu này bằng cách đảo ngược quá trình nhiễu. Quá trình này được lặp đi lặp lại nhiều lần, đào tạo mô hình để thêm tiếng ồn và sau đó loại bỏ nó một lần nữa. Sau đó, mô hình có thể áp dụng quy trình khử nhiễu để tạo ra hình ảnh chân thực bằng cách thực hiện các biến thể nhỏ cho hình ảnh.
Điều này được kết hợp với sự hiểu biết của mô hình về mối quan hệ giữa hình ảnh và văn bản được sử dụng để mô tả nó, giúp trình tạo hình ảnh AI hiểu những gì bạn đang yêu cầu với lời nhắc của bạn
Không phải tất cả đều thuận buồm xuôi gió
Giống như các đối thủ cạnh tranh, Midjourney không phải là không bị chỉ trích. Có những lo ngại về bản quyền, đặc biệt là khi người sáng lập thừa nhận rằng họ không nhận được sự đồng ý từ những người tạo ra tác phẩm nghệ thuật mà người mẫu đã được đào tạo.
Với hàng triệu hình ảnh cần thiết cho một mô hình có kích thước này, điều này có nghĩa là hàng triệu vi phạm bản quyền.
Điều này đã dẫn đến việc cả Midjourney và Stable Diffusion đều vướng vào một vụ kiện do một nhóm nghệ sĩ khởi xướng.
“Đó là [bộ dữ liệu] chỉ là một mảnh vụn lớn trên Internet. Chúng tôi sử dụng các bộ dữ liệu mở đã được xuất bản và đào tạo trên những bộ dữ liệu đó. Tôi muốn nói rằng đó là điều mà 100% mọi người đều làm. Chúng tôi không kén chọn,” David nói Holz, người sáng lập Midjourney, trong một cuộc phỏng vấn với Forbes.
Trong tương lai, Midjourney hy vọng có thể cung cấp cho các nghệ sĩ khả năng từ chối sử dụng hình ảnh của họ trong tương lai.
“Thách thức bây giờ là tìm ra các quy tắc là gì và làm thế nào để biết liệu một người có thực sự là nghệ sĩ của một tác phẩm cụ thể hay chỉ ghi tên họ lên đó,” Holz nói trong cuộc phỏng vấn với Forbes.
“Chúng tôi chưa gặp bất kỳ ai muốn xóa tên của họ khỏi tập dữ liệu mà chúng tôi thực sự có thể tìm thấy trong tập dữ liệu.”
Nguồn từ: https://medium.com/