in ,

Midjourney: Mọi thứ bạn cần biết về nghệ sĩ AI

Giữa hành trình: Cái gì vậy? Sử dụng, Hạn chế và Lựa chọn thay thế

Midjourney: Mọi thứ bạn cần biết về nghệ sĩ AI
Midjourney: Mọi thứ bạn cần biết về nghệ sĩ AI

Midjourney là một trình tạo hình ảnh AI tạo ra hình ảnh từ các mô tả văn bản. Đây là phòng thí nghiệm nghiên cứu do David Holz, đồng sáng lập của Leap Motion, điều hành. Midjourney cung cấp một phong cách nghệ thuật đẹp như mơ hơn theo yêu cầu của bạn và có giao diện gothic hơn so với các trình tạo AI khác. Công cụ này hiện đang ở giai đoạn thử nghiệm mở và chỉ có thể được truy cập thông qua bot Discord trên Discord chính thức của họ.

Để tạo hình ảnh, người dùng sử dụng lệnh /imagine và nhập lời nhắc, bot sẽ trả về một bộ bốn hình ảnh. Sau đó, người dùng có thể chọn những hình ảnh họ muốn chia tỷ lệ. Midjourney cũng đang hoạt động trên giao diện web.

Người sáng lập David Holz xem các nghệ sĩ là khách hàng của Midjourney chứ không phải đối thủ cạnh tranh. Các nghệ sĩ sử dụng Midjourney để tạo mẫu nhanh cho ý tưởng nghệ thuật mà họ trình bày cho khách hàng của mình trước khi bắt đầu tự làm việc. Vì tất cả các dòng sản phẩm của Midjourney có thể bao gồm các tác phẩm có bản quyền của các nghệ sĩ, một số nghệ sĩ đã cáo buộc Midjourney phá giá tác phẩm sáng tạo gốc.

Điều khoản dịch vụ của Midjourney bao gồm Chính sách gỡ xuống DMCA, cho phép các nghệ sĩ yêu cầu xóa tác phẩm của họ khỏi bộ nếu họ tin rằng vi phạm bản quyền là hiển nhiên. Ngành quảng cáo cũng đã sử dụng các công cụ AI như Midjourney, DALL-E và Stable Diffusion, trong số những công cụ khác, cho phép các nhà quảng cáo tạo nội dung gốc và đưa ra ý tưởng một cách nhanh chóng.

Midjourney đã được nhiều người và công ty sử dụng để tạo ra hình ảnh và tác phẩm nghệ thuật, bao gồm The Economist và Corriere della Sera. Tuy nhiên, Midjourney đã vấp phải sự chỉ trích từ một số nghệ sĩ, những người cảm thấy rằng nó đang lấy đi công việc của các nghệ sĩ và vi phạm bản quyền của họ. Midjourney cũng là đối tượng của một vụ kiện do một nhóm nghệ sĩ đệ trình vì vi phạm bản quyền.

Để bắt đầu sử dụng Midjourney, người dùng cần đăng nhập vào Discord và truy cập trang web của Midjourney để tham gia bản beta. Sau khi được chấp nhận, người dùng sẽ nhận được lời mời tham gia Discord MidjTHER và có thể bắt đầu tạo hình ảnh bằng cách nhập /imagine theo sau là lời nhắc mong muốn.

Midjourney không tiết lộ nhiều thông tin về lý lịch và quá trình đào tạo của anh ấy, nhưng người ta suy đoán rằng anh ấy sử dụng một hệ thống tương tự như Dall-E 2 và Stable Diffusion, thu thập hình ảnh và văn bản từ internet để mô tả chúng, đồng thời sử dụng hàng triệu hình ảnh đã xuất bản để đào tạo .

Mục lục

Quá trình được Midjourney sử dụng để tạo hình ảnh từ lời nhắc văn bản

Midjourney sử dụng mô hình AI chuyển văn bản thành hình ảnh để tạo hình ảnh từ lời nhắc văn bản. Bot Midjourney chia các từ và cụm từ trong lời nhắc thành các phần nhỏ hơn, được gọi là mã thông báo, có thể được so sánh với dữ liệu đào tạo của nó và sau đó được sử dụng để tạo hình ảnh. Lời nhắc được thiết kế tốt có thể giúp tạo ra những hình ảnh độc đáo và thú vị [0].

Để tạo một hình ảnh với Midjourney, người dùng phải nhập mô tả về hình ảnh mà họ muốn trông như thế nào bằng cách sử dụng lệnh “/imagine” trong kênh Midjourney Discord. Thông điệp càng cụ thể và mang tính mô tả thì AI càng có khả năng tạo ra kết quả tốt. Sau đó, Midjourney sẽ tạo một số phiên bản khác nhau của hình ảnh dựa trên lời nhắc trong vòng một phút. Người dùng có thể chọn nhận các phiên bản thay thế của bất kỳ hình ảnh nào trong số này hoặc phóng to bất kỳ hình ảnh nào trong số chúng để có hình ảnh lớn hơn, chất lượng cao hơn. Midjourney cung cấp các chế độ nhanh và thoải mái, trong đó chế độ nhanh là cần thiết để đạt được độ phóng đại tối đa và tạo ra nhiều hình ảnh hơn trong thời gian ngắn hơn.

Mô hình AI của Midjourney sử dụng khuếch tán, bao gồm việc thêm nhiễu vào hình ảnh và sau đó đảo ngược quy trình để truy xuất dữ liệu. Quá trình này được lặp đi lặp lại không ngừng, khiến mô hình thêm nhiễu rồi lại loại bỏ nhiễu, cuối cùng tạo ra hình ảnh chân thực bằng cách thực hiện các biến thể nhỏ trong hình ảnh. Midjourney lùng sục trên internet các hình ảnh và văn bản để mô tả chúng, sử dụng hàng triệu hình ảnh tập luyện đã xuất bản.

Mô hình AI của Midjourney dựa trên luồng ổn định, được đào tạo trên 2,3 tỷ cặp hình ảnh và mô tả văn bản. Bằng cách sử dụng đúng từ trong lời nhắc, người dùng có thể tạo hầu hết mọi thứ xuất hiện trong đầu. Tuy nhiên, một số từ bị cấm và Midjourney duy trì một danh sách các từ này để ngăn những người có ác ý tạo lời nhắc. Cộng đồng Discord của Midjourney sẵn sàng cung cấp trợ giúp trực tiếp và nhiều ví dụ cho người dùng.

Sử dụng và tạo hình ảnh

Để sử dụng miễn phí Midjourney AI, bạn phải có tài khoản Discord. Nếu bạn chưa có, hãy đăng ký miễn phí trên Discord. Tiếp theo, hãy truy cập trang web Midjourney và chọn Tham gia Beta. Điều này sẽ đưa bạn đến một lời mời Discord. Chấp nhận lời mời tham gia Midjourney của Discord và chọn Tiếp tục trên Discord. 

Ứng dụng Discord của bạn sẽ tự động mở và bạn có thể chọn biểu tượng Midjourney hình con tàu từ menu bên trái. Trong các kênh Midjourney, xác định vị trí các phòng dành cho người mới và chọn một trong số chúng để bắt đầu. Khi bạn đã sẵn sàng, hãy nhập "/imagine" trong cuộc trò chuyện Discord cho phòng dành cho người mới của bạn. 

Thao tác này sẽ tạo một trường nhắc nơi bạn có thể nhập mô tả hình ảnh. Bạn mô tả càng cụ thể thì AI càng có khả năng tạo ra kết quả tốt. Hãy mô tả và nếu bạn đang tìm kiếm một phong cách cụ thể, hãy đưa phong cách đó vào mô tả của bạn. Midjourney cung cấp cho mỗi người dùng 25 lần thử chơi với AI. 

Sau đó, bạn sẽ cần phải đăng ký như một thành viên đầy đủ để tiếp tục. Nếu bạn không muốn tiêu tiền, bạn nên dành chút thời gian và suy nghĩ về những gì bạn muốn tạo trên Midjourney. 

Nếu muốn, bạn có thể nhập "/help" để nhận danh sách các mẹo cần làm theo. Điều cần thiết là phải biết danh sách các từ bị cấm trước khi sử dụng AI giữa hành trình, vì việc không tuân thủ quy tắc ứng xử sẽ dẫn đến lệnh cấm.

>> Đọc thêm - 27 trang web trí tuệ nhân tạo miễn phí tốt nhất (Thiết kế, viết quảng cáo, trò chuyện, v.v.)

/ tưởng tượng lệnh

Lệnh /imagine là một trong những lệnh chính trong Midjourney cho phép người dùng tạo các hình ảnh do AI tạo ra dựa trên nhu cầu của họ. Đây là cách nó hoạt động:

  1. Người dùng nhập lệnh /imagine trong cuộc trò chuyện Discord và thêm cài đặt họ muốn sử dụng.
  2. Thuật toán AI giữa hành trình phân tích lời nhắc và tạo hình ảnh dựa trên thông tin đầu vào.
  3. Hình ảnh đã tạo được hiển thị trong cuộc trò chuyện Discord và người dùng có thể cung cấp phản hồi và tinh chỉnh tin nhắn của họ bằng tính năng Remix.
  4. Người dùng cũng có thể sử dụng các cài đặt bổ sung để điều chỉnh kiểu, phiên bản và các khía cạnh khác của hình ảnh được tạo.

Lệnh /imagine chấp nhận cả lời nhắc hình ảnh và văn bản. Người dùng có thể thêm lời nhắc dưới dạng hình ảnh bằng cách cung cấp URL hoặc tệp đính kèm cho hình ảnh họ muốn tạo. Lời nhắc văn bản có thể bao gồm các mô tả về hình ảnh mà người dùng muốn tạo, chẳng hạn như đối tượng, hình nền và kiểu. Người dùng cũng có thể thêm các tham số bổ sung vào lệnh để điều chỉnh phiên bản của thuật toán họ muốn sử dụng, bật tính năng Remix, v.v.

Ví dụ về các loại hình ảnh Midjourney AI có thể tạo

Midjourney AI có thể tạo nhiều loại hình ảnh theo các phong cách khác nhau, bao gồm nhưng không giới hạn ở:

  • Hình minh họa cho sách dành cho trẻ em, chẳng hạn như ví dụ về "Cuộc phiêu lưu của chú lợn con".
  • Chân dung thực tế của con người, động vật và đồ vật.
  • Các tác phẩm nghệ thuật siêu thực và trừu tượng pha trộn các yếu tố và phong cách khác nhau.
  • Phong cảnh và cảnh quan thành phố có thể gợi lên những tâm trạng và cảm xúc khác nhau.
  • Chụp ảnh đen trắng với chi tiết phức tạp và hiệu ứng điện ảnh.
  • Hình ảnh minh họa các chủ đề tương lai hoặc khoa học viễn tưởng, chẳng hạn như ví dụ về một bà già nửa người nửa máy làm từ các bộ phận của người máy và đeo mặt nạ phòng độc.

Điều quan trọng cần lưu ý là chất lượng và kiểu dáng của hình ảnh do Midjourney AI tạo ra có thể khác nhau tùy thuộc vào chất lượng của lời nhắc, phiên bản của thuật toán được sử dụng và các yếu tố khác. Người dùng nên thử nghiệm với các lời nhắc và cài đặt khác nhau để nhận được kết quả mong muốn.

Kết hợp hình ảnh trong Midjourney

Để kết hợp hai hoặc nhiều hình ảnh trong Midjourney, bạn có thể làm theo các bước sau:

  1. Chọn những hình ảnh bạn muốn kết hợp và tải chúng lên Discord.
  2. Sao chép các liên kết đến hình ảnh và thêm chúng vào lời nhắc /imagine của bạn dưới dạng lời nhắc hình ảnh.
  3. Thêm "-v 4" vào lời nhắc của bạn nếu phiên bản 4 không được bật theo mặc định.
  4. Gửi lệnh và đợi hình ảnh được tạo.

Ví dụ: để kết hợp hai hình ảnh, bạn có thể sử dụng lệnh sau: /imagine –v 1

Bạn cũng có thể thêm thông tin bổ sung, bao gồm các đối tượng, nền và phong cách nghệ thuật chung để tạo một hình ảnh hoàn toàn mới với phong cách riêng. Ví dụ: / tưởng tượng , phong cách hoạt hình, đám đông vui vẻ ở hậu cảnh, logo Tesla trên ngực, trang phục -non -v 1

Midjourney cũng tung ra một tính năng mới, lệnh /blend, cho phép hợp nhất tối đa năm hình ảnh mà không cần phải sao chép và dán URL. Bạn có thể kích hoạt lệnh /blend bằng cách bao gồm cờ –blend trong lời nhắc của bạn.

Điều quan trọng cần lưu ý là chức năng này chỉ hoạt động với phiên bản 4 của thuật toán Midjourney và việc kết hợp hình ảnh không yêu cầu thêm văn bản, nhưng việc thêm thông tin thường mang lại hình ảnh đẹp hơn. Kết quả tốt nhất thường đạt được bằng cách thử nghiệm với Art Styles và tinh chỉnh hình ảnh với Remix Mode.

Kết hợp nhiều hơn hai hình ảnh

Midjourney cho phép người dùng trộn tối đa năm hình ảnh bằng cách sử dụng lệnh /blend. Tuy nhiên, nếu người dùng cần kết hợp nhiều hơn năm hình ảnh, họ có thể sử dụng lệnh /imagine và dán các URL hình ảnh công khai vào một hàng. Để kết hợp nhiều hơn hai hình ảnh bằng lệnh /imagine, người dùng có thể thêm lời nhắc vào lệnh. Ví dụ: để kết hợp ba hình ảnh, lệnh sẽ là /imagine –v 1.

Người dùng có thể thêm nhiều dấu nhắc lệnh để kết hợp nhiều hình ảnh hơn. Điều quan trọng cần lưu ý là việc thêm thông tin bổ sung vào lời nhắc, bao gồm các đối tượng, nền và phong cách nghệ thuật chung, có thể giúp tạo một hình ảnh hoàn toàn mới với phong cách riêng của nó. Kết quả tốt nhất đạt được bằng cách thử nghiệm với Art Styles và tinh chỉnh hình ảnh với Remix Mode

Lệnh /blend trong Midjourney

Lệnh /blend của Midjourney cho phép người dùng trộn tối đa năm hình ảnh bằng cách thêm trực tiếp các phần tử giao diện người dùng dễ sử dụng vào giao diện Discord. Người dùng có thể kéo thả hình ảnh vào giao diện hoặc chọn trực tiếp từ ổ cứng. Người dùng cũng có thể chọn kích thước của hình ảnh mà họ muốn xem được tạo. Nếu người dùng sử dụng các hậu tố tùy chỉnh, họ có thể tùy chọn thêm chúng vào cuối lệnh, như với bất kỳ lệnh /imagine thông thường nào.

Nhóm Midjourney đã thiết kế lệnh /blend để kiểm tra hiệu quả “khái niệm” và “tâm trạng” của hình ảnh của người dùng và cố gắng trộn chúng. Điều này đôi khi dẫn đến những hình ảnh lôi cuốn đáng ngạc nhiên và trong những trường hợp khác, người dùng nhận được những hình ảnh kinh hoàng. Tuy nhiên, lệnh /blend không hỗ trợ lời nhắc văn bản.

Lệnh /blend có những hạn chế. Rõ ràng nhất là người dùng chỉ có thể thêm năm tham chiếu hình ảnh khác nhau. Mặc dù về mặt kỹ thuật, lệnh /imagine chấp nhận nhiều hơn năm hình ảnh, nhưng người dùng càng thêm nhiều tham chiếu thì mỗi tham chiếu càng ít quan trọng hơn. Đây là một vấn đề chung với sự pha loãng vấn đề và không phải là một vấn đề cụ thể /blend. Hạn chế lớn khác là lệnh hòa trộn giữa hành trình không hoạt động với lời nhắc văn bản. Điều này có thể không may cho những người dùng nâng cao, những người hiếm khi chỉ trộn hai hình ảnh. Tuy nhiên, đối với những người dùng muốn tạo mashup, hạn chế này không quan trọng lắm.

Cải thiện thời gian xây dựng

có nhiều cách để cải thiện hoặc tối ưu hóa thời gian tạo ảnh bằng Midjourney AI. Dưới đây là một số lời khuyên có thể giúp bạn:

  • Sử dụng lời nhắc cụ thể và chi tiết: Midjourney tạo hình ảnh dựa trên lời nhắc của người dùng. Lời nhắc càng cụ thể và chi tiết thì kết quả càng tốt. Nó cũng giảm thời gian cần thiết để tạo ra một hình ảnh, vì thuật toán AI có ý tưởng chính xác hơn về những gì người dùng muốn.
  • Thử nghiệm với các cài đặt chất lượng khác nhau: Tham số –quality điều chỉnh chất lượng của hình ảnh và thời gian cần thiết để tạo ra nó. Cài đặt chất lượng thấp hơn sẽ tạo ra hình ảnh nhanh hơn, trong khi cài đặt chất lượng cao hơn có thể mất nhiều thời gian hơn nhưng cho kết quả tốt hơn. Điều quan trọng là thử nghiệm với các cài đặt khác nhau để tìm ra sự cân bằng phù hợp giữa chất lượng và tốc độ.
  • Sử dụng Chế độ thư giãn: Người đăng ký gói Standard và Pro có thể sử dụng Chế độ thư giãn, chế độ này không tốn thời gian GPU của người dùng nhưng đặt công việc vào hàng đợi dựa trên tần suất sử dụng thiết bị trên hệ thống. Thời gian chờ cho chế độ Thư giãn là động, nhưng thường từ 0 đến 10 phút cho mỗi tác vụ. Sử dụng chế độ Thư giãn có thể là một cách hay để tối ưu hóa thời gian tạo, đặc biệt đối với những người dùng tạo một số lượng lớn hình ảnh mỗi tháng.
  • Mua thêm Giờ nhanh: Chế độ nhanh là mức xử lý ưu tiên cao nhất và sử dụng thời gian GPU hàng tháng từ đăng ký của người dùng. Người dùng có thể mua thêm Giờ nhanh trên trang Midjourney.com/accounts của họ, giúp đảm bảo hình ảnh của họ được tạo nhanh chóng và hiệu quả.
  • Sử dụng Thư giãn Nhanh: Thư giãn Nhanh là một tính năng mới trong Midjourney cho phép người dùng tạo ảnh nhanh hơn bằng cách hy sinh một số chất lượng. Chế độ Thư giãn nhanh tạo ra hình ảnh với chất lượng khoảng 60%, đây có thể là một sự thỏa hiệp tốt cho những người dùng muốn tạo hình ảnh nhanh chóng nhưng không muốn hy sinh quá nhiều chất lượng.

Tóm lại, có một số cách để cải thiện hoặc tối ưu hóa thời gian xây dựng để tạo hình ảnh AI giữa hành trình, bao gồm sử dụng lời nhắc cụ thể, thử nghiệm các cài đặt chất lượng khác nhau, sử dụng chế độ Thư giãn hoặc mua thêm giờ nhanh và sử dụng chế độ Thư giãn nhanh.

Hình ảnh do mô hình AI của Midjourney tạo ra chính xác đến mức nào?

Độ chính xác của hình ảnh do mô hình AI của Midjourney tạo ra có thể khác nhau tùy thuộc vào lời nhắc và chất lượng của dữ liệu huấn luyện. Người dùng có thể cải thiện độ chính xác của hình ảnh được tạo bằng cách cụ thể và chi tiết trong các truy vấn của họ. Lời nhắc càng cụ thể và mô tả thì AI càng có khả năng tạo ra kết quả tốt. Mô hình AI của Midjourney được đào tạo dựa trên hàng triệu hình ảnh và mô tả văn bản được lấy từ internet, điều này cũng có thể ảnh hưởng đến độ chính xác của hình ảnh được tạo.

Mô hình AI của Midjourney sử dụng khuếch tán, bao gồm việc thêm nhiễu vào hình ảnh và sau đó đảo ngược quy trình để truy xuất dữ liệu. Quá trình này được lặp đi lặp lại không ngừng, khiến mô hình thêm nhiễu rồi lại loại bỏ nhiễu, cuối cùng tạo ra hình ảnh chân thực bằng cách thực hiện các biến thể nhỏ trong hình ảnh.

Mô hình AI của Midjourney dựa trên luồng ổn định, được đào tạo trên 2,3 tỷ cặp hình ảnh và mô tả văn bản. Bằng cách sử dụng đúng từ trong lời nhắc, người dùng có thể tạo hầu hết mọi thứ xuất hiện trong đầu. Tuy nhiên, một số từ bị cấm và Midjourney duy trì một danh sách các từ này để ngăn những người có ác ý tạo lời nhắc. Cộng đồng Discord của Midjourney sẵn sàng cung cấp trợ giúp trực tiếp và nhiều ví dụ cho người dùng.

Cần lưu ý rằng những hình ảnh do AI tạo ra trong Midjourney đã là chủ đề gây tranh cãi liên quan đến vi phạm bản quyền và tính độc đáo nghệ thuật. Một số nghệ sĩ đã cáo buộc MidjTHER làm mất giá trị tác phẩm sáng tạo ban đầu, trong khi những người khác coi đó là công cụ để tạo mẫu nhanh khái niệm nghệ thuật để hiển thị cho khách hàng trước khi họ bắt đầu làm việc.

Midjourney giải quyết những lo ngại về vi phạm bản quyền và tính nguyên bản của hình ảnh do AI tạo ra như thế nào?

Giữa hành trình: Vi phạm bản quyền và tính độc đáo của hình ảnh do AI tạo ra

Midjourney đã thực hiện các bước để giải quyết những lo ngại về vi phạm bản quyền và tính nguyên bản của hình ảnh do AI tạo ra. Midjourney kiểm tra cẩn thận mọi lời nhắc và mọi hình ảnh để đảm bảo không có vấn đề về bản quyền, chỉ sử dụng nội dung được cấp phép hoặc thuộc phạm vi công cộng, đồng thời thực hiện nghiên cứu bổ sung hoặc bằng cách xin phép chủ sở hữu hợp pháp trong trường hợp không chắc chắn.

Midjourney cũng khuyến khích trách nhiệm của người dùng bằng cách kêu gọi họ tôn trọng luật bản quyền và chỉ sử dụng những hình ảnh và lời nhắc mà họ có quyền sử dụng. Nếu người dùng đặt câu hỏi về nguồn của tin nhắn hoặc hình ảnh, thì nền tảng sẽ có hành động nhanh chóng để điều tra và xóa mọi nội dung vi phạm, theo Đạo luật bản quyền kỹ thuật số thiên niên kỷ (DMCA) năm 1998.

DMCA cung cấp các điều khoản bảo vệ cho các nhà cung cấp dịch vụ trực tuyến, chẳng hạn như Midjourney, những người hành động thiện chí để xóa nội dung vi phạm khi được chủ sở hữu bản quyền thông báo. Midjourney cũng có Chính sách gỡ xuống DMCA cho phép các nghệ sĩ yêu cầu xóa tác phẩm của họ khỏi trường quay nếu họ cho rằng hành vi vi phạm bản quyền là rõ ràng. [2][4].

Cách tiếp cận của Midjourney để tránh vi phạm phù hợp với các vụ kiện của Tòa án Tối cao như Feist Publications, Inc. v. Rural Telephone Service Co., Inc. (1991), trong đó Tòa án cho rằng tính độc đáo, chứ không phải tính mới, là yêu cầu thiết yếu để bảo vệ bản quyền, và Oracle America, Inc. v. Google LLC (2018), trong đó Tòa án cho rằng việc sao chép tác phẩm gốc, ngay cả với mục đích khác, vẫn có thể bị coi là vi phạm bản quyền.

Hình ảnh do AI tạo ra của Midjourney đã là chủ đề gây tranh cãi về vi phạm bản quyền và tính độc đáo nghệ thuật. Một số nghệ sĩ đã cáo buộc MidjTHER làm mất giá trị tác phẩm sáng tạo ban đầu, trong khi những người khác coi đó là công cụ để tạo mẫu nhanh khái niệm nghệ thuật để hiển thị cho khách hàng trước khi họ bắt đầu làm việc. Điều khoản dịch vụ của Midjourney bao gồm Chính sách gỡ xuống DMCA, cho phép các nghệ sĩ yêu cầu xóa tác phẩm của họ khỏi bộ nếu họ tin rằng có vi phạm bản quyền.

Làm cách nào để Midjourney đảm bảo rằng tất cả nội dung được cấp phép hoặc thuộc phạm vi công cộng được sử dụng để tạo hình ảnh do AI tạo đều được quy kết đúng?

Không rõ bằng cách nào Midjourney đảm bảo rằng tất cả nội dung được cấp phép hoặc thuộc phạm vi công cộng được sử dụng để tạo hình ảnh do AI tạo ra đều được phân bổ hợp lý. Tuy nhiên, Midjourney kiểm tra cẩn thận từng bài đăng và hình ảnh để đảm bảo không có vấn đề về bản quyền, chỉ sử dụng nội dung được cấp phép hoặc thuộc phạm vi công cộng, đồng thời tiến hành nghiên cứu bổ sung hoặc bằng cách xin phép chủ sở hữu hợp pháp trong trường hợp không chắc chắn. 

Midjourney cũng khuyến khích trách nhiệm của người dùng bằng cách kêu gọi họ tôn trọng luật bản quyền và chỉ sử dụng những hình ảnh và lời nhắc mà họ có quyền sử dụng. Nếu người dùng đặt câu hỏi về nguồn của tin nhắn hoặc hình ảnh, thì nền tảng sẽ có hành động nhanh chóng để điều tra và xóa mọi nội dung vi phạm, theo Đạo luật bản quyền kỹ thuật số thiên niên kỷ (DMCA) năm 1998. 

Midjourney cũng có Chính sách gỡ xuống DMCA, cho phép các nghệ sĩ yêu cầu xóa tác phẩm của họ khỏi sê-ri nếu họ cho rằng có hành vi vi phạm bản quyền rõ ràng.

Cần lưu ý rằng những hình ảnh do AI tạo ra trong Midjourney đã là chủ đề gây tranh cãi liên quan đến vi phạm bản quyền và tính độc đáo nghệ thuật. Một số nghệ sĩ đã cáo buộc MidjTHER làm mất giá trị tác phẩm sáng tạo ban đầu, trong khi những người khác coi đó là công cụ để tạo mẫu nhanh khái niệm nghệ thuật để hiển thị cho khách hàng trước khi họ bắt đầu làm việc.

Các quy tắc mà người dùng phải tôn trọng trên Midjourney

Midjourney đã thiết lập một bộ quy tắc mà người dùng phải tuân theo để đảm bảo một cộng đồng thân thiện và hòa nhập cho tất cả mọi người. Các quy tắc này như sau: [0][1][2] :

  • Hãy tử tế và tôn trọng người khác và nhân viên. Không tạo hình ảnh hoặc sử dụng lời nhắc bằng văn bản mang tính chất thiếu tôn trọng, gây hấn hoặc lạm dụng. Bạo lực hoặc quấy rối dưới bất kỳ hình thức nào sẽ không được dung thứ.
  • Không có nội dung người lớn hoặc cảnh đẫm máu. Vui lòng tránh nội dung xúc phạm hoặc gây phiền nhiễu. Một số mục nhập văn bản bị chặn tự động.
  • Không sao chép công khai sáng tạo của người khác mà không có sự cho phép của họ.
  • Chú ý chia sẻ. Bạn có thể chia sẻ sáng tạo của mình bên ngoài cộng đồng Midjourney, nhưng hãy xem xét cách những người khác có thể xem nội dung của bạn.
  • Bất kỳ hành vi vi phạm các quy tắc này có thể dẫn đến việc loại trừ khỏi dịch vụ.
  • Các quy tắc này áp dụng cho tất cả nội dung, bao gồm hình ảnh được tạo trong máy chủ riêng, ở chế độ riêng tư và trong tin nhắn trực tiếp với Midjourney Bot.

MidjTHER cũng có một danh sách các từ bị cấm không được phép trong tin nhắn. Danh sách các từ bị cấm bao gồm các từ liên quan trực tiếp hoặc gián tiếp đến bạo lực, quấy rối, máu me, nội dung người lớn, ma túy hoặc ngôn từ kích động thù địch. Hơn nữa, nó không cho phép các lời nhắc bao gồm hoặc có liên quan đến gây hấn và bạo lực.

Nếu một từ nằm trong danh sách từ bị cấm hoặc nếu nó có liên quan chặt chẽ hoặc từ xa với một từ bị cấm, Midjourney sẽ không cho phép lời nhắc. Người dùng Midjourney nên thay thế các từ bị cấm bằng các từ tương tự nhưng được cho phép, tránh sử dụng các từ có liên quan chặt chẽ hoặc không liên quan đến các từ bị cấm hoặc cân nhắc sử dụng từ đồng nghĩa hoặc cách diễn đạt khác.

Cấm Từ Giữa Hành Trình

Midjourney đã triển khai một bộ lọc tự động lọc và cấm các từ chính xác hoặc tương tự trong danh sách từ bị cấm. Danh sách các từ bị cấm bao gồm các từ liên quan trực tiếp hoặc gián tiếp đến bạo lực, quấy rối, máu me, nội dung người lớn, ma túy hoặc kích động thù hận. Ngoài ra, nó không cho phép lời nhắc bao gồm hoặc liên quan đến gây hấn và lạm dụng.

Danh sách các từ bị cấm không nhất thiết phải đầy đủ và có thể có nhiều thuật ngữ khác chưa có trong danh sách. Midjourney liên tục cập nhật danh sách các từ bị cấm. Danh sách này đang được xem xét liên tục và không công khai. Tuy nhiên, có một danh sách do cộng đồng điều hành mà người dùng có thể truy cập và đóng góp nếu muốn. [0] [1].

Nếu một từ nằm trong danh sách từ bị cấm hoặc nếu nó có liên quan chặt chẽ hoặc từ xa với một từ bị cấm, Midjourney sẽ không cho phép lời nhắc. Người dùng giữa hành trình nên thay thế các từ bị cấm bằng các từ tương tự nhưng được phép sử dụng, tránh sử dụng từ thậm chí có liên quan lỏng lẻo với từ bị cấm hoặc cân nhắc sử dụng từ đồng nghĩa hoặc từ thay thế. Người dùng Midjourney phải luôn kiểm tra kênh #rules trước khi gửi thông báo của họ vì nhóm liên tục cập nhật danh sách các từ bị cấm [2].

Midjourney có một quy tắc ứng xử mà người dùng phải tuân theo. Quy tắc ứng xử không chỉ là tuân theo nội dung PG-13 mà còn là tử tế và tôn trọng người khác cũng như nhân viên. Vi phạm các quy tắc có thể dẫn đến đình chỉ hoặc trục xuất khỏi dịch vụ. Midjourney là một cộng đồng Discord mở và việc tuân theo quy tắc ứng xử là điều cần thiết. Ngay cả khi người dùng sử dụng dịch vụ ở chế độ '/riêng tư', họ vẫn phải tôn trọng quy tắc ứng xử.

Tóm lại, Midjourney thực hiện chính sách kiểm duyệt nội dung nghiêm ngặt và nghiêm cấm mọi hình thức bạo lực hoặc quấy rối, mọi nội dung người lớn hoặc máu me, cũng như mọi nội dung gây khó chịu hoặc xúc phạm trực quan. Midjourney đã triển khai bộ lọc tự động lọc và cấm các từ chính xác hoặc tương tự trong danh sách từ bị cấm, bao gồm các từ liên quan trực tiếp hoặc gián tiếp đến bạo lực, quấy rối, máu me, nội dung người lớn, ma túy hoặc kích động thù hận. Người dùng Midjourney nên tuân thủ quy tắc ứng xử và kiểm tra kênh #rules trước khi gửi thông báo của họ vì nhóm liên tục cập nhật danh sách các từ bị cấm.

Cập nhật danh sách các từ bị cấm

Midjourney định kỳ điều chỉnh danh sách các từ bị cấm và danh sách này đang được xem xét liên tục. Danh sách các từ bị cấm không công khai, nhưng có một danh sách do cộng đồng điều hành mà người dùng có thể truy cập và đóng góp. Midjourney cố gắng cung cấp trải nghiệm PG-13 trên toàn bộ Dịch vụ của mình, đó là lý do tại sao các từ ngữ và nội dung liên quan đến bạo lực, máu me, quấy rối, ma túy, nội dung người lớn và các chủ đề thường gây khó chịu đều bị cấm. Danh sách các từ bị cấm được chia thành nhiều loại bao gồm các chủ đề được đề cập ở trên. Điều quan trọng cần lưu ý là danh sách các từ bị cấm trên Midjourney không nhất thiết phải đầy đủ và có thể có nhiều thuật ngữ khác chưa có trong danh sách.

Cấm và đình chỉ Midjourney

Midjourney có một quy tắc ứng xử nghiêm ngặt mà người dùng phải tuân theo. Vi phạm các quy tắc có thể dẫn đến đình chỉ hoặc trục xuất khỏi dịch vụ. Tuy nhiên, vẫn chưa rõ liệu người dùng có thể khiếu nại lệnh cấm hoặc đình chỉ từ Midjourney hay không. Các nguồn không đề cập rõ ràng đến quy trình kháng cáo hoặc cách liên hệ với nhóm Midjourney về lệnh cấm hoặc đình chỉ. Điều cần thiết là phải tôn trọng quy tắc ứng xử để tránh bị cấm hoặc đình chỉ dịch vụ. Nếu người dùng có bất kỳ mối quan tâm hoặc câu hỏi nào liên quan đến dịch vụ, họ có thể liên hệ với nhóm Midjourney qua máy chủ Discord của họ [1][2].

Midjourney có thể tạo hình ảnh ở các kích thước hoặc độ phân giải cụ thể không?

Midjourney có kích thước và độ phân giải hình ảnh mặc định cụ thể mà người dùng có thể tạo. Kích thước hình ảnh mặc định cho Midjourney là 512x512 pixel, có thể tăng lên 1024x1024 pixel hoặc 1664x1664 pixel bằng lệnh /imagine trên Discord. Ngoài ra còn có một tùy chọn beta gọi là "Beta Upscale Redo", có thể tăng kích thước hình ảnh lên tới 2028x2028 pixel, nhưng có thể làm mờ một số chi tiết.

Người dùng chỉ có thể chia tỷ lệ thành độ phân giải tối đa sau khi thực hiện ít nhất tỷ lệ cơ bản của hình ảnh [1]. Kích thước tệp tối đa mà Midjourney có thể tạo ra là 3 megapixel, nghĩa là người dùng có thể tạo ảnh với bất kỳ tỷ lệ khung hình nào, nhưng kích thước ảnh cuối cùng không được vượt quá 3 pixel. Độ phân giải của Midjourney là đủ cho các bản in ảnh cơ bản, nhưng nếu người dùng muốn in thứ gì đó lớn hơn, họ có thể cần sử dụng bộ chuyển đổi AI bên ngoài để có được kết quả tốt.

Làm thế nào để Midjourney so sánh với các trình tạo hình ảnh AI khác như DALL-E và Khuếch tán ổn định?

Theo các nguồn tin, Midjourney là một trình tạo hình ảnh AI tạo ra những hình ảnh nghệ thuật và đẹp như mơ từ lời nhắc văn bản. Nó được so sánh với các máy phát khác như DALL-E và Khuếch tán ổn định. Midjourney được cho là cung cấp nhiều phong cách hạn chế hơn so với hai phong cách còn lại, nhưng hình ảnh của nó vẫn tối hơn và nghệ thuật hơn. Midjourney dường như không phù hợp với DALL-E và Khuếch tán ổn định khi nói đến chủ nghĩa quang học [1][2].

Khuếch tán ổn định được so sánh với Midjourney và DALL-E, và được cho là nằm ở khoảng giữa về mức độ dễ sử dụng và chất lượng đầu ra. Khuếch tán ổn định cung cấp nhiều tùy chọn hơn DALL-E, chẳng hạn như thang đo để xác định mức độ trình tạo theo dõi các từ hướng dẫn và các tùy chọn liên quan đến định dạng và kích thước đầu ra. Tuy nhiên, quy trình làm việc của Khuếch tán ổn định không phù hợp với quy trình của DALL-E, vốn nhóm các hình ảnh và cung cấp các thư mục bộ sưu tập. Khuếch tán ổn định và DALL-E được cho là có những thiếu sót giống nhau khi nói đến chủ nghĩa quang học, cả hai đều không thể đến gần với ứng dụng web của MidjTHER Discord [0].

Theo thử nghiệm so sánh của Fabian Stelzer, Midjourney luôn tối hơn DALL-E và Stable Diffusion. Trong khi DALL-E và Stable Diffusion tạo ra hình ảnh chân thực hơn, các sản phẩm của Midjourney có chất lượng nghệ thuật, đẹp như mơ. Midjourney được so sánh với bộ tổng hợp tương tự Moog, với các tạo tác dễ chịu, trong khi DALL-E được so sánh với bộ tổng hợp máy trạm kỹ thuật số với phạm vi rộng hơn.

Khuếch tán ổn định được so sánh với một bộ tổng hợp mô-đun phức tạp có thể tạo ra hầu hết mọi âm thanh, nhưng khó kích hoạt hơn. Về độ phân giải hình ảnh, Midjourney có thể tạo hình ảnh ở độ phân giải 1792x1024, trong khi DALL-E bị hạn chế hơn một chút ở 1024x1024. Tuy nhiên, Stelzer lưu ý rằng câu trả lời đâu là trình tạo tốt nhất là hoàn toàn chủ quan và tùy thuộc vào sở thích cá nhân.

DALL-E được biết là tạo ra nhiều hình ảnh chân thực hơn, ngay cả những hình ảnh không thể phân biệt được với ảnh chụp. Nó được cho là có hiểu biết hoặc nhận thức tốt hơn các trình tạo AI khác. Tuy nhiên, Midjourney không được thiết kế để tạo ra những hình ảnh chân thực, mà là để tạo ra những hình ảnh nghệ thuật và đẹp như mơ. Do đó, sự lựa chọn giữa hai máy phát điện cuối cùng phụ thuộc vào nhu cầu và sở thích của người dùng.

Phạm vi phong cách hạn chế của Midjourney ảnh hưởng như thế nào đến khả năng sử dụng của nó so với DALL-E và truyền phát ổn định?

Theo các nguồn tin, phạm vi phong cách hạn chế của Midjourney có thể ảnh hưởng đến khả năng sử dụng của nó so với DALL-E và Stable Diffusion. Hình ảnh của Midjourney được coi là đẹp mắt hơn về mặt thẩm mỹ, nhưng phạm vi phong cách của nó bị hạn chế hơn so với DALL-E và Khuếch tán ổn định. Phong cách của Midjourney được mô tả là đẹp như mơ và nghệ thuật, trong khi DALL-E được biết đến với việc tạo ra nhiều hình ảnh chân thực hơn không thể phân biệt được với ảnh chụp. 

Khuếch tán ổn định rơi vào đâu đó ở giữa về mức độ dễ sử dụng và chất lượng kết quả. Khuếch tán ổn định cung cấp nhiều tùy chọn hơn DALL-E, chẳng hạn như thang đo để xác định trình tạo tuân theo các từ được đề xuất tốt như thế nào, cũng như các tùy chọn liên quan đến định dạng và kích thước của kết quả. Midjourney được so sánh với bộ tổng hợp Moog tương tự, với các tạo tác dễ chịu, trong khi DALL-E được so sánh với bộ tổng hợp máy trạm kỹ thuật số với phạm vi rộng hơn. Khuếch tán ổn định được so sánh với một bộ tổng hợp mô-đun phức tạp có thể tạo ra hầu hết mọi âm thanh, nhưng khó kích hoạt hơn [1][2].

DALL-E được cho là linh hoạt hơn MidjTHER, có thể cung cấp nhiều phong cách hình ảnh hơn. DALL-E cũng tốt hơn trong việc tạo ra những bức ảnh "bình thường" chân thực trông đẹp mắt trên tạp chí hoặc trên trang web của công ty. DALL-E cũng cung cấp các công cụ mạnh mẽ mà MidjTHER không có, chẳng hạn như lớp phủ sơn, cắt xén và tải lên nhiều hình ảnh khác nhau, những công cụ cần thiết để sử dụng nghệ thuật AI sáng tạo hơn.

Mô hình của DALL-E có ít ý kiến ​​hơn, điều này khiến nó dễ tiếp thu các đề xuất về phong cách hơn, đặc biệt nếu phong cách đó kém đẹp ngay lập tức. Do đó, DALL-E có nhiều khả năng cung cấp phản ứng chính xác cho một yêu cầu cụ thể, chẳng hạn như nghệ thuật pixel. DALL-E cũng cung cấp một ứng dụng web thực sự, cho phép người dùng làm việc trực tiếp với DALL-E, điều này có thể ít gây nhầm lẫn hơn so với cài đặt Discord.

So với Midjourney, Stable Diffusion được cho là hoàn toàn miễn phí, giúp những người không đủ khả năng mua một trình tạo hình ảnh AI dễ tiếp cận hơn. Tuy nhiên, Stable Diffusion chỉ khả dụng dưới dạng bot Discord và người dùng phải đăng ký để truy cập nó. Khuếch tán ổn định cũng được coi là khó khởi chạy hơn so với Midjourney, dễ sử dụng hơn nhờ lựa chọn tỷ lệ khung hình và thư viện công cộng. Midjourney cũng cung cấp tính năng Tự lưu trữ, giúp sao lưu tất cả hình ảnh và lưới 2x2 gồm các hình thu nhỏ đã lưu, giúp bạn dễ dàng quản lý công việc. Ứng dụng Discord của Midjourney cũng hoạt động tốt hơn trên thiết bị di động so với trang web của DALL-E, giúp tạo hình ảnh dễ dàng hơn khi đang di chuyển. Phong cách độc đáo của Midjourney khiến nó trở nên lý tưởng để nhanh chóng tạo ra một số lượng lớn hình ảnh đẹp mắt mà không cần tinh chỉnh thông điệp.

Tóm lại, mỗi trình tạo ảnh AI đều có ưu và nhược điểm riêng và mỗi người có thể có sở thích và nhu cầu khác nhau. Phạm vi phong cách hạn chế của Midjourney có thể ảnh hưởng đến khả năng sử dụng của nó so với DALL-E và Khuếch tán ổn định, nhưng phong cách độc đáo của nó khiến nó trở nên lý tưởng để tạo ra hình ảnh nghệ thuật, đẹp như mơ. DALL-E linh hoạt hơn và thành thạo trong việc tạo hình ảnh chân thực, trong khi Khuếch tán ổn định hoàn toàn miễn phí và cung cấp nhiều tùy chọn hơn DALL-E. Cuối cùng, sự lựa chọn giữa các máy phát điện phụ thuộc vào nhu cầu và sở thích của người dùng.

Có sự khác biệt đáng kể nào về chất lượng của kết quả mà ba trình tạo hình ảnh AI thu được không?

Các nguồn không đề cập đến bất kỳ sự khác biệt đáng kể nào về chất lượng đầu ra giữa ba trình tạo hình ảnh AI (Midjourney, DALL-E và Stable Diffusion). Tuy nhiên, các nguồn đề cập rằng mỗi trình tạo có điểm mạnh và điểm yếu riêng và mỗi trình tạo có thể phù hợp hơn với các loại hình ảnh hoặc phong cách khác nhau. Ví dụ: Midjourney được cho là tạo ra những hình ảnh đẹp như mơ và nghệ thuật, trong khi DALL-E được biết là tạo ra những hình ảnh chân thực hơn không thể phân biệt được với ảnh chụp. Khuếch tán ổn định rơi vào khoảng giữa hai yếu tố dễ sử dụng và chất lượng kết quả. Cuối cùng, sự lựa chọn giữa các máy phát điện phụ thuộc vào nhu cầu và sở thích của người dùng.

Mẹo để chọn trình tạo tốt nhất cho một dự án hoặc ứng dụng cụ thể

Theo các nguồn tin, việc chọn trình tạo hình ảnh AI tốt nhất cho một dự án hoặc ứng dụng cụ thể tùy thuộc vào nhu cầu và sở thích của người dùng. Người dùng phải xem xét các yếu tố như loại hình ảnh anh ta muốn tạo, mức độ chi tiết và tính chân thực mà anh ta cần, tính dễ sử dụng của trình tạo, tính khả dụng của các chức năng như vẽ, cắt xén và tải lên các hình ảnh khác nhau, cũng như cũng như chi phí của máy phát điện.

Nếu người dùng muốn tạo ra những bức ảnh đẹp như mơ và nghệ thuật thì Midjourney là lựa chọn tốt nhất. Nếu người dùng muốn tạo ảnh chân thực, DALL-E là một lựa chọn tốt hơn. Khuếch tán ổn định rơi vào khoảng giữa hai yếu tố dễ sử dụng và chất lượng kết quả. Khuếch tán ổn định cung cấp nhiều tùy chọn hơn DALL-E, chẳng hạn như thang đo để xác định mức độ trình tạo tuân theo các từ hướng dẫn, cũng như các tùy chọn liên quan đến định dạng và kích thước của kết quả. Tuy nhiên, quy trình làm việc của Khuếch tán ổn định không thể so sánh với quy trình làm việc của DALL-E, vốn nhóm các hình ảnh và cung cấp các thư mục bộ sưu tập.

Người dùng cũng nên xem xét liệu trình tạo này là miễn phí hay trả phí và liệu nó có sẵn dưới dạng ứng dụng web hay bot Discord hay không. Stable Diffusion hoàn toàn miễn phí và có sẵn dưới dạng bot Discord, trong khi MidjTHER và DALL-E được trả phí và có sẵn dưới dạng ứng dụng web hoặc bot Discord.

Cuối cùng, sự lựa chọn giữa các máy phát điện phụ thuộc vào nhu cầu và sở thích của người dùng. Người sử dụng nên nghiên cứu và so sánh tính năng, chất lượng đầu ra của từng loại máy phát điện trước khi lựa chọn máy phù hợp nhất với nhu cầu của mình.

Lựa chọn thay thế giữa khóa học.

Như đã đề cập trước đó, Midjourney là một trình tạo hình ảnh AI phổ biến giúp tạo hình ảnh từ các mô tả văn bản. Tuy nhiên, nó chỉ cung cấp 25 phút thời gian kết xuất miễn phí, tức là khoảng 30 hình ảnh. Nếu bạn đang tìm kiếm một giải pháp thay thế miễn phí cho Midjourney, bạn có thể thử một số tùy chọn.

Dưới đây là một số lựa chọn thay thế miễn phí cho Midjourney:

  • bút sáp màu : Đây là một giải pháp mã nguồn mở và miễn phí cung cấp một giải pháp thay thế tốt cho Midjourney.
  • DALL-E : Đây là một trình tạo hình ảnh khác tương tự như Midjourney và được cung cấp miễn phí. Nó được thực hiện bởi OpenAI.
  • Jasper: Đây là trình tạo hình ảnh nguồn mở và miễn phí có thể được sử dụng thay thế cho Midjourney.
  • Ngạc nhiên : Đây là trình tạo hình ảnh mã nguồn mở và miễn phí có thể được sử dụng thay thế cho Midjourney.
  • Gọi AI : Đây là trình tạo hình ảnh được thiết kế đẹp mắt với giao diện trực quan có thể được sử dụng thay thế cho Midjourney.
  • Disco Diffusion: Đây là một hệ thống chuyển đổi văn bản thành hình ảnh dựa trên đám mây, dễ sử dụng và có thể được sử dụng thay thế cho Midjourney.

Nếu bạn đang tìm kiếm thứ gì đó cụ thể hơn hoặc có thể tùy chỉnh, thì Truyền phát ổn định (SD) có thể là một lựa chọn tốt. [3]. Tuy nhiên, SD cần nhiều nỗ lực hơn để có kết quả tốt và không dễ sử dụng như Midjourney. Ngoài ra, còn có một số hệ thống chuyển đổi văn bản thành hình ảnh miễn phí khác, chẳng hạn như Wombo's Dream, Hotpot's AI Art Maker, SnowPixel, CogView, StarryAI, ArtBreeder và ArtFlow.

Tóm lại, nếu bạn đang tìm kiếm một giải pháp thay thế miễn phí cho Midjourney, thì có một số tùy chọn có sẵn, chẳng hạn như Craiyon, DALL-E, Jasper, Wonder, Gọi AI, Khuếch tán vũ trường và Khuếch tán ổn định. Các hệ thống này cung cấp các mức độ tùy chỉnh và dễ sử dụng khác nhau, vì vậy bạn nên thử một vài hệ thống và xem cái nào phù hợp nhất với mình.

Bài báo này được viết với sự cộng tác của nhóm AI sâu et Org.

[Toàn bộ: 0 Bần tiện: 0]

Được viết bởi Người ăn kiêng B.

Nhà báo đam mê công nghệ mới. Dieter là biên tập viên của Bài đánh giá. Trước đây, ông là nhà văn của Forbes.

Để lại một bình luận

Địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu *

Bạn nghĩ gì?

386 Điểm
Upvote Downvote