in ,

Midjourney: AI アーティストについて知っておくべきことすべて

途中:それは何ですか? 使用、制限、および代替

Midjourney: AI アーティストについて知っておくべきことすべて
Midjourney: AI アーティストについて知っておくべきことすべて

Midjourney は、テキストの説明から画像を作成する AI 画像ジェネレーターです。 これは、Leap Motion の共同設立者である David Holz 氏が運営する研究所です。 Midjourney は、他の AI ジェネレーターと比較して、より夢のような芸術的なスタイルを要求に提供し、よりゴシックな外観を持っています。 このツールは現在オープン ベータ版であり、公式 Discord の Discord ボットからのみアクセスできます。

画像を生成するには、ユーザーが /imagine コマンドを使用してプロンプトを入力すると、ボットが XNUMX つの画像のセットを返します。 ユーザーは、スケーリングする画像を選択できます。 Midjourney は Web インターフェイスの開発にも取り組んでいます。

創設者の David Holz は、アーティストを競合他社ではなく、Midjourney の顧客と見なしています。 アーティストは、独自の作業を開始する前にクライアントに提示するコンセプト アートの迅速なプロトタイピングに Midjourney を使用します。 Midjourney のすべてのラインナップには、アーティストによる著作権で保護された作品が含まれている可能性があるため、一部のアーティストは、Midjourney がオリジナルのクリエイティブ作品の価値を下げていると非難しています。

Midjourney の利用規約には DMCA テイクダウン ポリシーが含まれており、アーティストが著作権侵害が明らかであると判断した場合、セットから作品を削除するよう要求することができます。 広告業界は、Midjourney、DALL-E、Stable Diffusion などの AI ツールも採用しており、広告主はオリジナルのコンテンツを作成し、アイデアをすばやく思いつくことができます。

Midjourney は、The Economist や Corriere della Sera など、さまざまな人や企業がイメージやアートワークを作成するために使用しています。 しかし、Midjourney は、アーティストの仕事を奪い、著作権を侵害していると感じている一部のアーティストから批判を受けています。 Midjourney は、アーティストのチームが著作権侵害で提起した訴訟の対象にもなりました。

Midjourney の使用を開始するには、ユーザーは Discord にログインし、Midjourney の Web サイトにアクセスしてベータ版に参加する必要があります。 承認されると、ユーザーは Discord Midjourney への招待を受け取り、/imagine と入力してから目的のプロンプトを入力することで、画像の生成を開始できます。

Midjourney は彼のバックグラウンドとトレーニングについて多くの情報を明らかにしていませんが、Dall-E 2 や Stable Diffusion と同様のシステムを使用し、インターネットから写真やテキストをスクレイピングしてそれらを説明し、何百万もの公開された画像をトレーニングに使用していると推測されます。 .

コンテンツ

Midjourney がテキスト プロンプトから画像を生成するために使用するプロセス

Midjourney は、テキストから画像への AI モデルを使用して、テキスト プロンプトから画像を生成します。 Midjourney ボットは、プロンプト内の単語やフレーズをトークンと呼ばれる小さな断片に分解します。これをトレーニング データと比較し、画像の生成に使用できます。 適切に設計されたプロンプトは、ユニークでエキサイティングなイメージを作成するのに役立ちます 【0].

Midjourney で画像を生成するには、ユーザーは、Midjourney Discord チャンネルの「/imagine」コマンドを使用して、画像の外観の説明を入力する必要があります。 メッセージが具体的で説明的であればあるほど、AI はより良い結果を生み出すことができます。 Midjourney は、プロンプトに基づいて XNUMX 分以内に複数の異なるバージョンのイメージを作成します。 ユーザーは、これらの画像の代替バージョンを取得するか、いずれかを拡大して、より大きく高品質の画像を取得することを選択できます。 Midjourney には、高速モードとリラックス モードが用意されています。最大倍率を達成し、短時間でより多くの画像を作成するには、高速モードが必要です。

Midjourney の AI モデルは拡散を使用します。これには、画像にノイズを追加し、プロセスを逆にしてデータを取得することが含まれます。 このプロセスは際限なく繰り返され、モデルはノイズを追加してから再び除去し、最終的に画像に小さな変化を加えることでリアルな画像を作成します。 Midjourney は、何百万もの公開されたワークアウト画像を使用して、それらを説明する画像とテキストをインターネットで探しました。

Midjourney の AI モデルは安定したストリーミングに基づいており、2,3 億の画像とテキストの説明のペアでトレーニングされています。 プロンプトで適切な単語を使用することにより、ユーザーは頭に浮かぶほとんどすべてを作成できます。 ただし、一部の単語は禁止されており、悪意のあるユーザーがプロンプトを作成できないように、Midjourney はこれらの単語のリストを保持しています。 Midjourney の Discord コミュニティは、ライブ ヘルプとユーザー向けの多くの例を提供するために利用できます。

画像の使用と生成

Midjourney AI を無料で使用するには、Discord アカウントが必要です。 お持ちでない場合は、Discord に無料でサインアップしてください。 次に、Midjourney の Web サイトにアクセスし、[ベータ版に参加] を選択します。 これにより、Discord の招待に移動します。 Midjourney への Discord の招待を受け入れ、Discord を続行することを選択します。 

Discord アプリが自動的に開き、左側のメニューから船の形をした Midjourney アイコンを選択できます。 Midjourney チャンネルで、新しい部屋を見つけて、そのうちの XNUMX つを選択して開始します。 準備ができたら、初心者ルームの Discord チャットで「/imagine」と入力します。 

これにより、画像の説明を入力できるプロンプト フィールドが作成されます。 説明が具体的であるほど、AI はより良い結果を生み出すことができます。 説明的であり、特定のスタイルを探している場合は、それを説明に含めてください。 Midjourney では、各ユーザーに 25 回 AI を試してもらいます。 

その後、継続するには正会員として登録する必要があります。 お金をかけたくない場合は、Midjourney で作成したいものについて時間をかけて考えてみることをお勧めします。 

必要に応じて、「/help」と入力すると、ヒントのリストが表示されます。 Midjourney AI を使用する前に、禁止されている単語のリストを知っておくことが不可欠です。行動規範を順守しないと禁止されるためです。

>> また読む- 27 の最高の無料人工知能 Web サイト (デザイン、コピーライティング、チャットなど)

/コマンドを想像してください

/imagine コマンドは、Midjourney の主要なコマンドの XNUMX つで、ユーザーが要求に基づいて AI によって生成された画像を生成できるようにします。 仕組みは次のとおりです。

  1. ユーザーは Discord チャットで /imagine コマンドを入力し、使用したい設定を追加します。
  2. Midjourney AI アルゴリズムはプロンプトを分析し、入力に基づいて画像を生成します。
  3. 生成された画像は Discord チャットに表示され、ユーザーはリミックス機能を使用してフィードバックを提供し、メッセージを改善できます。
  4. ユーザーは、追加の設定を使用して、生成された画像のスタイル、バージョン、およびその他の側面を調整することもできます。

/imagine コマンドは、イメージ プロンプトとテキスト プロンプトの両方を受け入れます。 ユーザーは、生成したい画像の URL または添付ファイルを提供することで、プロンプトを画像として追加できます。 テキスト プロンプトには、オブジェクト、背景、スタイルなど、ユーザーが生成したい画像の説明を含めることができます。 ユーザーは、コマンドにパラメーターを追加して、使用するアルゴリズムのバージョンを調整したり、Remix 機能を有効にしたりすることもできます。

Midjourney AI が作成できる画像の種類の例

Midjourney AI は、次のようなさまざまなスタイルの幅広い画像を作成できます。

  • 「ピグレットの冒険」の作例など、児童書の挿絵。
  • 人物、動物、オブジェクトのリアルなポートレート。
  • さまざまな要素とスタイルが混在する超現実的で抽象的な芸術作品。
  • さまざまな気分や感情を呼び起こす風景や街並み。
  • 複雑なディテールと映画のような効果を備えた白黒写真。
  • 半分ロボット部品でできていて、ガスマスクを着用している老婆の例など、未来的または SF のテーマを示す画像。

Midjourney AI によって生成される画像の品質とスタイルは、プロンプトの品質、使用されるアルゴリズムのバージョン、およびその他の要因によって異なる場合があることに注意することが重要です。 ユーザーは、希望する結果を得るために、さまざまなプロンプトと設定を試す必要があります。

Midjourney で画像を結合する

Midjourney で XNUMX つ以上の画像を組み合わせるには、次の手順に従います。

  1. 結合したい画像を選択して Discord にアップロードします。
  2. 画像へのリンクをコピーし、/imagine プロンプトに画像プロンプトとして追加します。
  3. バージョン 4 がデフォルトで有効になっていない場合は、プロンプトに「-v 4」を追加します。
  4. コマンドを送信して、イメージが生成されるのを待ちます。

たとえば、1 つの画像を結合するには、次のコマンドを使用できます。 –v 2

オブジェクト、背景、一般的なアート スタイルなどの追加情報を追加して、独自のスタイルを持つまったく新しいイメージを作成することもできます。 例: /想像する、漫画のスタイル、背景に陽気な群衆、胸にテスラのロゴ、-非衣装-v 1

Midjourney は、URL をコピーして貼り付けることなく、最大 XNUMX つの画像を結合できる /blend コマンドという新機能もリリースしました。 プロンプトに –blend フラグを含めることで、/blend コマンドを有効にすることができます。

この関数は Midjourney アルゴリズムのバージョン 4 でのみ機能することに注意してください。画像を結合するために追加のテキストは必要ありませんが、通常、情報を追加するとより良い画像が得られます。 通常、アート スタイルを試したり、リミックス モードで画像を微調整したりすることで、最良の結果が得られます。

XNUMX つ以上の画像を組み合わせる

Midjourney では、ユーザーは /blend コマンドを使用して最大 1 つの画像をブレンドできます。 ただし、ユーザーが 2 つ以上の画像を組み合わせる必要がある場合は、/imagine コマンドを使用して、公開画像の URL を行に貼り付けることができます。 /imagine コマンドを使用して 3 つ以上のイメージを結合するには、コマンドにプロンプ​​トを追加します。 たとえば、4 つの画像を結合するには、コマンドは /imagine になります。 –v XNUMX.

ユーザーはコマンド プロンプトを追加して、より多くの画像を組み合わせることができます。 オブジェクト、背景、一般的なアート スタイルなどの追加情報をプロンプトに追加すると、独自のスタイルを持つまったく新しいイメージを作成できることに注意してください。 アート スタイルを試したり、リミックス モードで画像を微調整したりすることで、最良の結果が得られます。

コマンド /blend in Midjourney

Midjourney の /blend コマンドを使用すると、使いやすい UI 要素を Discord インターフェイスに直接追加することで、ユーザーは最大 XNUMX つの画像をブレンドできます。 ユーザーは画像をインターフェイスにドラッグ アンド ドロップするか、ハード ドライブから直接選択することができます。 ユーザーは、生成された画像のサイズを選択することもできます。 ユーザーがカスタム サフィックスを使用する場合は、通常の /imagine コマンドと同様に、必要に応じてコマンドの末尾に追加できます。

Midjourney チームは、/blend コマンドを設計して、ユーザーの画像の「概念」と「気分」を効果的に調べ、それらをブレンドしようと試みました。 これにより、驚くほど魅力的な画像が表示されることもあれば、恐ろしい画像が表示されることもあります。 ただし、/blend コマンドはテキスト プロンプトをサポートしていません。

/blend コマンドには制限があります。 最も明白なのは、ユーザーが XNUMX つの異なる画像参照しか追加できないことです。 /imagine コマンドは技術的には XNUMX つ以上の画像を受け入れますが、ユーザーが参照を追加すればするほど、各画像の重要性は低下します。 これは問題の希薄化に関する一般的な問題であり、/blend 固有の問題ではありません。 その他の主な制限は、Midjourney ブレンド コマンドがテキスト プロンプトで機能しないことです。 これは、めったに XNUMX つの画像を混在させない上級ユーザーにとっては残念なことです。 ただし、マッシュアップを作成しようとしているユーザーにとって、この制限はあまり問題になりません。

ビルド時間の改善

Midjourney AI によるイメージ作成の生成時間を改善または最適化する方法があります。 以下に役立つヒントをいくつか示します。

  • 具体的で詳細なプロンプトを使用する: Midjourney は、ユーザーのプロンプトに基づいて画像を生成します。 プロンプトが具体的で詳細であるほど、結果は向上します。 AIアルゴリズムはユーザーが何を望んでいるのかをより正確に把握しているため、画像の生成にかかる時間も短縮されます。
  • さまざまな品質設定を試す: -quality パラメータは、画像の品質と生成にかかる時間を調整します。 品質を低く設定すると画像が速く生成されますが、品質を高く設定すると時間がかかりますが、より良い結果が得られます。 さまざまな設定を試して、品質と速度の適切なバランスを見つけることが重要です。
  • リラックス モードを使用する: Standard および Pro プランのサブスクライバーは、ユーザーの GPU 時間にコストをかけずに、デバイスの使用頻度に基づいてジョブをキューに入れるリラックス モードを使用できます。 リラックス モードの待機時間は動的ですが、通常、タスクごとに 0 ~ 10 分です。 リラックス モードを使用すると、特に毎月大量の画像を生成するユーザーにとって、ビルド時間を最適化するのに適した方法になります。
  • 高速時間: 高速モードは最も優先度の高い処理レベルであり、ユーザーのサブスクリプションから毎月の GPU 時間を使用します。 ユーザーは、Midjourney.com/accounts ページで Quick Hours を追加購入できます。これにより、画像を迅速かつ効率的に生成することができます。
  • Fast Relax を使用する: Fast Relax は Midjourney の新機能で、ユーザーは品質を犠牲にして画像をより速く生成できます。 Fast Relax モードでは、約 60% の品質の画像が生成されます。これは、画像をすばやく生成したいが、あまり品質を犠牲にしたくないユーザーにとっては良い妥協点となる可能性があります。

要約すると、Midjourney AI イメージを作成するためのビルド時間を改善または最適化する方法はいくつかあります。たとえば、特定のプロンプトを使用する、さまざまな品質設定を試す、リラックス モードを使用する、より速い時間を購入する、ファスト リラックス モードを使用するなどです。

Midjourney の AI モデルによって生成された画像はどの程度正確ですか?

Midjourney の AI モデルによって生成される画像の精度は、プロンプトとトレーニング データの品質によって異なる場合があります。 ユーザーは、クエリを具体的かつ詳細にすることで、生成された画像の精度を向上させることができます。 プロンプトがより具体的で説明的であるほど、AI はより良い結果を生み出すことができます。 Midjourney の AI モデルは、インターネットから取得した何百万もの画像とテキストの説明でトレーニングされました。これは、生成された画像の精度にも影響を与える可能性があります。

Midjourney の AI モデルは拡散を使用します。これには、画像にノイズを追加し、プロセスを逆にしてデータを取得することが含まれます。 このプロセスは際限なく繰り返され、モデルはノイズを追加してから再び除去し、最終的に画像に小さな変化を加えることでリアルな画像を作成します。

Midjourney の AI モデルは安定したストリーミングに基づいており、2,3 億の画像とテキストの説明のペアでトレーニングされています。 プロンプトで適切な単語を使用することにより、ユーザーは頭に浮かぶほとんどすべてを作成できます。 ただし、一部の単語は禁止されており、悪意のあるユーザーがプロンプトを作成できないように、Midjourney はこれらの単語のリストを保持しています。 Midjourney の Discord コミュニティは、ライブ ヘルプとユーザー向けの多くの例を提供するために利用できます。

Midjourney の AI 生成画像は、著作権侵害と芸術的独創性に関する論争の対象となっていることに注意してください。 一部のアーティストは、Midjourney がオリジナルのクリエイティブ作品の価値を下げていると非難していますが、別のアーティストは、クライアントが作業を開始する前に、コンセプト アートをラピッド プロトタイピングするためのツールと見なしています。

Midjourney は、著作権侵害や AI 生成画像の独創性に関する懸念にどのように対処していますか?

Midjourney: AI が生成した画像の著作権侵害と独自性

Midjourney は、著作権侵害と AI 生成画像の独創性に関する懸念に対処するための措置を講じています。 Midjourney はすべてのプロンプトとすべての画像を慎重にチェックして、著作権の問題がないことを確認し、ライセンスまたはパブリック ドメインのコンテンツのみを使用し、追加の調査を行うか、不明な場合は正当な所有者の許可を求めます。

また、Midjourney は、著作権法を尊重し、使用する権利がある画像とプロンプトのみを使用するようユーザーに促すことで、ユーザーの責任を奨励しています。 ユーザーがメッセージまたは画像のソースについて質問した場合、プラットフォームは、1998 年のデジタル ミレニアム著作権法 (DMCA) に従って、侵害しているコンテンツを調査して削除するための迅速な措置を講じます。

DMCA は、著作権所有者から通知を受けた場合に侵害コンテンツを削除するために誠実に行動する Midjourney などのオンライン サービス プロバイダーに対する保護条項を提供します。 Midjourney には DMCA テイクダウン ポリシーもあり、著作権侵害が明白であると考える場合、アーティストは自分の作品をセットから削除するよう要求できます。 【2][4].

侵害を回避するための Midjourney のアプローチは、Feist Publications, Inc. v. Rural Telephone Service Co., Inc. (1991) では、裁判所は、新規性ではなく独創性が著作権保護の必須要件であると判断し、Oracle America, Inc. v. Google LLC (2018) では、別の目的であっても、元の作品をコピーすることは依然として著作権侵害とみなされる可能性があると裁判所が判断しました。

Midjourney の AI 生成画像は、著作権侵害と芸術的独創性をめぐる論争の対象となっています。 一部のアーティストは、Midjourney がオリジナルのクリエイティブ作品の価値を下げていると非難していますが、別のアーティストは、クライアントが自分で作業を開始する前に、コンセプト アートをラピッド プロトタイピングするためのツールと見なしています。 Midjourney の利用規約には DMCA テイクダウン ポリシーが含まれており、著作権侵害があると思われる場合、アーティストは自分の作品をセットから削除するよう要求できます。

Midjourney は、AI によって生成された画像を作成するために使用されるすべてのライセンスまたはパブリック ドメインのコンテンツが適切に帰属されることをどのように保証しますか?

Midjourney が、AI によって生成された画像の作成に使用されたすべてのライセンスまたはパブリック ドメインのコンテンツが適切に帰属されることをどのように保証するかは不明です。 ただし、Midjourney は各投稿と画像を慎重にチェックして、著作権の問題がないことを確認し、ライセンスまたはパブリック ドメインのコンテンツのみを使用し、追加の調査を行うか、不明な場合は正当な所有者の許可を求めます。 

また、Midjourney は、著作権法を尊重し、使用する権利がある画像とプロンプトのみを使用するようユーザーに促すことで、ユーザーの責任を奨励しています。 ユーザーがメッセージまたは画像のソースについて質問した場合、プラットフォームは、1998 年のデジタル ミレニアム著作権法 (DMCA) に従って、侵害しているコンテンツを調査して削除するための迅速な措置を講じます。 

Midjourney には DMCA テイクダウン ポリシーもあり、アーティストは、明らかな著作権侵害があると思われる場合、作品をシリーズから削除するよう要求することができます。

Midjourney の AI 生成画像は、著作権侵害と芸術的独創性に関する論争の対象となっていることに注意してください。 一部のアーティストは、Midjourney がオリジナルのクリエイティブ作品の価値を下げていると非難していますが、別のアーティストは、クライアントが作業を開始する前に、コンセプト アートをラピッド プロトタイピングするためのツールと見なしています。

ユーザーがミッドジャーニーで尊重しなければならないルール

Midjourney は、すべての人にとって歓迎的で包括的なコミュニティを確保するために、ユーザーが従わなければならない一連の規則を確立しました。 これらのルールは次のとおりです。 【0]【1]【2] :

  • 親切で、他の人やスタッフを尊重します。 本質的に無礼、攻撃的、またはその他の虐待的なイメージを作成したり、テキスト プロンプトを使用したりしないでください。 いかなる種類の暴力や嫌がらせも容認されません。
  • アダルト コンテンツや流血シーンはありません。 視覚的に攻撃的または不快なコンテンツは避けてください。 一部のテキスト エントリは自動的にブロックされます。
  • 他人の作品を許可なく公に複製しないでください。
  • 共有に注意してください。 Midjourney コミュニティの外で作品を共有することはできますが、他の人があなたのコンテンツをどのように見るかを考慮してください。
  • これらの規則に違反すると、サービスから除外される場合があります。
  • これらのルールは、プライベート サーバー、プライベート モード、および Midjourney Bot を使用したダイレクト メッセージで作成された画像を含むすべてのコンテンツに適用されます。

Midjourney には、メッセージで許可されていない禁止単語のリストもあります。 禁止された単語のリストには、直接的または間接的に暴力、嫌がらせ、流血、アダルト コンテンツ、ドラッグ、ヘイト スピーチに関連する単語が含まれています。 さらに、攻撃性や暴力を含む、またはそれに関連するプロンプトは許可されません。

単語が禁止単語リストに含まれている場合、または禁止単語と密接または関連している場合、Midjourney はプロンプトを許可しません。 旅の途中のユーザーは、禁止されている単語を類似しているが許可されている単語に置き換え、禁止されている単語に密接または関連する単語を使用しないようにするか、同義語または他の表現の使用を検討する必要があります。

旅の途中での禁句

Midjourney は、禁止単語リストの正確な単語または類似単語を自動的にフィルタリングして禁止するフィルターを実装しました。 禁止された単語のリストには、暴力、嫌がらせ、流血、アダルト コンテンツ、ドラッグ、または憎悪の扇動に直接的または間接的に関連する単語が含まれています。 さらに、攻撃や虐待を含む、またはそれに関連するプロンプトは許可されません。

禁止用語のリストは必ずしも網羅的なものではなく、まだリストにない用語が他にも多数ある可能性があります。 Midjourney では、禁止ワードのリストを常に更新しています。 このリストは常に審査中であり、公開されていません。 ただし、ユーザーが必要に応じてアクセスして投稿できるコミュニティ運営のリストがあります。 [0] [1].

単語が禁止単語リストに含まれている場合、または禁止単語と密接または関連している場合、Midjourney はプロンプトを許可しません。 旅の途中のユーザーは、禁止されている単語を類似しているが許可されている単語に置き換えたり、禁止された単語と関連性が低い単語を使用したりしないようにするか、同義語または別の表現を使用することを検討する必要があります。 旅の途中のユーザーは、メッセージを送信する前に常に #rules チャンネルを確認する必要があります。チームは禁止単語のリストを常に更新しています。 【2].

Midjourney には、ユーザーが従わなければならない行動規範があります。 行動規範は、PG-13 の内容に従うだけでなく、親切で、他の人やスタッフを尊重することについても規定しています。 ルールに違反すると、サービスが停止または追放される場合があります。 Midjourney はオープンな Discord コミュニティであり、行動規範に従うことが不可欠です。 ユーザーが「/private」モードでサービスを使用する場合でも、行動規範を尊重する必要があります。

結論として、Midjourney は厳格なコンテンツ モデレーション ポリシーを運用しており、あらゆる形態の暴力や嫌がらせ、成人向けまたはゴア コンテンツ、視覚的に攻撃的または不快なコンテンツを禁止しています。 Midjourney は、暴力、嫌がらせ、流血、アダルト コンテンツ、ドラッグ、または憎悪の扇動に直接的または間接的に関連する単語を含む、禁止単語リストの正確または類似の単語を自動的にフィルタリングして禁止するフィルターを実装しました。 チームは禁止単語のリストを常に更新しているため、旅行途中のユーザーは行動規範を順守し、メッセージを送信する前に #rules チャンネルを確認する必要があります。

禁止用語リストを更新しました

Midjourney は禁止単語のリストを定期的に調整しており、リストは常に見直し中です。 禁止単語リストは公開されていませんが、ユーザーがアクセスして投稿できるコミュニティ運営のリストがあります。 Midjourney は、サービス全体で PG-13 エクスペリエンスを提供するよう努めています。そのため、暴力、流血、嫌がらせ、ドラッグ、アダルト コンテンツ、および一般的に不快なトピックに関連する言葉やコンテンツは禁止されています。 禁止単語のリストは、上記のトピックの範囲をカバーするいくつかのカテゴリに分かれています。 Midjourney で禁止されている単語のリストは必ずしも網羅的なものではなく、まだリストに載っていない用語が他にもたくさんある可能性があることに注意することが重要です。

途中乗車の禁止・停止

Midjourney には、ユーザーが従わなければならない厳格な行動規範があります。 ルールに違反すると、サービスが停止または追放される場合があります。 ただし、ユーザーが Midjourney からの禁止または一時停止に異議を申し立てることができるかどうかは不明です。 ソースは、控訴プロセスや、禁止または停止についてミッドジャーニーチームに連絡する方法について明確に言及していません. サービスの禁止または停止を避けるために、行動規範を尊重することが不可欠です。 ユーザーがサービスに関して懸念や質問がある場合は、Discord サーバー経由で Midjourney チームに連絡できます。 【1][2].

Midjourney は特定のサイズまたは解像度で画像を生成できますか?

Midjourney には、ユーザーが生成できる特定のデフォルトの画像サイズと解像度があります。 Midjourney のデフォルトの画像サイズは 512x512 ピクセルですが、Discord の /imagine コマンドを使用して 1024x1024 ピクセルまたは 1664x1664 ピクセルに増やすことができます。 「Beta Upscale Redo」と呼ばれるベータ版オプションもあり、画像のサイズを 2028x2028 ピクセルまで拡大できますが、一部の詳細がぼやける可能性があります。

ユーザーは、画像の少なくとも基本的なスケーリングを行った後にのみ、最大解像度にスケーリングできます 【1]. Midjourney が生成できる最大ファイル サイズは 3 メガピクセルです。つまり、ユーザーは任意の縦横比の画像を作成できますが、最終的な画像サイズは 3 ピクセルを超えることはできません。 Midjourney の解像度は、基本的な写真プリントには十分ですが、ユーザーがより大きなものをプリントしたい場合は、良い結果を得るために外部 AI コンバーターを使用する必要があるかもしれません.

Midjourney は、DALL-E や Stable Diffusion などの他の AI 画像ジェネレーターと比べてどうですか?

情報筋によると、Midjourney は、テキスト プロンプトから芸術的で夢のような画像を生成する AI 画像ジェネレーターです。 DALL-E や Stable Diffusion などの他のジェネレーターと比較されます。 Midjourney は、他の XNUMX つよりもスタイルの範囲が限られていると伝えられていますが、そのイメージはまだ暗く、より芸術的です。 フォトリアリズムに関して言えば、Midjourney は DALL-E と Stable Diffusion に匹敵しないようです 【1][2].

Stable Diffusion は、Midjourney や DALL-E と比較され、使いやすさと出力品質の点で中間にあると言われています。 Stable Diffusion は、ジェネレーターがガイドワードをどれだけうまく追跡するかを決定するスケールや、出力形式とサイズに関するオプションなど、DALL-E よりも多くのオプションを提供します。 ただし、Stable Diffusion のワークフローは、画像をグループ化し、コレクション フォルダを提供する DALL-E のワークフローとは一致しません。 Stable Diffusion と DALL-E は、フォトリアリズムに関しては同じ欠点があると言われ、どちらも Midjourney の Discord Web アプリに近づくことができません。 【0].

Fabian Stelzer による比較テストによると、Midjourney は常に DALL-E および Stable Diffusion よりも暗いです。 DALL-E と Stable Diffusion はよりリアルな画像を生成しますが、Midjourney の製品は芸術的で夢のような品質を備えています。 Midjourney は Moog アナログ シンセサイザーと比較され、アーティファクトが心地よく、DALL-E はより広いレンジを持つデジタル ワークステーション シンセと比較されます。

Stable Diffusion は、ほぼすべてのサウンドを生成できる複雑なモジュラー シンセサイザーと比較されますが、トリガーするのは困難です。 画像の解像度に関しては、Midjourney は 1792x1024 の解像度で画像を生成できますが、DALL-E は 1024x1024 でわずかに制限されています。 ただし、Stelzer は、どのジェネレーターが最適かという答えは完全に主観的なものであり、最終的には個人の好みによるものであると述べています。

DALL-E は、写真と見分けがつかない画像であっても、よりフォトリアリスティックな画像を生成することが知られています。 他のAIジェネレーターよりも理解力や意識が高いと言われています。 ただし、Midjourney はフォトリアリスティックなイメージを作成するのではなく、夢のような芸術的なイメージを作成するように設計されています。 したがって、XNUMX つのジェネレーターのどちらを選択するかは、最終的にはユーザーのニーズと好みに依存します。

Midjourney の限られた範囲のスタイルは、DALL-E や安定したストリーミングと比較して、使いやすさにどのように影響しますか?

情報筋によると、Midjourney の限られたスタイルの範囲は、DALL-E や Stable Diffusion と比較して使いやすさに影響を与える可能性があります。 Midjourney の画像は美的に優れていると考えられていますが、そのスタイルの範囲は DALL-E や Stable Diffusion よりも限られています。 Midjourney のスタイルは夢のようで芸術的であると説明されていますが、DALL-E は写真と見分けがつかない、よりフォトリアリスティックなイメージを作成することで知られています。 

Stable Diffusion は、使いやすさと結果の質の点で中間に位置します。 Stable Diffusion は、DALL-E よりも多くのオプションを提供します。たとえば、ジェネレーターが提案された単語にどれだけ従うかを決定するスケールや、結果の形式とサイズに関するオプションがあります。 Midjourney はアナログ Moog シンセサイザーと比較され、アーティファクトが心地よく、DALL-E はデジタル ワークステーション シンセサイザーと比較され、範囲が広がります。 Stable Diffusion は、ほぼすべてのサウンドを生成できる複雑なモジュラー シンセサイザーと比較されますが、トリガーするのは困難です。 【1][2].

DALL-E は、Midjourney よりも柔軟性が高く、さまざまな視覚スタイルを提供できると言われています。 DALL-E は、雑誌や企業の Web サイトで見栄えのする、リアルな「通常の」写真の作成にも優れています。 DALL-E は、ペイント オーバーレイ、トリミング、さまざまな画像のアップロードなど、Midjourney にはない強力なツールも提供します。これらは、AI アートをより独創的に使用するために不可欠です。

DALL-E のモデルは意見が少ないため、特にそのスタイルがすぐには美しくない場合は、スタイルの提案をより受け入れやすくなります。 したがって、DALL-E は、ピクセル アートなどの特定の要求に対して正確な反応を提供する可能性が高くなります。 DALL-E は実際の Web アプリケーションも提供するため、ユーザーは DALL-E を直接操作できるため、Discord をインストールするよりも混乱が少なくなります。

Midjourney と比較して、Stable Diffusion は完全に無料であると想定されているため、AI 画像ジェネレーターを購入する余裕がない人でも利用しやすくなっています。 ただし、Stable Diffusion は Discord ボットとしてのみ利用可能であり、ユーザーはアクセスを申請する必要があります。 また、Stable Diffusion は、アスペクト比とパブリック ギャラリーの選択により使いやすい Midjourney よりも起動が難しいと考えられています。 Midjourney には、すべての画像をバックアップする AutoArchive と、保存されたサムネイルの 2x2 グリッドもあり、作業を簡単に管理できます。 Midjourney の Discord アプリは、DALL-E の Web サイトよりもモバイルでうまく機能し、外出先で簡単に画像を生成できます。 Midjourney のユニークなスタイルは、メッセージを洗練する必要なく、多数の魅力的な画像をすばやく生成するのに理想的です。

結論として、各 AI 画像ジェネレーターにはそれぞれ長所と短所があり、好みやニーズは人それぞれ異なります。 Midjourney の限られた範囲のスタイルは、DALL-E や Stable Diffusion と比較して使いやすさに影響を与える可能性がありますが、そのユニークなスタイルにより、夢のような芸術的なイメージを生成するのに理想的です。 DALL-E はより柔軟で、写真のようにリアルな画像を作成するのに適していますが、Stable Diffusion は完全に無料で、DALL-E よりも多くのオプションを提供します。 最終的に、どのジェネレーターを選択するかは、ユーザーのニーズと好みによって異なります。

XNUMX つの AI 画像ジェネレーターによって得られた結果の品質に大きな違いはありますか?

ソースは、XNUMX つの AI イメージ ジェネレーター (Midjourney、DALL-E、および Stable Diffusion) 間の出力品質の大きな違いについては言及していません。 ただし、情報源は、各ジェネレーターには独自の長所と短所があり、それぞれがさまざまな種類の画像やスタイルに適している可能性があると述べています. たとえば、Midjourney は夢のような芸術的な画像を生成すると言われていますが、DALL-E は写真と見分けがつかない、よりフォトリアリスティックな画像を生成することが知られています。 Stable Diffusion は、使いやすさと結果の質の点で XNUMX つの中間に位置します。 最終的に、どのジェネレーターを選択するかは、ユーザーのニーズと好みによって異なります。

特定のプロジェクトまたはアプリケーションに最適なジェネレーターを選択するためのヒント

情報源によると、特定のプロジェクトまたはアプリケーションに最適な AI イメージ ジェネレーターの選択は、ユーザーのニーズと好みによって異なります。 ユーザーは、作成したい画像のタイプ、必要な詳細レベルとリアリズム、ジェネレーターの使いやすさ、ペイントなどの機能の可用性、さまざまな画像のトリミングとアップロードなどの要素を考慮する必要があります。 、および発電機のコスト。

ユーザーが夢のような芸術的なイメージを作成したい場合は、Midjourney が最適なオプションです。 ユーザーが写真のようにリアルな画像を作成したい場合は、DALL-E の方が適しています。 Stable Diffusion は、使いやすさと結果の質の点で XNUMX つの中間に位置します。 Stable Diffusion は、ジェネレーターがガイドワードにどれだけ従うかを決定するスケールや、結果の形式とサイズに関するオプションなど、DALL-E よりも多くのオプションを提供します。 ただし、Stable Diffusion のワークフローは、画像をグループ化し、コレクション フォルダーを提供する DALL-E のワークフローに匹敵するものではありません。

ユーザーは、ジェネレーターが無料か有料か、Web アプリまたは Discord ボットとして利用できるかどうかも考慮する必要があります。 Stable Diffusion は完全に無料で Discord ボットとして利用できますが、Midjourney と DALL-E は有料で Web アプリまたは Discord ボットとして利用できます。

最終的に、どのジェネレーターを選択するかは、ユーザーのニーズと好みによって異なります。 ユーザーは、ニーズに最も適したジェネレーターを選択する前に、各ジェネレーターの機能と出力品質を調べて比較する必要があります。

中間コースの選択肢。

前述のように、Midjourney は、テキストの説明から画像を作成する人気のある AI 画像ジェネレーターです。 ただし、無料のレンダリング時間は 25 分 (約 30 枚の画像) しかありません。 Midjourney の無料の代替手段を探している場合は、いくつかのオプションを試すことができます。

Midjourney の無料の代替手段を次に示します。

  • クレイヨン : これは、Midjourney の優れた代替手段を提供する無料のオープン ソース ソリューションです。
  • DALL-E : これは Midjourney に似た別の画像ジェネレーターで、無料で利用できます。 OpenAIで作っています。
  • Jasper: これは、Midjourney の代替として使用できる無料のオープン ソースの画像ジェネレーターです。
  • ワンダー : これは、Midjourney の代替として使用できる無料のオープン ソースの画像ジェネレーターです。
  • AIを呼び出す : これは、Midjourney の代替として使用できる、直感的なインターフェイスを備えた美しくデザインされた画像ジェネレーターです。
  • Disco Diffusion: これはクラウドベースのテキストから画像への変換システムで、使いやすく、Midjourney の代替として使用できます。

より具体的またはカスタマイズ可能なものを探している場合は、安定したストリーミング (SD) が適切なオプションになる可能性があります。 【3]. ただし、SD は良い結果を得るにはより多くの労力が必要であり、Midjourney ほど使いやすいものではありません。 さらに、Wombo の Dream、Hotpot の AI Art Maker、SnowPixel、CogView、StarryAI、ArtBreeder、ArtFlow など、テキストから画像への無料の変換システムが他にもいくつかあります。

結論として、Midjourney の無料の代替手段を探している場合は、Craiyon、DALL-E、Jasper、Wonder、Invoke AI、Disco Diffusion、Stable Diffusion など、いくつかのオプションを利用できます。 これらのシステムはさまざまな程度のカスタマイズと使いやすさを提供するため、いくつか試してみて、どれが最適かを確認してください。

この記事はチームと協力して書かれました ディープAI et 組織.

[合計: 0 平均: 0]

著者 ディーターB。

新しいテクノロジーに情熱を注ぐジャーナリスト。 ディーターはレビューの編集者です。 以前は、フォーブスのライターでした。

コメントを残します

あなたのメールアドレスは公開されません。 必須フィールドは、マークされています *

おわりに

386 Points
Upvote 下降