Whisk Aiの特徴
多目的な画像AIジェネレータ
Whisk Aiは、アップロードされた画像の本質に基づいて創造的な視覚効果を生成します。
- ビジュアル要素の準備
- 画像をアップロードしたり、Whiskが分析および組み合わせるためのビジュアル要素を提供するために参照を作成します。WhiskはGeminiの視覚理解を使用して、画像からキャプションを生成し、それらを新しいアイデアを作成するための基にします。これらのキャプションを精緻にすることで、正確性を確保できます。
- クリエイティブリミックスの探求
- 選択した資産(被写体、シーン、スタイル)を組み合わせてクリエイティブリミックスを生成します。Whiskを使用すると、特定のアクションの追加やカラースキームの調整など、細部を磨くための軽微なガイダンスで実験できます。裏では、GeminiがImagen 3モデルを導くプロンプトを合成します。
- 画像の微調整
- 色の変更や要素の追加など、小さなまたは中程度の調整を行うことで、生成された画像を微調整します。Whiskは、リクエストされた変更で画像を再生成しつつ、元の方向性に近づくようにプロンプトを更新します。
- プロンプト編集コントロール
- 重要な詳細が捉えられるように、いつでも基礎となるプロンプトを確認および編集できます。この機能により、創造プロセス全体を完全にコントロールできます。ユーザーは手動でプロンプトを磨き上げ、新しいオプションを生成することができます。
Whisk Ai Magic
魔法を作り出す
シーン、被写体、またはスタイルなどの軽いガイダンスとして数枚の画像をアップロードするだけで、Whisk Aiはその本質を分析して新しい画像の提案を生成します。裏では、高度なモデルがアップロードされた画像から詳細なキャプションを生成し、それを元に入力に基づいて新しい視覚を作成します。絵をぬいぐるみに変えたり、ユニークなホリデーカードをデザインしたり、物語の始まりを視覚化したりする場合でも、Whisk Aiは創造プロセスを直感的でわくわくするものにします。Whiskの利用を始めるのは簡単です!
よくある質問
Whisk Ai とは何ですか?
Whisk はGoogleの最新の生成画像実験で、深く理解する必要なく迅速なビジュアルアイデアを重視しています。
Whisk Ai はどのように動作しますか?
Whisk Ai はGeminiを使用して画像を視覚的に理解し、テキスト説明を生成し、それを使用してImagen 3 を使用して画像を生成するための詳細なプロンプトを作成します。
Whisk Ai にはどのようなカテゴリがありますか?
Whisk Ai のカテゴリには、被写体(画像の内容)、シーン(被写体が表示される場所)、スタイル(画像を表現するのに使用される美学、素材、または手法)が含まれます。
自分の作品を共有できますか?
はい、作成物を保存して共有するには、ダウンロードアイコンをクリックできます。また、discordチャンネルを通じても共有できます。
Whisk Aiのプロンプトをユーザーが診断して制御する方法は?
ユーザーは、プロンプトボタン/アイコンをクリックし、重要な詳細を追加したり、より多くのオプションを生成するためにそれらを編集することで、プロンプトを診断および制御できます。