Gemini图像模型革新:角色一致性与对话式编辑能力跃升

今日,Gemini应用、AI Studio及Vertex AI平台推出了升级版图像生成与编辑模型。
此次更新的核心亮点在于显著提升了角色一致性、实现了精准的对话式图像编辑,并增强了将多张照片融合成全新创作的能力。新的模型能够跨多代生成和编辑,保持角色或对象的视觉特征不变,并能将不同概念的元素、主体和风格融合为单一图像。
此外,该模型支持对图像特定区域进行精细化编辑,并能将一种概念的风格、质感或设计应用于另一种概念。其逻辑推理能力允许生成复杂的场景或预测序列的下一步,体现了对现实世界的理解。
为优化使用体验,建议用户在构建提示词时,明确包含主体、构图、动作、地点、风格以及编辑指令。例如,在生成图像时,可描述“一个来自火星未来咖啡馆的、拥有发光蓝色光学元件的沉稳机器人咖啡师”,或在编辑时指示“将背景中的汽车移除”。
通过这些精细化的提示词构建策略,用户可以实现从照片级写实编辑到奇幻新世界的全方位创意表达,例如,能够将一个发光蘑菇精灵的形象,在不同场景和风格下保持其独特外观。
网友讨论