27 Aug 2025 2 min read 人工智能

Gemini图像模型革新：角色一致性与对话式编辑能力跃升

今日，Gemini应用、AI Studio及Vertex AI平台推出了升级版图像生成与编辑模型。

此次更新的核心亮点在于显著提升了角色一致性、实现了精准的对话式图像编辑，并增强了将多张照片融合成全新创作的能力。新的模型能够跨多代生成和编辑，保持角色或对象的视觉特征不变，并能将不同概念的元素、主体和风格融合为单一图像。

此外，该模型支持对图像特定区域进行精细化编辑，并能将一种概念的风格、质感或设计应用于另一种概念。其逻辑推理能力允许生成复杂的场景或预测序列的下一步，体现了对现实世界的理解。

为优化使用体验，建议用户在构建提示词时，明确包含主体、构图、动作、地点、风格以及编辑指令。例如，在生成图像时，可描述“一个来自火星未来咖啡馆的、拥有发光蓝色光学元件的沉稳机器人咖啡师”，或在编辑时指示“将背景中的汽车移除”。

通过这些精细化的提示词构建策略，用户可以实现从照片级写实编辑到奇幻新世界的全方位创意表达，例如，能够将一个发光蘑菇精灵的形象，在不同场景和风格下保持其独特外观。

订阅情报

中国AI芯片独立潮涌：Nvidia 在地缘政治与技术竞赛中面临严峻考验