Gemini 2.0 Flash是Google推出的多模态AI模型,结合文本理解和能力。根据自然语言输入生成高质量的图像,支持多轮对话式的图像编辑,保持上下文连贯性。模型擅长将文本与图像结合,例如为故事生成连贯的插图、根据对话修改图像风格,用世界知识生成更准确的图像(如食谱插图)。Gemini 2.0 Flash在长文本渲染方面表现出色,适用于广告、社交媒体或邀请函等场景。开发者目前能在 Google AI Studio 中使用 Gemini 2.0 Flash 的实验版本 ( gemini-2.0-flash-exp ) 和 Gemini API 测试这项新功能。

Gemini 2.0 Flash – Google推出的多模态 AI 模型  第1张
(图片来源网络,侵删)
Gemini 2.0 Flash – Google推出的多模态 AI 模型  第2张
(图片来源网络,侵删)