谷歌的新 Gemini Omni AI 不仅可以制作视频，它还可以组合照片、标志等，然后将其全部编辑在一起

谷歌人工智能的下一个重大举措正是针对创造力。该公司在 Google I/O 2026 上推出了 Gemini Omni，作为其众多 Gemini 新功能的一部分。

Omni 被认为将 Gemini 的逻辑功能与媒体创建工具结合起来，可以生成和编辑各种格式的内容。

第一个版本 Gemini Omni Flash 专注于视频，并具有异常雄心勃勃的目标。谷歌希望人们从几乎任何类型的输入中创建内容，无论是文本、图像、音频还是从现有视频开始。

最新视频来自

Gemini Omni Flash 正在通过 Gemini Apps、Google Flow、YouTube Shorts 和 YouTube Create 推出，并计划稍后向开发者和企业客户进行更广泛的扩展。

隆重推出 Gemini Omni：用任何东西创造任何东西 – YouTube
隆重推出 Gemini Omni：用任何东西创造任何东西 - YouTube

看这里

该公告建立在谷歌已经在人工智能生成视觉效果方面所做的工作的基础上。 2025 年，Nano Banana 扩展了 Gemini 的成像能力，并成为一款令人惊讶的实用工具，适用于从修复旧照片到将粗略草图转变为精美概念的各种用途。

Gemini Omni 是 Google 进一步深化这一理念的尝试。该公司将 Gemini Omni 描述为一种用可以不断完善视频的对话来取代传统编辑软件的方法。

对话式编辑

Gemini Omni 最大的想法之一是消除编辑的复杂性。谷歌表示，用户可以通过自然语言修改视频，同时保持更改之间的一致性。

人物仍然可辨认。场景中有连续性。速度保持一致，而不是每次信号变化时重置。该系统还旨在更好地理解物体在物理世界中的行为方式，包括更好地处理运动、重力和运动动力学。

因此，当有人触摸上面的镜子时，它会像液体一样泛起涟漪，或者如何用气泡制成雕塑。谷歌正试图将 Gemini Omni 定位为比视频生成器更大的产品。

这使谷歌直接陷入了围绕人工智能媒体工具的快速激烈的竞争中。但这是一场关于谁能让人工智能视频工具感觉足够直观、让普通人真正想要使用它们的竞赛，就像其他东西一样。谷歌的答案似乎是走对话路线。

毕竟，谷歌表示 Gemini 将超越 Omni Video。未来的版本预计将支持将照片、信号、音乐和参考镜头合并到一个项目中。

谷歌承认，强大的创意人工智能对信任提出了挑战。该公司热衷于强调如何结合 SynthID 水印技术来识别使用 Gemini Omni 创建的视频中的 AI 生成媒体。该公司还表示，作为更广泛的透明度工作的一部分，验证工具将适用于 Gemini、Chrome 和搜索。

用户最初将能够创建基于自己的视频头像，包括他们的声音。但在谷歌致力于安全考虑的同时，涉及语音修改的更高级功能仍在继续评估。

这种谨慎的做法反映出每家主要人工智能公司都面临着日益尴尬的平衡行为。建立更高效的系统并不意味着同时建立对它们的信任。

黑色背景上的 Google 徽标，旁边是“点击关注 Techradar”文字

在 Google 新闻上关注 TechRadar 和 将我们添加为最喜欢的来源 在您的动态中获取我们的专家新闻、评论和意见。

适合所有预算的最佳商务笔记本电脑