在今天发给部分 Live 用户的电子邮件中,Google 表示其“开始推出 Gemini 更新”。一款未指明的“最新模型”据称可以让 Gemini Live 在对话过程中“更好地理解多种语言、方言或口音”。它还可以“满足您的翻译需求”。
借助 Gemini 2.0,Google 为开发者推出了Multimodal Live API,可以处理文本、音频和视频输入,同时输出文本和音频。
该电子邮件还指出,Gemini 应用程序将具有“屏幕共享和实时视频流功能”,谷歌已通过 Astra 展示了该功能。
via 匿名