简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

谷歌I/O大会放大招:Gemini 2.5升级、AI会员全家桶、Veo 3重磅来袭

2025-05-21 12:01

当地时间周二,谷歌年度重磅活动“I/O开发者大会”在美国加利福尼亚州山景城拉开帷幕。大会以“Innovation in the Open”(开放中的创新)为主题,聚焦展示谷歌最新技术成果、产品更新及未来发展方向。

会上,谷歌不仅带来一系列Gemini模型升级、通用AI助手、AI搜索等功能更新,还正式发布了最强视频生成AI模型Veo3和图​像生成模型Imagen 4。此外,谷歌还推出AI全家桶会员服务 ——Google AI Ultra,该订阅服务定价为每月249.99美元。


大会发布了哪些内容?


在大会上,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai) 率先给出一组亮眼数据,直观展现了其生成式人工智能(AI)模型Gemini的爆发式进化。他说:“去年这个时候,我们通过产品和API每月处理9.7万亿个令牌。现在,我们处理的令牌数量超过480万亿,是去年同期的50倍。”

此外,Gemini的用户数量也呈现爆发式增长。“超过700万开发人员正在使用Gemini进行开发,比去年同期增长了5倍,而VertexAI上的Gemini使用率增长了40倍。Gemini应用目前月活跃用户超过4亿。皮查伊补充道。

谷歌公布了以下一系列新产品和项目计划:

Gemini 2.5更新升级

在大会上,谷歌带来Gemini 2.5系列的最新版本。据谷歌介绍,全新的2.5 Flash几乎在各个方面都更胜一筹,在推理、多模态、代码和长上下文等关键基准测试中均有提升。它在LMArena排行榜上仅次于2.5 Pro。此外,谷歌为2.5 Pro引入了名为 “深度思​考” 的增强推理模式,进一步优化了用户体验。​

目前,全新的2.5 Flash已在面向开发者的Goog​le AI Studio、面向企业的Vertex AI,以及面向大众的Gemini应用中提供预览。预计在6月初,2.5 Flash将正式发布并投入实际应用。

全新AI搜索模式

搜索引擎方面,谷歌表示,全新的AI搜索模式将重塑搜索体验。凭借更先进的推理能力,用户可以在AI模式下提出更长、更复杂的查询。事实上,早期测试人员提出的查询长度是传统搜索长度的两到三倍,并且用户还可以通过后续问题进行更深入的探索。所有这些功能都可以在搜索的新标签页中直接使用。AI搜索模式将于周二在美国面向所有用户推出。

阿斯特拉计划(Project Astra)

谷歌在大会上展示了通用AI助手Project Astra的最新功能。当用户提出修理自行车的帮助请求时,Astra会全程接管:自动查找自行车使用手册,打开对应的 PDF 文件,滚动到正确页面,并播放 YouTube 教程视频。

目前,谷歌尚未透露该功能的具体推出时间,但明确表示 Project Astra 仍在积极开发中。其最终目标是成为一款真正的通用AI助手。

水手计划(Project Mariner)

去年12月,谷歌发布了基于Gemini 2.0模型开发的AI代理项目Project Mariner。而在周二的大会上,谷歌进一步披露了该项目的最新进展:新增多任务处理功能,并引入 “教导与重复” 机制 —— 用户只需演示一次任务流程,系统即可学习生成类似任务的执行计划。

目前,​谷歌正将代理功能引入Chrome、搜索和Gemini应用。以Gemini应用为例,其全新代理模式可协助用户完成多项任务。例如,用户在寻找公寓时,该模式可在Zillow等平台筛选符合条件的房源、调整筛选参数、通过MCP访问房源信息,甚至协助安排看房。Gemini应用的代理模式实验版本即将面向订阅用户推出。

最强视频生成AI模型Veo3

谷歌宣布即将推出最新视频模型Veo3,该模型已具备原生音频生成功能。同时,谷歌还将推出功能强大的最新版图​像生成模型Imagen 4。这两款模型都将集成至Gemini应用程序中,为用户开拓全新的创意空间。

谷歌副总裁乔什·伍德沃德(Josh Woodward)表示:“我们正在进入一个融合音频和视频的创作新时代,这种创作方式非常逼真。”此外,谷歌面向电影制作人推出新工具Flow。通过该工具,创作者能够制作电影剪辑,并将短片拓展为更长的场景,助力影视创作。

个性化回复功能

谷歌介绍,在获得用户许可后,Gemini模型可在用户的Google应用中以私密、透明且完全可控的方式调用相关个人情境数据。​以全新推出的Gmail个性化智能回复功能为例,当用户收到朋友询问过往自驾游建议的邮件时,Gemini会检索用户存储在Google云端硬盘中的邮件和文件(如 Google文档里的行程记录),并基于用户的具体情况生成回复建议。该功能通过匹配用户常用问候语、捕捉语气风格及习惯用词,确保回复更贴合用户的个人表达特点。Gmail 个性化智能回复功能计划于今年晚些时候向订阅用户推出。

更加个性化、主动性和功能更强大的Gemini应用

谷歌正在推进DeepResearch的个性化升级,允许用户上传自有文件,并计划与Google Drive和Gmail实现连接,以此强化其自定义研究报告的生​成能力。此外,DeepResearch还将与Canvas集成,用户通过简单操作,即可快速创建多语言动态信息图、测验,甚至生成播客内容。同时,Canvas中Vibe编码的应用发展态势良好,使得用户仅需与Gemini对话,就能构建功能性应用程序。

针对颇受用户欢迎的Gemini Live功能,谷歌将面向所有用户(含iOS用户)免费开放相机和屏幕共享功能,并计划将其与用户常用的Google应用进行连接,为用户带来更流畅便捷的使用体验。

谷歌光束(Google Beam)

Beam采用先进的视频模型,将2D视频流转换为逼真的3D体验,利用六个摄像头阵列和人工智能将视频流合并,并在3D光场显示屏上呈现。它具备毫米级精度、60帧/秒实时头部跟踪能力,带来更自然沉浸的对话体验。首批GoogleBeam设备将于今年晚些时候面向早期客户上市。

Android XR眼镜

在主题演讲的尾声,谷歌推出了搭载AI技术的Android XR眼镜。这款眼镜将运行谷歌全新的 Android XR操作系统,配备可选的镜头内显示屏,能为用户提供短信、逐向导航、拍照以及实时翻译等功能。谷歌表示,目前正与合作公司携手,助力他们在今年晚些时候启动眼镜的制造工作。同时,谷歌也将与测试人员协作,收集关于该眼镜实用性和隐私性方面的反馈。

谷歌还与三星和高通(QCOM)合作开发三星的Project Moohan,该项目计划于今年晚些时候上市销售。

AI会员订阅计划Google AI Ultra

此外,谷歌推出全新AI订阅计划Google AI Ultra,该计划提供最高使用限额,并可访问谷歌最强大的模型及高级功能,包含Gemini、Flow、30TB存储空间等。Google AI Ultra现已在美国上市,定价为每月249.99美元(首次用户可享前三个月五折优惠),后续将很快在更多国家和地区推出。

在大会上,皮查伊表示,人工智能的机遇确实巨大无比。而这波开发者、技术构建者和问题解决者将肩负起确保其惠及尽可能多的人的重任。

他还提到,当前开展的各项研究意义深远,将为未来在机器人技术、量子技术、AlphaFold 以及Waymo等领域的发展奠定坚实基础。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。