双子星机器人端侧:DeepMind 释放本地AI,赋能更智能机器人 Posted on 2025年6月24日 by LEO Google DeepMind 已推出 Gemini Robotics On-Device,这是在将复杂人工智能直接引入本地机器人设备方面的一项重大进展。这个高效的视觉-语言-动作 (VLA)...
Google Gemini 2.5: Pro 和 Flash 正式推出, Flash-Lite 首次亮相, 定价变化 Posted on 2025年6月18日 by LEO 今天,Google 的 Gemini 2.5 模型系列迎来了一次重大更新,所有这些模型都是“思考模型”,能够在生成响应前进行推理,并且开发者可以控制“思考预算”。Gemini 2.5 Pro...
谷歌扩展 Gemini 2.5 系列,推出 Flash、Pro GA 和新的 Flash-Lite 模型 Posted on 2025年6月18日 by LEO 谷歌已大幅拓展其 Gemini 2.5 模型家族,Gemini 2.5 Flash 和 Pro 已全面上市,标志着它们已稳定发布,可用于生产应用。与此同时,该公司推出了 Gemini 2.5 Flash-Lite 的预览版,该版本被定位为迄今为止最具成本效益且最快的 2.5...
谷歌 DeepMind 的气象实验室:AI 在热带气旋预测方面的突破 Posted on 2025年6月12日 by LEO Google DeepMind 和 Google Research 推出了 Weather Lab,这是一个创新的互动平台,旨在利用先进人工智能增强热带气旋预测能力。其核心是一个实验性人工智能模型,该模型基于随机神经网络构建,能够通过生成多达 50...
Gemini 2.5:对话式音频、风格控制和工具集成 Posted on 2025年6月4日 by LEO Gemini 2.5引入了先进的音频功能,实现了与自然对话、风格控制和工具集成的实时音频对话。它还具备可控的文本转语音功能,允许用户控制生成音频的风格、语调和表达方式。这些进步使开发者能够通过Gemini...
Google I/O 2025:Gemini 迈向通用 AI 助手的飞跃 Posted on 2025年5月20日 by LEO 在 2025 年的 Google I/O 大会上,焦点在于扩展 Gemini,以打造一个通用的 AI 助手。这包括将 Gemini 演进为一个“世界模型”,能够像人脑一样进行规划和模拟体验。这建立在 agentic 能力的进步之上,例如 Project...
谷歌发布一系列生成式 AI 工具,用于视频、图像和音乐创作 Posted on 2025年5月20日 by LEO 谷歌正在推出新的生成式媒体模型和工具,以激发创造力。此次发布包括 Veo 3,这是一个新的视频生成模型,能够制作带有音频且唇形同步效果有所改进的视频,以及 Imagen...
谷歌新AI工具释放生成式媒体力量 Posted on 2025年5月20日 by LEO 谷歌发布一系列新的生成式媒体工具,旨在赋能创造力。 该公司推出了 Veo 3,这是一款能够生成带音频视频的视频生成模型,以及 Imagen 4,它在图像清晰度和排版方面表现出色。此外,还推出了新的 AI 电影制作工具 Flow。...