开云kaiyun中国官网入口谷歌I/O大会的10个新东西, 用Gemini接受一切

发布日期：2026-05-25 23:31 来源：未知作者：admin 浏览次数：

开云kaiyun中国官网入口谷歌I/O大会的10个新东西，用Gemini接受一切

一年一度的谷歌I/O大会，重磅来袭。

谷歌官方此次一语气发布了24篇I/O干系公告，信息量很大，但干线并不复杂：底层模子更新到Gemini 3.5，并推露面向视频和多模态创作的Gemini Omni；用户进口上，Gemini App启动往个东说念主助理标的走；搜索启动加入更多AI模式和智能体智力；购物、办公、成立器具也齐被再行接入Gemini；硬件上，谷歌还展示了搭载 Gemini 的智能眼镜。

要点在于，本年不仅有模子智力的提高，谷歌还把Gemini塞到了各式处所。

从搜索框，到购物车，再到智能眼镜……谷歌正在用AI接受一切。

咱们整理了此次大会上最值得关注的10个新东西，全部来看：

Gemini 3.5：迄今为最强的编码、智能体模子

先来看引人注目的底层模子。

此次谷歌发布了Gemini 3.5系列，首发的是Gemini 3.5 Flash，3.5 Pro还在里面使用，谋略下个月推出。

诚然3.5 Flash名字里照旧Flash，但它的定位仍是不仅仅“快”和“低廉”，不错说，它是谷歌此次通盘Agent家具的发动机。

3.5 Flash面向的是编码、智能体任务和确凿使命流，仍是干与Gemini App、Google Search的AI Mode、Google Antigravity、Gemini API、Android Studio，以及企业平台。

跑分方面，Gemini 3.5 Flash在编码智力、Agent智力、器具调用智力上比3.1 Pro强了不少，但在Humanity's Last Exam和ARC-AGI-2上照旧有所不及。

输出速率上，比其它前沿模子快4倍，在东说念主工智能分析指数中位列右上象限——真义是又快又强。

订价上，3.5 Flash输入$1.50/百万token，输出$9.00/百万token，比3 Flash贵了3倍，比3.1 Pro低廉40%。

官方给了几个典型场景：比如成立应用、调养代码库、准备财务文献、整理非结构化财富、把旧代码库挪动到Next.js，甚而让两个agent配合，把AlphaZero论文读完，再作念出一个可玩的游戏。

在Gemini 3强盛的多模态基础之上，3.5 Flash不错生成更丰富、更具交互性的Web用户界面和图形。

它不错在不到一分钟里生成6个不同的支付页面，也不错一次作念出64个分形图案变体；用户只消用笔墨描摹一个念念法，它就能生成可互动的网页组件。

更复杂少量，它还能把论文、课程视频变成互动式学习卡片和可视化页面，甚而在Google搜索里，根据用户的问题现场生成图表、模拟器和千里浸式解释界面。

以前各人对Flash类模子的印象是：低廉、快、合适轻量任务。但目前谷歌要抒发的是，改日的Agent不行能每一步齐调用最贵、最慢的大模子。确凿能范畴化跑起来的Agent，需要一个速率、资本和智力齐相比均衡的模子。

这即是Gemini 3.5 Flash的位置。

Gemini Omni：谷歌版全模态生成模子

除了Gemini 3.5，此次谷歌还发布了一个更偏创作的新模子：Gemini Omni。

谷歌对它的定位是：can create anything from any input（从任何输入，生成任何内容）。

天然，目前第一步照旧视频。之后谷歌还谋略复旧图片、音频等更多输出形势。

首个上线的是Gemini Omni Flash，仍是向Google AI Plus、Pro和Ultra订阅用户绽放，不错在Gemini App和Google Flow 中使用；YouTube Shorts和YouTube Create App也会免费接入。改日几周，谷歌还会把它通过API绽放给成立者和企业客户。

Omni不是一个单纯的文生视频模子。它不错把笔墨、图片、音频、视频全部手脚输入，然青年景一段齐备视频，况兼复旧对话式视频裁剪。

官方还展示了一个一语气修改的例子：先生成一个小提琴手演奏的视频，然后把小提琴手放进另一张图片里的环境，再把小提琴变成透明，临了把镜头角度改成从小提琴手肩膀后方看。通盘经由是一轮一轮接着改，而不是每次推倒重来。

谷歌还极度强调，Omni背后接的是Gemini的寰球常识。它对重力、动能、流体这些物理后果有更好的分解，也不错把复杂看法作念成解释视频。活动会产生后果，环境会对事件作念出反馈，叙事会按逻辑发展。

换句话说，谷歌念念抒发的是，AI视频不是只可作念炫酷短片，也不错变成一种常识抒发器具。复杂看法、科学经由、教悔内容，齐不错被转成更直不雅的视频。

和Seedance 2.0同样，Omni也能多种参考素材来生成视频，图片、视频、音频、音乐齐不错成为输入。用户不错让它保留某张图里的变装，借用一段视频里的动作，再让画面奴隶音乐节律变化，临了生成一段新的齐备视频。

官方还提到，用户不错从已有素材起程：用草图手脚动作参考，把它变成确凿影像；举例用视频里的鲸鱼游动动作，挪动到一种反光流体材料上；或者保留房间结构不变，只把植物变成半透明的发光植物，并让萤火虫和声息节律互动。

简便点说，Omni念念让用户省略“把各式素材、立场、动作和声息，再行组织成一个新视频”。这对创作家很要紧。

不外，看社群反馈，它用起来并莫得Seedance 2.0出色……但这仅仅Flash版块的一个启动，对吧？

安全方面，Omni复旧用户创建我方的数字分身，也即是用我方的声息和形象生成视频。但谷歌强调，其他波及改音频、改语音的智力还在测试中，需要更严慎地推出。通盘Omni生成的视频齐会带有不行见的SynthID数字水印，用户不错通过Gemini以及Google搜索来考据内容是否由Gemini Omni生成。

Gemini App：大更新

此次Gemini App也大改。

谷歌说，本年对Gemini App来说是“硕果累累的一年”。旧年I/O时Gemini App有4亿用户，目前仍是有向上9亿月活，覆盖230多个国度和70多种语言。

此次 Gemini App 的更新主要有几个：

第一，接入Gemini 3.5 Flash。

第二，推出新的遐想语言Neural Expressive。界面会鼎新态，有流体动画、更明白的神采、新字体、触觉反馈。Gemini Live也被平直整合到Gemini，用户不错从打字天然切到语音对话。谷歌还说，Gemini以后不仅仅给你一堵笔墨墙，而是会根据问题及时生成更合适的回报形势，比如图片、交互时刻线、旁白视频、动态图形等。这个新遐想从今天起在Web、Android、iOS全球推出。

第三，Gemini App接入Gemini Omni，不错平直生成和裁剪视频。用户不错上传手机相册里的素材，用模板、教导词、布景替换、电影感变焦等方式作念视频。甚而不错创建我方的数字分身。

第四，是Daily Brief。它像一个清早简报Agent，你授权之后，它会在后台看你的 Gmail、Calendar，把蹙迫邮件、接下来的日程、需要跟进的事项整理成一个早间摘记。它不仅仅总结，还会按你的谋略排序，并提议下一步。Daily Brief从好意思国启动，面向Google AI Plus、Pro、Ultra用户推出。

第五，亦然最要紧的，是Gemini Spark。

Gemini Spark：谷歌版24小时个东说念主Agent

Gemini Spark是此次最值得单独先容的家具之一。

谷歌给它的定位是24/7 personal AI agent。也即是说，它不错在你授权下，捏续帮你作念事。

它运行在Gemini 3.5上，使用Antigravity harness，况兼深度诱惑Gmail、Docs、Slides等器具。而且因为它是云霄Agent，是以你关掉电脑、锁上手机，它也不错赓续在后台使命。

谷歌举了几个例子。

比如你不错让它如期解析每月事用卡账单，找出新增订阅或者遮盖用度；或者教它搜检孩子学校邮件，把要紧日历索要出来，每天发一份简报给你和伴侣；再比如，你不错让它从邮件和聊天纪录里的会议条记中提真金不怕火信息，整理成Google Docs，再草拟一封神情启动邮件。

这是典型的Agent叙事：帮你跨应用完成一串动作。

这亦然谷歌最有上风、也最敏锐的处所：它手里有Gmail、Calendar、Docs、Drive、Slides、Maps、YouTube、Search。只消用户得志授权，Gemini不错触达的个东说念主高下文，将成为一个非常雄伟的生态。

天然，谷歌也在强调权限和安全。Spark需要用户选拔是否开启、诱惑哪些App；波及用钱、发邮件等高风险动作时，会先研究用户。

这一功能本周先面向trusted testers，下周谋略手脚Beta推给好意思国Google AI Ultra用户。

macOS版Gemini：启动干与桌面使命流

Gemini App还有一个相比容易被忽略的更新：macOS桌面版。

谷歌说，Gemini的macOS App仍是不错下载，接下来会把Gemini Spark带到桌面端，让它处理腹地文献，并自动化桌面上的使命流。它还会加入新的语音智力：用户不错对着屏幕说一段并不齐备、搀杂着停顿和理论禅的话，Gemini能根据屏幕高下文，把它整理成更准确的文本，并平直放到光标所在位置。

这件事看起来小，但也值得注释，因为Agent最终不行能只在网页里使命。许多确凿使命发生在腹地：文献夹、桌面软件、浏览器、多窗口、多文档之间。谷歌把Spark带到macOS，其实即是在往桌面Agent的标的走。

咱们之前写过一篇著述，说PC才是agent时间的头号硬件，谷歌之前在The Android Show上发布的种种更适合确凿使命流的软硬件家具，开云官网入口和这件事亦然互通的。

Google Search：搜索框25年来最大改版

此次最有符号道理的家具，照旧Search。

谷歌说，AI Mode上线一年后，月活仍是向上10亿，查询量每个季度翻倍。目前，谷歌把Gemini 3.5 Flash手脚AI Mode的默许模子，并晓喻对搜索框进行25年来最大升级。

新的搜索框不再仅仅输入要害词的小框，变成了一个AI进口。

它会动态伸开，让你用更天然的方式描摹问题；它会根据意图给出AI提议，不仅仅传统自动补全；它复旧多模态输入，不错用文本、图片、文献、视频，甚而Chrome标签页手脚输入。

也即是说，搜索不再仅仅“给我十个流畅”，变成了“我有一个问题、一段材料、一张图、一个网页高下文，你帮我分解并赓续往下走”。

另外，AI Overview 也不错更天然地接入AI Mode。用户不错平直对AI Overview赓续追问，搜索会带着高下文干与对话。这个体验仍是在桌面和挪动端全球上线。

Search此次还有一个更Agent化的智力：Search agents。

谷歌说，用户以后不错在Search里创建、定制和惩办多个AI agents。第一批是information agents，信息型Agent。它们不错24小时在后台监控你矜恤的信息，然后在合适的时候给你一份详细更新。

这和Google Alerts很像，但更智能。

Google Alerts只可按要害词订阅。Search agents订阅的是“你的意图”。它不像爬虫那样只看某个词有莫得出现，而是分解你到底要什么，然后跨网页、新闻、应对、购物、体育、金融等信息源监控变化。

information agents本年夏天先给Google AI Pro和Ultra用户推出。

此外，Search还在扩张agentic booking，也即是帮你完成预订类任务。比如你要找一个周五晚上、能坐6个东说念主、供应夜宵的私东说念主KTV房间，Search会详细价钱和可用性，并给你平直完成预订的进口。部分品类，比如家政维修、好意思容、宠物照看，用户甚而不错让Google代为给商家打电话。这些智力本年夏天在好意思国面向所灵验户推出。

另外，谷歌还把Antigravity和Gemini 3.5 Flash的编码智力带进了Search。谋略是让搜索戒指不再仅仅文本、图片、表格，而是根据你的问题即时生成合适的交互界面。

比如你念念分解天体物理，或者念念看手内外面何如运转，Search不错及时拼装交互视觉、表格、图表、模拟器。这些generative UI智力本年夏天会免费绽放给通盘Search用户。

更进一步，Search还不错为捏续性任务生成mini apps。比如你在搬家、运筹帷幄婚典、惩办健康谋略，不是一次搜索就结束，而是一个永恒神情。Search不错给你生成一个自界说dashboard或tracker，以后你不错捏续追想用。

这非常像一个新的家具形态：搜索戒指不再是网页，变成了临时生成的鄙吝具。

Universal Cart：谷歌念念作念AI购物车

购物亦然此次大会的大更新之一。

谷歌发布了Universal Cart，一个跨工作、跨商家的智能购物车。它不错出目前Search、Gemini、YouTube、Gmail里。用户在搜索商品、和Gemini聊天、看YouTube、读Gmail的时候，齐不错把商品加入归并个购物车。

但它不是粗鄙的购物车。

商品一加入购物车，它就会在后台览动使命：找优惠、跟踪价钱下落、检察价钱历史、提醒补货。它还会用推聪敏力提前发现问题，比如你在不同零卖商哪里买电脑配件，它会提醒你哪些零件不兼容，并推选替代决议。

因为它基于Google Wallet，还能分解你的支付方式权柄、会员信息、商家优惠，帮你找到遮盖扣头或者积分契机。

结账时，Universal Commerce Protocol会让用户用Google Pay快速完成购买，或者把商品转到商家网站赓续下单。

谷歌提到，Nike、Sephora、Target、Ulta Beauty、Walmart、Wayfair，以及Shopify 上的Fenty、Steve Madden 等品牌会参与干系缚账智力。Universal Cart本年夏天会先在好意思国的Search和Gemini App推出，之后干与YouTube和Gmail。

谷歌还提到Agent Payments Protocol，AP2。它的主义是让Agent代表用户安全付款。用户不错给Agent设定严格范畴，比如只可买哪些品牌、哪些家具、最多花几许钱。AP2会在用户、商家、支付处理方之间创建可考据的纪录，让Agent的购买活动有范畴、有字据、有跟踪。谷歌说，AP2会在改日几个月干与Google家具，率先从Gemini Spark启动。

不外……购物也就算了，谁会念念让AI帮你一键付款呢。

智能眼镜：Google Glass的AI时间重启

硬件侧最值得关注的是智能眼镜。

以前Google Glass如实作念得挺烂的，甚而能算是硅谷硬件史上“期间很酷，但家具没念念明白”的典型案例。

此次和当年Google Glass最大的不同是家具逻辑换了。Google Glass像是把手机告知、拍照、导航这些功能，硬塞到目下，但此次的Gemini智能眼镜更像是：让AI随时看见你看到的东西、听见你听到的东西，然后帮你分解和处理。

也即是说，它不再仅仅“戴在脸上的小屏幕”，变成了一个更天然的AI进口。

在本年的I/O大会上，谷歌共享了更多对于智能眼镜的信息：这种眼镜不错在不打断你的情况下，即时提供匡助。

智能眼镜分为两种：一种是音频眼镜，不错在你的耳朵里提供语音匡助；另一种是披露眼镜，不错在你需要的时候立即披露所需信息。这两种眼镜齐能让你自若双手，专注于其他事情，只需启齿研究，即可获取Gemini的匡助。

音频眼镜会先上市，本年秋天推出。

样式看起来，何如说，挺精深的。

功能上，它不错通过“Hey Google”或者轻触镜腿唤起Gemini。用户不错问它目下看到的东西，比如途经一家餐厅，问它评价何如样；看到一块云，问这是什么云；看到复杂泊车符号，让它帮你解释。

它还复旧导航，也不错接电话、发短信、总结错过的音信、播放音乐；不错拍照和视频，并用Nano Banana作念图像裁剪，比如拍完照平直说“给每个东说念主戴上搞笑帽子”；还能及时翻译语音和笔墨，翻译语音时甚而会尽量匹配语言东说念主的语气和音高。眼镜也不错诱惑 Uber、Mondly等手机应用，并同期复旧Android和iOS。

诚然不好说实质使用后果怎样，但此次至少澌灭了Google Glass当年的几个坑：

不再把眼镜当成袖珍手机，中枢不是告知和小屏幕，而是Gemini对推行寰球的分解和任务推论；不再一上来押贯注AR，先推音频眼镜，镌汰硬件难度和社会接受门槛；不再疏远外不雅，找Gentle Monster和Warby Parker，承认眼镜是前锋耗尽品，不是纯科技家具。

毕竟当初Google Glass长这么：

场景也更阐发了。导航、翻译、识别目下事物、总结音信、拍照裁剪、叫车点单，这些齐更接近“我为什么要戴它”。

Google Antigravity 2.0：成立者侧的Agent使命台

成立者侧，最要紧的是Google Antigravity 2.0。

谷歌把它称为agent-first development platform。也即是说，它不是粗鄙 IDE 插件，而是一个以Agent为中心的成立平台。

此次I/O大会发布了Antigravity 2.0桌面应用、Gemini API里的Managed Agents，以及AI Studio的原生Android vibe coding。

曩昔AI编程器具的中枢是“帮你补代码、写函数、解释报错”，目前谷歌念念作念的是“从prompt到分娩就绪app”，也即是你给一个谋略，AI就能预备、拆任务、调用器具、跑测试、修bug、部署，况兼可能让多个子Agent并期骗命。

这和Codex、Claude Code、Cursor竞争的是归并条赛说念。谷歌的上风在于它不单好模子，还有Android、Firebase、Cloud、Workspace、Play Store、Search、Chrome 等齐备生态。

Project Genie + Street View：寰球模子启动诱惑确凿街景

另一个偏前沿的家具是Project Genie。

Genie是Google DeepMind的通用寰球模子，不错生成千般化、可交互的环境。谷歌说，它仍是成为研究器具，不错让Agent在复杂虚构环境中学习和推理，也匡助Waymo（Alphabet旗下的自动驾驶公司）模拟高确凿度说念路环境。

此次的新智力，是把Genie和Google Street View诱惑起来。

也即是说，Genie 的生成智力启动和Google近20年街景图像采集，让模子生成的环境不错锚定确凿寰球。谷歌说，这不错为AI agents或机器东说念主提供虚构环境，让它们在其中导航、互动、学习推行寰球的复杂性。

机器东说念主和自动驾驶需要无数确凿寰球数据，但推行寰球测试崇高、危急、慢。寰球模子不错提供虚构检修场；而Street View则是谷歌特殊的数据财富。二者采集，意味着谷歌不错把确凿街景变成可交互的模拟环境。

换句话说，Project Genie是谷歌把“舆图财富”变成“AI检修环境”的尝试。

天博体育(TBSports)官方网站

总结

本年Google I/O不是一个单点发布会，而是一次生态铺开。

模子层，谷歌发布Gemini 3.5和Gemini Omni。前者面向活动和 Agent，后者面向全模态生成和视频裁剪。

家具层，Gemini被塞进Search、Workspace、Shopping、Flow、AI Studio、智能眼镜。它不再仅仅一个App，而是Google家具体系里的协调智能层。

交易层，谷歌启动把Agent落到确凿任务上：帮你盯信息、订工作、管购物车、处理邮件、写文档、作念App、生成视频、甚而补助科研。

此次大会的一个昭着趋势是，谷歌正在把Gemini转换成Google生态的操作系统。

曩昔的Google，是一个你主动使用的器具箱，你不错用它搜索、发邮件、写文档……目前，谷歌念念让Gemini站在这些器具之上，分解你的意图，调用这些器具，替你完成一串动作。

本年I/O的发布看起来极度多、极度散：搜索、购物、办公、视频、眼镜、成立、科研，简直每条线齐在讲AI，它们指向的其实是归并件事：

谷歌念念要解释开云kaiyun中国官网入口，我方仍然领有把AI变成精深进口的最大生态。

上一篇：上一篇：开云官网入口依顿电子研发干预1.75亿元同比增长16.53%, 五年复合增长率12.86%

下一篇：下一篇：开云官网入口 - 开云kaiyun(中国)官网旅游天国秒变罗网? 泰国东说念主还是穷疯了, 中国东说念主成为最大的受害者!

开云直播

开云kaiyun中国官网入口 谷歌I/O大会的10个新东西, 用Gemini接受一切

开云kaiyun中国官网入口谷歌I/O大会的10个新东西, 用Gemini接受一切