开云kaiyun中国官网入口 谷歌I/O大会的10个新东西, 用Gemini接受一切


一年一度的谷歌I/O大会,重磅来袭。

谷歌官方此次一语气发布了24篇I/O干系公告,信息量很大,但干线并不复杂:底层模子更新到Gemini 3.5,并推露面向视频和多模态创作的Gemini Omni;用户进口上,Gemini App启动往个东说念主助理标的走;搜索启动加入更多AI模式和智能体智力;购物、办公、成立器具也齐被再行接入Gemini;硬件上,谷歌还展示了搭载 Gemini 的智能眼镜。
要点在于,本年不仅有模子智力的提高,谷歌还把Gemini塞到了各式处所。
从搜索框,到购物车,再到智能眼镜……谷歌正在用AI接受一切。
咱们整理了此次大会上最值得关注的10个新东西,全部来看:
01
Gemini 3.5:迄今为最强的编码、智能体模子
先来看引人注目的底层模子。
此次谷歌发布了Gemini 3.5系列,首发的是Gemini 3.5 Flash,3.5 Pro还在里面使用,谋略下个月推出。
诚然3.5 Flash名字里照旧Flash,但它的定位仍是不仅仅“快”和“低廉”,不错说,它是谷歌此次通盘Agent家具的发动机。
3.5 Flash面向的是编码、智能体任务和确凿使命流,仍是干与Gemini App、Google Search的AI Mode、Google Antigravity、Gemini API、Android Studio,以及企业平台。
跑分方面,Gemini 3.5 Flash在编码智力、Agent智力、器具调用智力上比3.1 Pro强了不少,但在Humanity's Last Exam和ARC-AGI-2上照旧有所不及。

输出速率上,比其它前沿模子快4倍,在东说念主工智能分析指数中位列右上象限——真义是又快又强。


订价上,3.5 Flash输入$1.50/百万token,输出$9.00/百万token,比3 Flash贵了3倍,比3.1 Pro低廉40%。

官方给了几个典型场景:比如成立应用、调养代码库、准备财务文献、整理非结构化财富、把旧代码库挪动到Next.js,甚而让两个agent配合,把AlphaZero论文读完,再作念出一个可玩的游戏。

在Gemini 3强盛的多模态基础之上,3.5 Flash不错生成更丰富、更具交互性的Web用户界面和图形。
它不错在不到一分钟里生成6个不同的支付页面,也不错一次作念出64个分形图案变体;用户只消用笔墨描摹一个念念法,它就能生成可互动的网页组件。
更复杂少量,它还能把论文、课程视频变成互动式学习卡片和可视化页面,甚而在Google搜索里,根据用户的问题现场生成图表、模拟器和千里浸式解释界面。

以前各人对Flash类模子的印象是:低廉、快、合适轻量任务。但目前谷歌要抒发的是,改日的Agent不行能每一步齐调用最贵、最慢的大模子。确凿能范畴化跑起来的Agent,需要一个速率、资本和智力齐相比均衡的模子。
这即是Gemini 3.5 Flash的位置。
02
Gemini Omni:谷歌版全模态生成模子
除了Gemini 3.5,此次谷歌还发布了一个更偏创作的新模子:Gemini Omni。

谷歌对它的定位是:can create anything from any input(从任何输入,生成任何内容)。
天然,目前第一步照旧视频。之后谷歌还谋略复旧图片、音频等更多输出形势。
首个上线的是Gemini Omni Flash,仍是向Google AI Plus、Pro和Ultra订阅用户绽放,不错在Gemini App和Google Flow 中使用;YouTube Shorts和YouTube Create App也会免费接入。改日几周,谷歌还会把它通过API绽放给成立者和企业客户。
Omni不是一个单纯的文生视频模子。它不错把笔墨、图片、音频、视频全部手脚输入,然青年景一段齐备视频,况兼复旧对话式视频裁剪。

官方还展示了一个一语气修改的例子:先生成一个小提琴手演奏的视频,然后把小提琴手放进另一张图片里的环境,再把小提琴变成透明,临了把镜头角度改成从小提琴手肩膀后方看。通盘经由是一轮一轮接着改,而不是每次推倒重来。
谷歌还极度强调,Omni背后接的是Gemini的寰球常识。它对重力、动能、流体这些物理后果有更好的分解,也不错把复杂看法作念成解释视频。活动会产生后果,环境会对事件作念出反馈,叙事会按逻辑发展。
换句话说,谷歌念念抒发的是,AI视频不是只可作念炫酷短片,也不错变成一种常识抒发器具。复杂看法、科学经由、教悔内容,齐不错被转成更直不雅的视频。
和Seedance 2.0同样,Omni也能多种参考素材来生成视频,图片、视频、音频、音乐齐不错成为输入。用户不错让它保留某张图里的变装,借用一段视频里的动作,再让画面奴隶音乐节律变化,临了生成一段新的齐备视频。
官方还提到,用户不错从已有素材起程:用草图手脚动作参考,把它变成确凿影像;举例用视频里的鲸鱼游动动作,挪动到一种反光流体材料上;或者保留房间结构不变,只把植物变成半透明的发光植物,并让萤火虫和声息节律互动。
简便点说,Omni念念让用户省略“把各式素材、立场、动作和声息,再行组织成一个新视频”。这对创作家很要紧。
不外,看社群反馈,它用起来并莫得Seedance 2.0出色……但这仅仅Flash版块的一个启动,对吧?
安全方面,Omni复旧用户创建我方的数字分身,也即是用我方的声息和形象生成视频。但谷歌强调,其他波及改音频、改语音的智力还在测试中,需要更严慎地推出。通盘Omni生成的视频齐会带有不行见的SynthID数字水印,用户不错通过Gemini以及Google搜索来考据内容是否由Gemini Omni生成。
03
Gemini App:大更新
此次Gemini App也大改。

谷歌说,本年对Gemini App来说是“硕果累累的一年”。旧年I/O时Gemini App有4亿用户,目前仍是有向上9亿月活,覆盖230多个国度和70多种语言。
此次 Gemini App 的更新主要有几个:
第一,接入Gemini 3.5 Flash。
第二,推出新的遐想语言Neural Expressive。界面会鼎新态,有流体动画、更明白的神采、新字体、触觉反馈。Gemini Live也被平直整合到Gemini,用户不错从打字天然切到语音对话。谷歌还说,Gemini以后不仅仅给你一堵笔墨墙,而是会根据问题及时生成更合适的回报形势,比如图片、交互时刻线、旁白视频、动态图形等。这个新遐想从今天起在Web、Android、iOS全球推出。

第三,Gemini App接入Gemini Omni,不错平直生成和裁剪视频。用户不错上传手机相册里的素材,用模板、教导词、布景替换、电影感变焦等方式作念视频。甚而不错创建我方的数字分身。
第四,是Daily Brief。它像一个清早简报Agent,你授权之后,它会在后台看你的 Gmail、Calendar,把蹙迫邮件、接下来的日程、需要跟进的事项整理成一个早间摘记。它不仅仅总结,还会按你的谋略排序,并提议下一步。Daily Brief从好意思国启动,面向Google AI Plus、Pro、Ultra用户推出。

第五,亦然最要紧的,是Gemini Spark。
04
Gemini Spark:谷歌版24小时个东说念主Agent
Gemini Spark是此次最值得单独先容的家具之一。
谷歌给它的定位是24/7 personal AI agent。也即是说,它不错在你授权下,捏续帮你作念事。
它运行在Gemini 3.5上,使用Antigravity harness,况兼深度诱惑Gmail、Docs、Slides等器具。而且因为它是云霄Agent,是以你关掉电脑、锁上手机,它也不错赓续在后台使命。
谷歌举了几个例子。
比如你不错让它如期解析每月事用卡账单,找出新增订阅或者遮盖用度;或者教它搜检孩子学校邮件,把要紧日历索要出来,每天发一份简报给你和伴侣;再比如,你不错让它从邮件和聊天纪录里的会议条记中提真金不怕火信息,整理成Google Docs,再草拟一封神情启动邮件。
这是典型的Agent叙事:帮你跨应用完成一串动作。
这亦然谷歌最有上风、也最敏锐的处所:它手里有Gmail、Calendar、Docs、Drive、Slides、Maps、YouTube、Search。只消用户得志授权,Gemini不错触达的个东说念主高下文,将成为一个非常雄伟的生态。
天然,谷歌也在强调权限和安全。Spark需要用户选拔是否开启、诱惑哪些App;波及用钱、发邮件等高风险动作时,会先研究用户。
这一功能本周先面向trusted testers,下周谋略手脚Beta推给好意思国Google AI Ultra用户。
05
macOS版Gemini:启动干与桌面使命流
Gemini App还有一个相比容易被忽略的更新:macOS桌面版。
谷歌说,Gemini的macOS App仍是不错下载,接下来会把Gemini Spark带到桌面端,让它处理腹地文献,并自动化桌面上的使命流。它还会加入新的语音智力:用户不错对着屏幕说一段并不齐备、搀杂着停顿和理论禅的话,Gemini能根据屏幕高下文,把它整理成更准确的文本,并平直放到光标所在位置。
这件事看起来小,但也值得注释,因为Agent最终不行能只在网页里使命。许多确凿使命发生在腹地:文献夹、桌面软件、浏览器、多窗口、多文档之间。谷歌把Spark带到macOS,其实即是在往桌面Agent的标的走。
咱们之前写过一篇著述,说PC才是agent时间的头号硬件,谷歌之前在The Android Show上发布的种种更适合确凿使命流的软硬件家具,开云官网入口和这件事亦然互通的。
06
Google Search:搜索框25年来最大改版
此次最有符号道理的家具,照旧Search。

谷歌说,AI Mode上线一年后,月活仍是向上10亿,查询量每个季度翻倍。目前,谷歌把Gemini 3.5 Flash手脚AI Mode的默许模子,并晓喻对搜索框进行25年来最大升级。
新的搜索框不再仅仅输入要害词的小框,变成了一个AI进口。

它会动态伸开,让你用更天然的方式描摹问题;它会根据意图给出AI提议,不仅仅传统自动补全;它复旧多模态输入,不错用文本、图片、文献、视频,甚而Chrome标签页手脚输入。
也即是说,搜索不再仅仅“给我十个流畅”,变成了“我有一个问题、一段材料、一张图、一个网页高下文,你帮我分解并赓续往下走”。
另外,AI Overview 也不错更天然地接入AI Mode。用户不错平直对AI Overview赓续追问,搜索会带着高下文干与对话。这个体验仍是在桌面和挪动端全球上线。
Search此次还有一个更Agent化的智力:Search agents。
谷歌说,用户以后不错在Search里创建、定制和惩办多个AI agents。第一批是information agents,信息型Agent。它们不错24小时在后台监控你矜恤的信息,然后在合适的时候给你一份详细更新。
这和Google Alerts很像,但更智能。
Google Alerts只可按要害词订阅。Search agents订阅的是“你的意图”。它不像爬虫那样只看某个词有莫得出现,而是分解你到底要什么,然后跨网页、新闻、应对、购物、体育、金融等信息源监控变化。
information agents本年夏天先给Google AI Pro和Ultra用户推出。
此外,Search还在扩张agentic booking,也即是帮你完成预订类任务。比如你要找一个周五晚上、能坐6个东说念主、供应夜宵的私东说念主KTV房间,Search会详细价钱和可用性,并给你平直完成预订的进口。部分品类,比如家政维修、好意思容、宠物照看,用户甚而不错让Google代为给商家打电话。这些智力本年夏天在好意思国面向所灵验户推出。
另外,谷歌还把Antigravity和Gemini 3.5 Flash的编码智力带进了Search。谋略是让搜索戒指不再仅仅文本、图片、表格,而是根据你的问题即时生成合适的交互界面。
比如你念念分解天体物理,或者念念看手内外面何如运转,Search不错及时拼装交互视觉、表格、图表、模拟器。这些generative UI智力本年夏天会免费绽放给通盘Search用户。
更进一步,Search还不错为捏续性任务生成mini apps。比如你在搬家、运筹帷幄婚典、惩办健康谋略,不是一次搜索就结束,而是一个永恒神情。Search不错给你生成一个自界说dashboard或tracker,以后你不错捏续追想用。

这非常像一个新的家具形态:搜索戒指不再是网页,变成了临时生成的鄙吝具。
07
Universal Cart:谷歌念念作念AI购物车
购物亦然此次大会的大更新之一。

谷歌发布了Universal Cart,一个跨工作、跨商家的智能购物车。它不错出目前Search、Gemini、YouTube、Gmail里。用户在搜索商品、和Gemini聊天、看YouTube、读Gmail的时候,齐不错把商品加入归并个购物车。
但它不是粗鄙的购物车。
商品一加入购物车,它就会在后台览动使命:找优惠、跟踪价钱下落、检察价钱历史、提醒补货。它还会用推聪敏力提前发现问题,比如你在不同零卖商哪里买电脑配件,它会提醒你哪些零件不兼容,并推选替代决议。

因为它基于Google Wallet,还能分解你的支付方式权柄、会员信息、商家优惠,帮你找到遮盖扣头或者积分契机。
结账时,Universal Commerce Protocol会让用户用Google Pay快速完成购买,或者把商品转到商家网站赓续下单。
谷歌提到,Nike、Sephora、Target、Ulta Beauty、Walmart、Wayfair,以及Shopify 上的Fenty、Steve Madden 等品牌会参与干系缚账智力。Universal Cart本年夏天会先在好意思国的Search和Gemini App推出,之后干与YouTube和Gmail。
谷歌还提到Agent Payments Protocol,AP2。它的主义是让Agent代表用户安全付款。用户不错给Agent设定严格范畴,比如只可买哪些品牌、哪些家具、最多花几许钱。AP2会在用户、商家、支付处理方之间创建可考据的纪录,让Agent的购买活动有范畴、有字据、有跟踪。谷歌说,AP2会在改日几个月干与Google家具,率先从Gemini Spark启动。
不外……购物也就算了,谁会念念让AI帮你一键付款呢。
08
智能眼镜:Google Glass的AI时间重启
硬件侧最值得关注的是智能眼镜。

以前Google Glass如实作念得挺烂的,甚而能算是硅谷硬件史上“期间很酷,但家具没念念明白”的典型案例。
此次和当年Google Glass最大的不同是家具逻辑换了。Google Glass像是把手机告知、拍照、导航这些功能,硬塞到目下,但此次的Gemini智能眼镜更像是:让AI随时看见你看到的东西、听见你听到的东西,然后帮你分解和处理。
也即是说,它不再仅仅“戴在脸上的小屏幕”,变成了一个更天然的AI进口。
在本年的I/O大会上,谷歌共享了更多对于智能眼镜的信息:这种眼镜不错在不打断你的情况下,即时提供匡助。
智能眼镜分为两种:一种是音频眼镜,不错在你的耳朵里提供语音匡助;另一种是披露眼镜,不错在你需要的时候立即披露所需信息。这两种眼镜齐能让你自若双手,专注于其他事情,只需启齿研究,即可获取Gemini的匡助。
音频眼镜会先上市,本年秋天推出。


样式看起来,何如说,挺精深的。
功能上,它不错通过“Hey Google”或者轻触镜腿唤起Gemini。用户不错问它目下看到的东西,比如途经一家餐厅,问它评价何如样;看到一块云,问这是什么云;看到复杂泊车符号,让它帮你解释。
它还复旧导航,也不错接电话、发短信、总结错过的音信、播放音乐;不错拍照和视频,并用Nano Banana作念图像裁剪,比如拍完照平直说“给每个东说念主戴上搞笑帽子”;还能及时翻译语音和笔墨,翻译语音时甚而会尽量匹配语言东说念主的语气和音高。眼镜也不错诱惑 Uber、Mondly等手机应用,并同期复旧Android和iOS。
诚然不好说实质使用后果怎样,但此次至少澌灭了Google Glass当年的几个坑:
不再把眼镜当成袖珍手机,中枢不是告知和小屏幕,而是Gemini对推行寰球的分解和任务推论;不再一上来押贯注AR,先推音频眼镜,镌汰硬件难度和社会接受门槛;不再疏远外不雅,找Gentle Monster和Warby Parker,承认眼镜是前锋耗尽品,不是纯科技家具。
毕竟当初Google Glass长这么:

场景也更阐发了。导航、翻译、识别目下事物、总结音信、拍照裁剪、叫车点单,这些齐更接近“我为什么要戴它”。
09
Google Antigravity 2.0:成立者侧的Agent使命台
成立者侧,最要紧的是Google Antigravity 2.0。
谷歌把它称为agent-first development platform。也即是说,它不是粗鄙 IDE 插件,而是一个以Agent为中心的成立平台。
此次I/O大会发布了Antigravity 2.0桌面应用、Gemini API里的Managed Agents,以及AI Studio的原生Android vibe coding。
曩昔AI编程器具的中枢是“帮你补代码、写函数、解释报错”,目前谷歌念念作念的是“从prompt到分娩就绪app”,也即是你给一个谋略,AI就能预备、拆任务、调用器具、跑测试、修bug、部署,况兼可能让多个子Agent并期骗命。
这和Codex、Claude Code、Cursor竞争的是归并条赛说念。谷歌的上风在于它不单好模子,还有Android、Firebase、Cloud、Workspace、Play Store、Search、Chrome 等齐备生态。
10
Project Genie + Street View:寰球模子启动诱惑确凿街景
另一个偏前沿的家具是Project Genie。

Genie是Google DeepMind的通用寰球模子,不错生成千般化、可交互的环境。谷歌说,它仍是成为研究器具,不错让Agent在复杂虚构环境中学习和推理,也匡助Waymo(Alphabet旗下的自动驾驶公司)模拟高确凿度说念路环境。
此次的新智力,是把Genie和Google Street View诱惑起来。
也即是说,Genie 的生成智力启动和Google近20年街景图像采集,让模子生成的环境不错锚定确凿寰球。谷歌说,这不错为AI agents或机器东说念主提供虚构环境,让它们在其中导航、互动、学习推行寰球的复杂性。
机器东说念主和自动驾驶需要无数确凿寰球数据,但推行寰球测试崇高、危急、慢。寰球模子不错提供虚构检修场;而Street View则是谷歌特殊的数据财富。二者采集,意味着谷歌不错把确凿街景变成可交互的模拟环境。
换句话说,Project Genie是谷歌把“舆图财富”变成“AI检修环境”的尝试。
11
天博体育(TBSports)官方网站总结
本年Google I/O不是一个单点发布会,而是一次生态铺开。
模子层,谷歌发布Gemini 3.5和Gemini Omni。前者面向活动和 Agent,后者面向全模态生成和视频裁剪。
家具层,Gemini被塞进Search、Workspace、Shopping、Flow、AI Studio、智能眼镜。它不再仅仅一个App,而是Google家具体系里的协调智能层。
交易层,谷歌启动把Agent落到确凿任务上:帮你盯信息、订工作、管购物车、处理邮件、写文档、作念App、生成视频、甚而补助科研。
此次大会的一个昭着趋势是,谷歌正在把Gemini转换成Google生态的操作系统。
曩昔的Google,是一个你主动使用的器具箱,你不错用它搜索、发邮件、写文档……目前,谷歌念念让Gemini站在这些器具之上,分解你的意图,调用这些器具,替你完成一串动作。
本年I/O的发布看起来极度多、极度散:搜索、购物、办公、视频、眼镜、成立、科研,简直每条线齐在讲AI,它们指向的其实是归并件事:
谷歌念念要解释开云kaiyun中国官网入口,我方仍然领有把AI变成精深进口的最大生态。