Gemini 3.5 快得有点不正常。
早上摸鱼刷帖的时候,看到有网友放出了一组疑似 Gemini 3.5 Flash 的实测,结果有点吓人。

先说下速度:
第一组,首字延迟 6850 ms,每秒 934 tokens。

第二组,首字延迟 7486 ms,每秒 923 tokens。

第三组,首字延迟 4421 ms,每秒 577 tokens。

第四组,首字延迟 3630 ms,每秒 673 tokens。

它不是偶尔抽风快一次。
而是在不同任务里,稳定跑在一个非常夸张的速度区间。
更离谱的是写码:

网友在实际写码场景里测出来,Gemini 3.5 最快可以达到 1141 tps,普通速度也有 900 tps上下。
这个数字有多夸张?
可以对比一下官网现在的 Gemini 3 Flash。

谷歌官方对 Gemini 3 Flash 的定位,本来就已经是 built for speed。
在 Artificial Analysis 的 Google AI Studio 测试里,它的输出速度大概是 164.8 tokens/s,首字延迟大概是 6.95 秒。
拿这个做参照,网友测出来的速度,大概是官网 3F 的 3-7 倍。
虽然网友的测试口径和标准化 API 跑分还是有些区别,但这个差距也已经很惊人了。
接着,网友又测了 Gemini 3.5 的前端写代码能力。
先让它做一个 MC 沙盒游戏,从截图看,页面里已经有了方块地形、角色视角、游戏界面和操作区域。

再做一组天气卡,看看效果。这个测试更偏 UI 审美,听起来简单,但其实特别容易暴露模型水平。
弱一点的模型,最后经常会做成一张表格,各种元素全都堆上去,能用,但很丑。
而能不能有层次地展现信息,是模型能否有审美的关键。
网友连续放了几张效果图,看下来还不错。



最后是真实的网页效果,配色很高级,保持了 Gemini 一贯的前端审美水准。

如果一个模型只是速度变快,那有可能是纯靠牺牲质量换速度。
但如果它速度暴涨,同时代码生成质量没有明显变化,那就完全是另一回事了。
另外,网友还测试了simple bench,稳定 9/10,概率全对,没有退步。
可以肯定,Gemini 3.5 不是一个为了速度牺牲质量的阉割版本。
一、版本重塑
按照惯例,新一代 Gemini 应该叫 Gemini 3.2。
但从网友 Lentils 的爆料来看,谷歌大概率会选择直接跳级命名为 Gemini 3.5,这就很值得玩味了。
你想啊,它更像是在告诉外界,这不是一次小修小补,而是 Gemini 3 系列的版本重塑。

目前,模型还没正式放出来,外面已经有不少爆料,开始提前给它定调了。
早在这轮跳级命名曝光之前,Abacus.AI 的 CEO Bindu Reddy 就在 X 上披露过一组数据。
按照她的说法,早期 benchmark 显示,新一代 Gemini Flash 在编码和推理任务上,能达到 GPT-5.5 大约 92% 的性能,但推理成本只有 GPT-5.5 的十五分之一到二十分之一。

网友 Fandu 也曾扒到过模型选择器的最新界面,认为新一代 Gemini 很可能有较大调整。
不仅将原生支持 MCP 第三方工具接入,思维模式也从原来的独立 Thinking 模式,变成了全局开关,分 Standard 和 Extended 两档。

最后,还有一个比较有趣的事情。
x 上的 AI 圈知名爆料人 can,曾经披露过一批新一代 Gemini 的 SVG 输出样例。
一个是 DualShock 4 手柄的交互式蓝图拆解,另一个是鹈鹕骑自行车的矢量插画。


可以看到,新一代 Gemini 不只是生成一张图,而是带了 7 维定制面板,可以调车架颜色、光照、头饰、篮筐内容、蹬车速度。
这已经不是传统意义上的 SVG 生成了。更像是,一个 prompt 就能直接生成可以交互的小型 Web 应用。
不过,这些都还不是 Google 官方盖章的信息。
但不管这里面有多少营销预热,多少群众猜测,我们至少能得出一个很明确的信息。
新一代 Gemini 的升级重点,大概率不是单纯把模型分数往上推一点。
它瞄准的是一套更完整的能力组合。
我目前的猜测是,新一代 Gemini 很可能不会只围绕「模型智力」讲故事。
它更可能会把重点放在三个词上:快、便宜、能干活。
尤其是「快」这一点,我觉得可能是 Google 这次最想打穿的地方。
因为在 AI 编程这件事上,Gemini 不是完全不会写代码。
它的问题是,在开发者心里,Claude Code 和 Codex 已经先占住了位置。
很多人一想到 AI 编程,第一个反应不是 Gemini,这对 Google 来说就很尴尬。
所以它如果想重新杀回这个战场,更现实的打法是,先把用户最容易感知的体验打爆。
二、I/O大会马上来了
我亲测下来,还没有稳定能用的 Gemini 3.5 途径。
现在各种说法也比较混乱,有人说云端能用,有人说反重力里能用。
前面那位网友,是通过非官方 CPA 反代渠道,把它包装出来测的。

所以,如果你现在打开 Gemini、AI Studio 或者反重力没看到 Gemini 3.5,也很正常。 这波更像是发布前露出来的一些边角料。
真正关键的,还是马上到来的 Google I/O 大会。
Google I/O 2026 会在 5 月 19 到 20 日举行,主 keynote 是太平洋时间 5 月 19 日上午 10 点,也就是北京时间 5 月 20 日凌晨 1 点。
除了 Gemini 3.5,另一个最值得关注的产品,就是 Gemini Spark。
Spark 的前身是 Google 内部代号 Remy 的 Agent 升级版,谷歌准备做一个 24 小时在线的日常 AI Agent,去接管更长链路的任务。
Google 似乎还是更关注多模态系统。

不过,我现在也不太想把期待拉得太满。
OpenAI 靠高频迭代不断刷存在感,GPT-5.5 的效果大家已经看到了,模型能力还是第一。
Anthropic 则靠长久的稳定体验和开发者口碑,把 Claude Code 牢牢钉进了 AI 编程的主战场。
也就是说,留给 Google 的空间其实不多了。
如果它拿不出什么好东西,真的很难收场….










