Gemini 3.5 Flash泄露,网友实测,每秒1141token,快得吓人!

Gemini 3.5 快得有点不正常。

早上摸鱼刷帖的时候,看到有网友放出了一组疑似 Gemini 3.5 Flash 的实测,结果有点吓人。

d2b5ca33bd20260519185130

先说下速度:

第一组,首字延迟 6850 ms,每秒 934 tokens。

d2b5ca33bd20260519185149

第二组,首字延迟 7486 ms,每秒 923 tokens。

d2b5ca33bd20260519185202

第三组,首字延迟 4421 ms,每秒 577 tokens。

d2b5ca33bd20260519185213

第四组,首字延迟 3630 ms,每秒 673 tokens。

d2b5ca33bd20260519185223

它不是偶尔抽风快一次。

而是在不同任务里,稳定跑在一个非常夸张的速度区间。

更离谱的是写码:

d2b5ca33bd20260519185235

网友在实际写码场景里测出来,Gemini 3.5 最快可以达到 1141 tps,普通速度也有 900 tps上下。

这个数字有多夸张?

可以对比一下官网现在的 Gemini 3 Flash。

d2b5ca33bd20260519185250

谷歌官方对 Gemini 3 Flash 的定位,本来就已经是 built for speed。

在 Artificial Analysis 的 Google AI Studio 测试里,它的输出速度大概是 164.8 tokens/s,首字延迟大概是 6.95 秒。

拿这个做参照,网友测出来的速度,大概是官网 3F 的 3-7 倍。

虽然网友的测试口径和标准化 API 跑分还是有些区别,但这个差距也已经很惊人了。

接着,网友又测了 Gemini 3.5 的前端写代码能力。

先让它做一个 MC 沙盒游戏,从截图看,页面里已经有了方块地形、角色视角、游戏界面和操作区域。

d2b5ca33bd20260519185503

再做一组天气卡,看看效果。这个测试更偏 UI 审美,听起来简单,但其实特别容易暴露模型水平。

弱一点的模型,最后经常会做成一张表格,各种元素全都堆上去,能用,但很丑。

而能不能有层次地展现信息,是模型能否有审美的关键。

网友连续放了几张效果图,看下来还不错。

d2b5ca33bd20260519185518

d2b5ca33bd20260519185540

d2b5ca33bd20260519185547

最后是真实的网页效果,配色很高级,保持了 Gemini 一贯的前端审美水准。

d2b5ca33bd20260519185558

如果一个模型只是速度变快,那有可能是纯靠牺牲质量换速度。

但如果它速度暴涨,同时代码生成质量没有明显变化,那就完全是另一回事了。

另外,网友还测试了simple bench,稳定 9/10,概率全对,没有退步。

可以肯定,Gemini 3.5 不是一个为了速度牺牲质量的阉割版本。

一、版本重塑

按照惯例,新一代 Gemini 应该叫 Gemini 3.2。

但从网友 Lentils 的爆料来看,谷歌大概率会选择直接跳级命名为 Gemini 3.5,这就很值得玩味了。

你想啊,它更像是在告诉外界,这不是一次小修小补,而是 Gemini 3 系列的版本重塑。

d2b5ca33bd20260519185613

目前,模型还没正式放出来,外面已经有不少爆料,开始提前给它定调了。

早在这轮跳级命名曝光之前,Abacus.AI 的 CEO Bindu Reddy 就在 X 上披露过一组数据。

按照她的说法,早期 benchmark 显示,新一代 Gemini Flash 在编码和推理任务上,能达到 GPT-5.5 大约 92% 的性能,但推理成本只有 GPT-5.5 的十五分之一到二十分之一。

d2b5ca33bd20260519185624

网友 Fandu 也曾扒到过模型选择器的最新界面,认为新一代 Gemini 很可能有较大调整。

不仅将原生支持 MCP 第三方工具接入,思维模式也从原来的独立 Thinking 模式,变成了全局开关,分 Standard 和 Extended 两档。

d2b5ca33bd20260519185637

最后,还有一个比较有趣的事情。

x 上的 AI 圈知名爆料人 can,曾经披露过一批新一代 Gemini 的 SVG 输出样例。

一个是 DualShock 4 手柄的交互式蓝图拆解,另一个是鹈鹕骑自行车的矢量插画。

d2b5ca33bd20260519185650

d2b5ca33bd20260519185656

可以看到,新一代 Gemini 不只是生成一张图,而是带了 7 维定制面板,可以调车架颜色、光照、头饰、篮筐内容、蹬车速度。

这已经不是传统意义上的 SVG 生成了。更像是,一个 prompt 就能直接生成可以交互的小型 Web 应用。

不过,这些都还不是 Google 官方盖章的信息。

但不管这里面有多少营销预热,多少群众猜测,我们至少能得出一个很明确的信息。

新一代 Gemini 的升级重点,大概率不是单纯把模型分数往上推一点。

它瞄准的是一套更完整的能力组合。

我目前的猜测是,新一代 Gemini 很可能不会只围绕「模型智力」讲故事。

它更可能会把重点放在三个词上:快、便宜、能干活。

尤其是「快」这一点,我觉得可能是 Google 这次最想打穿的地方。

因为在 AI 编程这件事上,Gemini 不是完全不会写代码。

它的问题是,在开发者心里,Claude Code 和 Codex 已经先占住了位置。

很多人一想到 AI 编程,第一个反应不是 Gemini,这对 Google 来说就很尴尬。

所以它如果想重新杀回这个战场,更现实的打法是,先把用户最容易感知的体验打爆。

二、I/O大会马上来了

我亲测下来,还没有稳定能用的 Gemini 3.5 途径。

现在各种说法也比较混乱,有人说云端能用,有人说反重力里能用。

前面那位网友,是通过非官方 CPA 反代渠道,把它包装出来测的。

d2b5ca33bd20260519185713

所以,如果你现在打开 Gemini、AI Studio 或者反重力没看到 Gemini 3.5,也很正常。 这波更像是发布前露出来的一些边角料。

真正关键的,还是马上到来的 Google I/O 大会。

Google I/O 2026 会在 5 月 19 到 20 日举行,主 keynote 是太平洋时间 5 月 19 日上午 10 点,也就是北京时间 5 月 20 日凌晨 1 点。

除了 Gemini 3.5,另一个最值得关注的产品,就是 Gemini Spark。

Spark 的前身是 Google 内部代号 Remy 的 Agent 升级版,谷歌准备做一个 24 小时在线的日常 AI Agent,去接管更长链路的任务。

Google 似乎还是更关注多模态系统。

d2b5ca33bd20260519185724

不过,我现在也不太想把期待拉得太满。

OpenAI 靠高频迭代不断刷存在感,GPT-5.5 的效果大家已经看到了,模型能力还是第一。

Anthropic 则靠长久的稳定体验和开发者口碑,把 Claude Code 牢牢钉进了 AI 编程的主战场。

也就是说,留给 Google 的空间其实不多了。

如果它拿不出什么好东西,真的很难收场….

© 版权声明
THE END
喜欢就支持一下吧
点赞11赞赏 分享