Gemini 3.5 Flash泄露，网友实测，每秒1141token，快得吓人！-极客君

Gemini 3.5 快得有点不正常。

早上摸鱼刷帖的时候，看到有网友放出了一组疑似 Gemini 3.5 Flash 的实测，结果有点吓人。

d2b5ca33bd20260519185130

先说下速度：

第一组，首字延迟 6850 ms，每秒 934 tokens。

d2b5ca33bd20260519185149

第二组，首字延迟 7486 ms，每秒 923 tokens。

d2b5ca33bd20260519185202

第三组，首字延迟 4421 ms，每秒 577 tokens。

d2b5ca33bd20260519185213

第四组，首字延迟 3630 ms，每秒 673 tokens。

d2b5ca33bd20260519185223

它不是偶尔抽风快一次。

而是在不同任务里，稳定跑在一个非常夸张的速度区间。

更离谱的是写码：

d2b5ca33bd20260519185235

网友在实际写码场景里测出来，Gemini 3.5 最快可以达到 1141 tps，普通速度也有 900 tps上下。

这个数字有多夸张？

可以对比一下官网现在的 Gemini 3 Flash。

d2b5ca33bd20260519185250

谷歌官方对 Gemini 3 Flash 的定位，本来就已经是 built for speed。

在 Artificial Analysis 的 Google AI Studio 测试里，它的输出速度大概是 164.8 tokens/s，首字延迟大概是 6.95 秒。

拿这个做参照，网友测出来的速度，大概是官网 3F 的 3-7 倍。

虽然网友的测试口径和标准化 API 跑分还是有些区别，但这个差距也已经很惊人了。

接着，网友又测了 Gemini 3.5 的前端写代码能力。

先让它做一个 MC 沙盒游戏，从截图看，页面里已经有了方块地形、角色视角、游戏界面和操作区域。

d2b5ca33bd20260519185503

再做一组天气卡，看看效果。这个测试更偏 UI 审美，听起来简单，但其实特别容易暴露模型水平。

弱一点的模型，最后经常会做成一张表格，各种元素全都堆上去，能用，但很丑。

而能不能有层次地展现信息，是模型能否有审美的关键。

网友连续放了几张效果图，看下来还不错。

d2b5ca33bd20260519185518

d2b5ca33bd20260519185540

d2b5ca33bd20260519185547

最后是真实的网页效果，配色很高级，保持了 Gemini 一贯的前端审美水准。

d2b5ca33bd20260519185558

如果一个模型只是速度变快，那有可能是纯靠牺牲质量换速度。

但如果它速度暴涨，同时代码生成质量没有明显变化，那就完全是另一回事了。

另外，网友还测试了simple bench，稳定 9/10，概率全对，没有退步。

可以肯定，Gemini 3.5 不是一个为了速度牺牲质量的阉割版本。

一、版本重塑

按照惯例，新一代 Gemini 应该叫 Gemini 3.2。

但从网友 Lentils 的爆料来看，谷歌大概率会选择直接跳级命名为 Gemini 3.5，这就很值得玩味了。

你想啊，它更像是在告诉外界，这不是一次小修小补，而是 Gemini 3 系列的版本重塑。

d2b5ca33bd20260519185613

目前，模型还没正式放出来，外面已经有不少爆料，开始提前给它定调了。

早在这轮跳级命名曝光之前，Abacus.AI 的 CEO Bindu Reddy 就在 X 上披露过一组数据。

按照她的说法，早期 benchmark 显示，新一代 Gemini Flash 在编码和推理任务上，能达到 GPT-5.5 大约 92% 的性能，但推理成本只有 GPT-5.5 的十五分之一到二十分之一。

d2b5ca33bd20260519185624

网友 Fandu 也曾扒到过模型选择器的最新界面，认为新一代 Gemini 很可能有较大调整。

不仅将原生支持 MCP 第三方工具接入，思维模式也从原来的独立 Thinking 模式，变成了全局开关，分 Standard 和 Extended 两档。

d2b5ca33bd20260519185637

最后，还有一个比较有趣的事情。

x 上的 AI 圈知名爆料人 can，曾经披露过一批新一代 Gemini 的 SVG 输出样例。

一个是 DualShock 4 手柄的交互式蓝图拆解，另一个是鹈鹕骑自行车的矢量插画。

d2b5ca33bd20260519185650

d2b5ca33bd20260519185656

可以看到，新一代 Gemini 不只是生成一张图，而是带了 7 维定制面板，可以调车架颜色、光照、头饰、篮筐内容、蹬车速度。

这已经不是传统意义上的 SVG 生成了。更像是，一个 prompt 就能直接生成可以交互的小型 Web 应用。

不过，这些都还不是 Google 官方盖章的信息。

但不管这里面有多少营销预热，多少群众猜测，我们至少能得出一个很明确的信息。

新一代 Gemini 的升级重点，大概率不是单纯把模型分数往上推一点。

它瞄准的是一套更完整的能力组合。

我目前的猜测是，新一代 Gemini 很可能不会只围绕「模型智力」讲故事。

它更可能会把重点放在三个词上：快、便宜、能干活。

尤其是「快」这一点，我觉得可能是 Google 这次最想打穿的地方。

因为在 AI 编程这件事上，Gemini 不是完全不会写代码。

它的问题是，在开发者心里，Claude Code 和 Codex 已经先占住了位置。

很多人一想到 AI 编程，第一个反应不是 Gemini，这对 Google 来说就很尴尬。

所以它如果想重新杀回这个战场，更现实的打法是，先把用户最容易感知的体验打爆。

二、I/O大会马上来了

我亲测下来，还没有稳定能用的 Gemini 3.5 途径。

现在各种说法也比较混乱，有人说云端能用，有人说反重力里能用。

前面那位网友，是通过非官方 CPA 反代渠道，把它包装出来测的。

d2b5ca33bd20260519185713

所以，如果你现在打开 Gemini、AI Studio 或者反重力没看到 Gemini 3.5，也很正常。这波更像是发布前露出来的一些边角料。

真正关键的，还是马上到来的 Google I/O 大会。

Google I/O 2026 会在 5 月 19 到 20 日举行，主 keynote 是太平洋时间 5 月 19 日上午 10 点，也就是北京时间 5 月 20 日凌晨 1 点。

除了 Gemini 3.5，另一个最值得关注的产品，就是 Gemini Spark。

Spark 的前身是 Google 内部代号 Remy 的 Agent 升级版，谷歌准备做一个 24 小时在线的日常 AI Agent，去接管更长链路的任务。

Google 似乎还是更关注多模态系统。

d2b5ca33bd20260519185724

不过，我现在也不太想把期待拉得太满。

OpenAI 靠高频迭代不断刷存在感，GPT-5.5 的效果大家已经看到了，模型能力还是第一。

Anthropic 则靠长久的稳定体验和开发者口碑，把 Claude Code 牢牢钉进了 AI 编程的主战场。

也就是说，留给 Google 的空间其实不多了。

如果它拿不出什么好东西，真的很难收场….

文章版权声明 1、本站所有文章均为原创技术内容，受《中华人民共和国著作权法》保护。
2、文中提及的第三方工具、开源项目或服务，其版权归属原作者；本站仅作技术介绍与使用演示，不提供下载或修改版本。
3、所有推荐工具均可通过官方渠道免费获取，本站不存储、分发或托管任何软件资源。
4、如您认为内容侵犯您的权益，请联系邮箱 admin@jikejun.com，我们将及时处理。
5、本站内容仅供个人学习与技术交流使用，禁止用于商业用途、内容聚合、AI 模型训练或自动化采集。
6、转载须注明出处（极客君 jikejun.com）并保留原文链接，未经许可不得用于盈利场景。

THE END