手机也能跑!刚刚,谷歌 Gemma 4 满血开源:首次 Apache 2.0,免费商用

谷歌这次动真格了。

刚刚,满血版 Gemma 4 模型开源,310 亿参数。

干掉了参数量 20 倍的对手。Arena AI 排行榜,开源模型全球第三。

排在它前面的都是国产模型,智谱 GLM-5 和月之暗面 Kimi K2.5

图片[1]-手机也能跑!刚刚,谷歌 Gemma 4 满血开源:首次 Apache 2.0,免费商用-极客君

Gemma 4 系列有四个模型,从满血版到手机上能跑的迷你版。

更重要的是,之前 Gemma 一直用谷歌自己写的限制性协议,这次全部换成了 Apache 2.0。


Gemma 3 能力其实不差。但许可证是谷歌自己写的,限制了一堆使用场景,而且谷歌随时能单方面改条款。

Moody’s 机器学习总监 Han-Chung Lee 当时就评价,「没法商用」。很多团队直接转头去用阿里 Qwen 和 DeepSeek。它们从一开始就是 Apache 2.0 和 MIT 开源协议。

谷歌自己的模型,被自己写的协议绊住了。

科技媒体 VentureBeat 报道,「打了引号的开源,不是真开源。」

这次的 Gemma 4,没有自定义条款,没有使用限制,谷歌也没法单方面改规则。拿去商用、魔改、再分发,都随便。

图片[2]-手机也能跑!刚刚,谷歌 Gemma 4 满血开源:首次 Apache 2.0,免费商用-极客君


310 亿参数干到全球开源第三。谷歌说这叫「intelligence-per-parameter」,每个参数的「智商」都榨干了。

Gemma 4 31B,AIME 2026 数学竞赛 89.2%,GPQA Diamond 科学推理 84.3%,LiveCodeBench v6 编程 80.0%。Elo 评分 1452。一张 80GB 的 H100 就能跑,量化版消费级显卡也扛得住。

图片[3]-手机也能跑!刚刚,谷歌 Gemma 4 满血开源:首次 Apache 2.0,免费商用-极客君

26B AIME 88.3%,GPQA Diamond 82.3%,LiveCodeBench 77.1%。总参数 260 亿,推理时只激活 38 亿。用 38 亿参数的算力开销,跑出 260 亿参数的效果。Arena 排行榜开源第六。

手机版 E4B 和 E2B,谷歌与高通、联发科合作优化。手机、树莓派、NVIDIA Jetson Nano,完全离线运行。原生支持图像、视频和语音输入,128K 上下文。也是下一代 Gemini Nano 4 的基础。

全部基于 Gemini 3 同源技术,支持 140 多种语言。大模型(31B26B)上下文 256K。


Hugging Face 拿到了预发布版测试。

「我们想找个案例证明微调有用,结果发现原版就够强了,找不着。」

Hugging Face CEO Clément Delangue 评价,「里程碑式的进步」。Unsloth 团队第一时间放出量化版,反馈「效果非常好」。

图片[4]-手机也能跑!刚刚,谷歌 Gemma 4 满血开源:首次 Apache 2.0,免费商用-极客君

Gemma 4 发布第一天就支持 Transformers、llama.cpp、MLX、Ollama、vLLM、NVIDIA NIM、LM Studio。Ollama 上运行 ollama run gemma4 直接启动。

Gemma 自初代以来,开发者累计下载超过 4 亿次,社区做了 10 万多个微调变体。权重在 Hugging Face、Kaggle、Ollama 都能下载,31B 和 26B 去谷歌 AI Studio 免费体验,小模型去 AI Edge Gallery。

图片[5]-手机也能跑!刚刚,谷歌 Gemma 4 满血开源:首次 Apache 2.0,免费商用-极客君


Qwen 是 Apache 2.0,DeepSeek 是 MIT。都是「真开源」。

谷歌到第四代,终于跟上了。

Hugging Face 下载地址:https://huggingface.co/collections/google/gemma-4Ollama 下载地址:https://ollama.com/library/gemma4

© 版权声明
THE END
喜欢就支持一下吧
点赞8赞赏 分享