Hermes Agent 部署 UI + 本地模型 Gemma 4,对接微信(完全免费,无需 Tokens)

如果你想打造一个完全本地运行、无需 API Key、可接入微信的 AI 助手系统,这套方案可以说是目前最香的组合之一:Hermes Agent + WebUI + Ollama + Gemma 4 ,不仅免费,而且隐私可控、可扩展性极强,非常适合做自动化助手、私域 AI、甚至商业化探索。

d2b5ca33bd20260424192532

一、整体架构说明

先快速理解一下整体结构:

  • Ollama + Gemma 4  本地大模型推理
  • Hermes Agent  AI Agent 调度核心
  • Hermes WebUI  可视化操作界面
  • 微信接入  实现真实应用场景

二、下载本地模型(Ollama + Gemma 4)

首先,我们需要准备本地大模型环境。

 安装 Ollama

官网安装: 【点击前往】 下载最新版

安装完成后,拉取 Gemma 4 模型:

ollama run gemma4

你也可以选择更大版本,比如 26B / 31B,看你电脑配置)

获取 API 地址

Ollama 默认会启动本地服务:http://127.0.0.1:11434

但 Hermes Agent 需要用你局域网 IP来访问。

在 CMD 输入:

ipconfig

找到类似: IPv4 地址 . . . . . . . . . . . : 192.168.1.228

那么你的 API 地址就是: http://192.168.1.228:11434/v1

这个地址非常关键,后面要填到 Hermes 配置里!

三、部署 WSL 2(Linux 子系统)

Hermes Agent 官方推荐 Linux 环境,这里我们用 WSL2

前期准备:

在开始之前,建议大家安装下 Windows Terminal,它是一款新式、快速、高效、强大且高效的Windows 的终端程序,适用于命令行工具和命令提示符,PowerShell和 WSL 等 Shell 用户。可以方便我们切换不同的系统!

点击下载

d2b5ca33bd20260424192725

一、安装 WSL2

在 PowerShell(管理员)执行:

wsl –install

安装完成后电脑,然后安装Ubuntu

wsl –install -d Ubuntu

检查版本:

wsl –version

确保输出结果是:WSL2

四、部署 Hermes Agent + UI

进入 Ubuntu 后,开始核心部署。

 安装 Hermes Agent

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装完成后可以执行

hermes doctor

检查环境是否正常。

 安装 Hermes WebUI

git clone https://github.com/nesquena/hermes-webui.git hermes-webui
cd hermes-webui
./start.sh

启动后,一般访问:

http://127.0.0.1:8787

即可打开UI界面。

Mac 系统一键部署命令:

git clone https://github.com/nesquena/hermes-webui.git hermes-webui
cd hermes-webui
python3 bootstrap.py

引导程序将:

  1. 检测 Hermes Agent,如果缺少,则尝试使用官方安装程序(curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash)。
  2. 查找或创建包含 WebUI 依赖项的 Python 环境。
  3. 启动 Web 服务器并等待/health
  4. 除非通过验证,否则请打开浏览器--no-browser
  5. 将您直接导入 WebUI 中的首次运行引导向导。

五、配置 Hermes 对接本地 Gemma 4

运行:

hermes setup

进入配置界面后:

关键配置项:

  • Model Provider:选择 OpenAI Compatible
  • Base URL:填入你的 Ollama 地址
    http://192.168.1.228:11434/v1
  • Model Name
    gemma4

如果提示上下文不足(比如你之前遇到的 8K 限制问题):

可以修改:

model:
context_length: 8192

或者换更大的模型。

六、Hermes Agent 对接微信(重点)

 进入配置

hermes setup

 选择微信接入

找到:

messaging platforms

选择:

weixin / wechat

扫码登录

系统会弹出二维码:

用微信扫码登录即可完成绑定

 完成效果

完成后你就拥有:

  • 一个微信 AI 助手
  • 基于本地模型(无需 API)
  • 可执行自动化任务(Agent能力)

七、最终效果展示

部署完成后,你的系统具备:

  • 本地 AI(Gemma 4)
  • 可视化 UI 管理
  • 微信实时对话
  • 无需 Token / 无费用
  • 完全私有化部署

八、常见问题(避坑指南)

1. 模型上下文不足报错

错误示例:

context window too small

解决:

  • 换更大模型(如 7B+)
  • 或手动设置 context_length

2. Ollama 无法被访问

检查:

  • 是否用的是 127.0.0.1
  • 是否改为局域网 IP

3. WebUI 无法打开

尝试:

./start.sh

或者检查端口占用。

4. 微信掉线问题

这是微信协议限制,建议:

  • 保持 Hermes 常驻运行
  • 避免频繁重启

九、总结

这套方案的核心价值在于:

零成本 + 本地化 + 可扩展 AI Agent

相比传统 OpenAI API 方案:

  • 不用花钱
  • 不怕封号
  • 数据更安全

如果你做:

  • 私域流量运营
  • 自动客服
  • AI 工具开发

这套架构非常值得你深入研究。

© 版权声明
THE END
喜欢就支持一下吧
点赞6赞赏 分享