微信扫码
添加专属顾问
我要投稿
仅4B参数却能匹敌9B模型,这款GUI小模型实测效果惊人,资源占用更低! 核心内容: 1. GELab-Zero-4B模型实测性能对比AutoGLM-9B 2. 详细部署教程与量化资源优化方案 3. 三类任务测试结果与局限性分析
大家好,我是刘聪NLP。
昨天分享完智谱的AutoGLM,就有好友凌晨1点多给我发消息,说阶跃也有一个GUI的模型,而且只有4B。
我看了一下,是GELab-Zero-4B-preview模型,这个模型我自己台式机4070super 12G就能部署。相较于AutoGLM来说,资源就少了很多。
同时,还可以量化,进一步减少资源,但是部署到手机上,端侧推理的话,速度应该还是不行。
Github:https://github.com/stepfun-ai/gelab-zero
HF:https://huggingface.co/stepfun-ai/GELab-Zero-4B-preview
PS:对4B大小是不是很敏感,没错,是基于Qwen3-VL-4B-Instruct增量训练的。
然后整个Agent控制手机的原理也跟AutoGLM原理一致,也是通过截图识别元素、ADB来控制。
直接上测试结果,
昨天AutoGLM没有成功的蚂蚁森林的能量收集任务,经过7min的等待,GELab-Zero-4B完成了。但是,应该还是因为模型太小,还有就是页面有个“1t”能量的干扰,中间重复了很多次,做了一些错误的决策,不够最后还是把能量球全部收集成功了,
中等任务:打开小红书,发一篇大字报内容,阶跃4B的GUI模型也这么强吗?而且比AutoGLM-9B小一半。
完全自动发布,
其实这个任务还是蛮简单的,并不复杂。
高阶任务:打开12306,帮我订一张本周六从苏州到南京的高铁票,时间是早上9点左右
可以看出,GELab-Zero-4B每次执行的速度是很快的,但是相较于AutoGLM来说,执行的轮数会更多一些。
我整体测试下来,
然后跟AutoGLM一样,GELab-Zero的Github写的也是十分详细,基本上跟走从头走一边是没有啥问题的。
昨天AutoGLM部署流程中的,vllm模型部署、ADB安装部分是一样的,直接可以服用。
因为这个模型我是在本地台式机部署的,就用Ollama给大家部署一下。
ollama部署,
先去ollama官网下载对应安装包,我是windows电脑,所以直接下载windows版本
https://ollama.com/download
下载完成后,双击OllamaSetup.exe,点击Install后,开始安装,
PS:Ollama默认安装在C盘,且不支持自定义安装路径。
安装后,配置启动程序到Path环境变量,
C:\Users\admin\AppData\Local\Programs\Ollama
按键windows+r打开运行,输入sysdm.cpl,回车;高级->环境变量->系统变量->Path
然后命令行,查看ollama版本
ollama --version
下载模型,依旧modelscope,真的很快
modelscope download --model stepfun-ai/GELab-Zero-4B-preview --local_dir ./GELab-Zero-4B-preview
然后进入到下载的GELab-Zero-4B-preview文件夹中,创建ollama文件
ollama create gelab-zero-4b -f Modelfile
当然这里,如果需要进行模型量化,这样模型占用资源会更小,但是也会有精度的损失。
# int8量化
ollama create -q q8_0 gelab-zero-4b
# int4量化
ollama create -q Q4_K_M gelab-zero-4b
启动ollama服务
ollama serve
通过postman请求
接下来就是PC端和手机端ADB的按照, 就看AutoGLM真好玩,附保姆级教程的这一部分吧,是一模一样的。
不过这个GELab-Zero项目里,输入法不用选择“ADB Keyboard”。
然后把项目clone到你的本地,就可以启动你的服务了,
python examples/run_single_task.py "打开微信,给老婆大人发helloword"
缺啥包装啥包就行,你也可以直接requirements文件先安装
pip install -r requirements.txt
记得几个地方可以修改,
最一开始的webui是我一句话vibe出来的,不想看命令行,看页面的,
我vibe的代码,后台私信发gelab-zero获取。
最后,
gelab-zero-4b这个模型算是又打破了我的认知,
模型效果也是杠杠的,简单中等的任务执行的都很好,
复杂任务,有时候会陷入循环,这还是有待改进,
毕竟模型参数只有4B,
但是一些场景上,真不比9b的autoglm差,甚至执行的更好
所以对手机上部署模型,
搓豆包手机的信息越来越足了,哈哈哈
端侧,未来可期~
PS:都看到这里,来个点赞、在看、关注吧。 您的支持是我坚持的最大动力!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-12
Anthropic官方万字长文:AI Agent评估的系统化方法论
2026-01-12
Claude Code 源码揭秘:为什么不造 100 个工具?一个 Bash 打天下的哲学
2026-01-12
Anthropic工程实践:AI Agent如何连续工作数天完成复杂项目?
2026-01-12
2026大模型伦理深度观察:理解AI、信任AI、与AI共处
2026-01-12
阿里云全新发布的 UModel 是什么
2026-01-12
Claude Skills 到底是什么?万字长文深度解析
2026-01-12
Agent Skill 即将统治一切?Claude Code 2.1.3 把斜杠命令"杀"了
2026-01-12
如何用AI表格低门槛手搓一个业务系统?
2025-10-26
2025-11-19
2025-10-20
2025-11-13
2025-10-18
2025-10-21
2025-10-15
2025-11-03
2025-10-23
2025-10-22
2026-01-12
2026-01-12
2026-01-11
2026-01-10
2026-01-10
2026-01-08
2026-01-02
2025-12-31