微信扫码
添加专属顾问
我要投稿
OpenAI开源高性能语言模型gpt-oss-20b,性能对标GPT-3.5,现在可用免费GPU算力体验部署! 核心内容: 1. OpenAI开源gpt-oss-20b模型的特点与优势 2. 飞桨AI Studio免费GPU算力资源介绍 3. 详细部署步骤与使用指南
OpenAI 正式发布开源语言模型 gpt-oss-120b 与 gpt-oss-20b。这是自 GPT-2 以来,OpenAI 首次开放高性能语言模型的权重,并且采用了灵活的 Apache 2.0 开源协议,允许开发者自由使用、部署甚至定制。
其中,gpt-oss-20b性能对标GPT-3.5(o3-mini),需16GB显存运行,可部署于消费级设备、本地推理、离线使用等场景。如果你没有足够强的显卡,可使用飞桨AI Studio免费GPU算力部署体验gpt-oss-20b。
飞桨AI Studio每日免费提供GPU算力资源,具体配置如下:
打开https://aistudio.baidu.com/account
,点击右上方“登录”按钮,用百度账号登录即可。
打开https://aistudio.baidu.com/my/project
,点击右上方“创建项目”,选择“Notebook”,会弹出下方的对话框。填写“项目名称”,点击创建。
注意:文件需要保存到/home/aistudio/work目录才能持久化保存。
飞桨AI Studio无法访问github,需通过代理网站ghproxy.cn进行下载。命令如下
cd ~/work
wget -c https://ghproxy.cn/https://github.com/ollama/ollama/releases/download/v0.11.3/ollama-linux-amd64.tgz
tar zxf ollama-linux-amd64.tgz
通过环境变量OLLAMA_MODELS指定模型的存放目录为 ~/work/models,并启动ollama服务
mkdir -p ~/work/models && export OLLAMA_MODELS=~/work/models
~/work/bin/ollama serve
新建终端,输入命令下载gpt-oss模型
~/work/bin/ollama pull gpt-oss
如果发现下载速度低于2MB/s,可尝试重新执行pull(但不要重启ollama serve的进程)。
通过环境变量OLLAMA_MODELS指定模型的存放目录为 ~/work/models,并启动ollama服务
mkdir -p ~/work/models && export OLLAMA_MODELS=~/work/models
~/work/bin/ollama serve
新建终端,输入以下命令查看
~/work/bin/ollama list
输出结果可以看到gpt-oss的信息
NAME ID SIZE MODIFIED
gpt-oss:latest f2b8351c629c 13 GB 6 minutes ago
新建终端,输入以下命令启动gpt-oss
~/work/bin/ollama run gpt-oss
运行成功后就可以开始体验gpt-oss了。
本文介绍利用飞桨AI Studio每日免费提供GPU算力资源部署体验gpt-oss。进一步,还可以通过frp内网穿透让windows部署的智能体开发平台(例如dify和Coze Studio)连接飞桨服务器上部署的ollama。另外,我们也可以利用GPU算力学习其它知识:模型微调,模型训练,深度学习训练等。
如果您觉得本文对您有帮助,欢迎关注、点赞、转发、推荐
#ai #openai #chatgpt #免费GPU算力 #飞桨
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-29
如何评测 AI 智能体:试试字节开源的扣子罗盘
2025-08-29
HiMarket 正式开源,为企业落地开箱即用的 AI 开放平台
2025-08-28
美团 M17 团队开源 Meeseeks 评测集:揭秘大模型的 “听话”能力
2025-08-28
我摊牌了,PDF的终结者出现了!这个开源神器,让你的RAG项目吞吐能力暴增10倍!
2025-08-28
面壁开源多模态新旗舰MiniCPM-V 4.5,8B 性能超越 72B,高刷视频理解又准又快
2025-08-28
1.9K Star 微软开源TTS王炸!90分钟超长语音合成,4人对话自然切换!
2025-08-27
初探:从0开始的AI-Agent开发踩坑实录
2025-08-27
ollama v0.11.7发布:深度集成DeepSeek-V3.1与Turbo云端推理模式解析
2025-07-23
2025-06-17
2025-08-20
2025-06-17
2025-07-23
2025-08-05
2025-07-14
2025-08-20
2025-07-29
2025-07-12