微信扫码
添加专属顾问
我要投稿
深入了解GGUF文件格式,掌握大模型部署的关键技术。 核心内容: 1. GGUF格式的定义及其设计目的 2. GGUF格式在大模型部署中的优势 3. GGUF格式的高效性与量化支持应用实例
模型有 32×10**9个参数。
总字节数=32×10**9×2=64×10**9字节=64GB
总位数(量化后)=32×10**9×4=128×10**9位
FROM C:/Users/admin/.ollama/models/DeepSeek-R1-Distill-Qwen-7B-GGUF/DeepSeek-R1-Distill-Qwen-7B-Q8_0.ggufPARAMETER temperature 0.6SYSTEM """你是乐于助人的帮手,擅长中文多轮对话,回答需严谨且符合事实。>"""
ollama create model-name -f Modelfile
ollama create deepseek-r1-distill-qwen-7b -f ./Modelfile
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-24
精华:去哪儿网AI Coding研发平台实践,值得读三遍的样本
2026-06-24
做 FDE 的第一步不是写代码,而是把客户问题拆到能验收
2026-06-24
Claude学会常驻Slack,AI协作变天了
2026-06-23
微信6年来最大改版——关于微信AI助手小微的15条思考
2026-06-23
Loop Engineering 实战笔记:让 Agent 自己发现、执行和复盘
2026-06-23
微信 AI 小微初体验
2026-06-23
暴论:Agent Skill 会被淘汰
2026-06-23
ClaudeCode团队负责人最新访谈:AI原生团队,到底如何运转?(5条底层逻辑)
2026-04-15
2026-04-07
2026-04-07
2026-03-31
2026-04-24
2026-04-17
2026-03-31
2026-04-05
2026-04-02
2026-04-05
2026-06-18
2026-06-18
2026-06-10
2026-06-10
2026-06-07
2026-06-06
2026-06-03
2026-06-02