微信扫码
添加专属顾问
小模型也能有大智慧!10分钟微调让0.6B模型媲美235B大模型,现在开放免费体验。 核心内容: 1. 模型蒸馏原理:用小模型学习大模型生成的数据 2. 三步实操指南:数据准备、模型微调、效果验证 3. 免费体验方案:GPU云服务器+ms-swift框架一键操作
大参数模型效果好,但成本高、响应慢。为了在保障效果的同时提升推理速度、降低成本,可首先借助大参数模型完成目标任务的数据生成,并使用这些数据微调小参数模型,使其在特定任务中达到接近大参数模型的表现,这一过程也被称为模型蒸馏。
本方案将以从一句话中提取结构化信息(如收件人、地址、电话)为例,演示如何通过模型蒸馏,让 Qwen3-0.6B 模型在此任务上达到大参数模型的表现。
先来看效果对比吧。经过了模型优化后,识别能力确实有所提高。
当前,《基于 GPU 云服务器微调 Qwen3 模型》技术方案开放免费体验,您只需要点击文末阅读原文即可开启。
如果您想免费体验更多技术解决方案,可以登录aliyun.com,点击权益中心-解决方案免费试用领取100点试用点。
一、方案路线
1. 数据准备
由于真实的物流填单数据涉及到用户隐私,我们将使用一批虚拟地址描述信息作为输入,并使用 Qwen3-235B-A22B 作为教师模型提取结构化的信息作为输出。
建议您在模型微调时使用业务场景的真实数据。
2. 模型微调
在获取教师模型的输入输出后,我们可以使用该数据来微调 Qwen3-0.6B 模型,提升其在此任务场景下的表现。这里我们将使用魔搭社区提供的 ms-swift 框架,即使您不了解微调算法的细节,依然可以借通过一行命令来完成微调任务。
3. 效果验证
最后,为了确保模型在真实业务场景中的稳定性与准确性,建议在部署到生产环境前准备评测数据与评测标准,对微调后的模型进行效果验证。
二、配置计算环境
大模型微调对计算环境有较高要求,需配套安装合适版本的 GPU 驱动、CUDA(NVIDIA的并行计算平台和编程模型)和 cuDNN(NVIDIA的深度神经网络加速库)。手动通过命令行安装不仅步骤繁琐,而且容易出错。为提升部署效率,您可在创建 GPU 云服务器实例时选择带有 GPU 驱动的镜像,省去复杂的命令行操作,快速启动微调任务。
我们推荐用免费试用的方式体验本方案。免费试用助您零成本体验本解决方案,但试用期间创建的资源与数据在结束后会被清除。免费试用的时长有限,若需长期使用云资源,可以参考:
https://www.aliyun.com/solution/tech-solution-deploy/2925027?utm_content=g_1000405783 页面中手动创建部分。
1. 根据页面提示,领取试用点并创建资源,右侧将实时展示资源创建进程。可能需要等待几分钟。
2. 连接 GPU 云服务器
在跳转页面中,使用左侧的登录名称与登录密码登录。
单击左侧的远程连接按钮,再单击登录,即可连接到 GPU 云服务器。
三、下载并微调模型
微调模型通常上手门槛较高。通过魔搭社区提供的 ms-swift 框架,您仅需一句命令即可快速启动微调任务,大幅降低操作复杂度。
1.安装依赖
本方案依赖以下两个核心组件:
ms-swift
魔搭社区提供的训练框架,支持模型的下载、微调和权重合并,极大简化了微调流程。
vllm
用于部署微调后的模型,支持高性能推理服务,不仅方便验证微调效果,还可用于生成 API,供业务方直接调用。
您可以在终端运行以下命令来安装依赖:
pip3 install vllm==0.9.0.1 ms-swift==3.5.0
安装依赖大约需要5分钟。
2.模型微调
运行以下命令可以完成模型下载、微调、合并权重的操作:
# 进入 /root 目录cd /root && \# 下载微调脚本 sft.shcurl -f -o sft.sh "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250623/cggwpz/sft.sh" && \# 执行微调脚本bash sft.sh
模型微调核心代码如下,您可以在 sft.sh 文件中看到:
dataset 参数指定的'train.jsonl'为数据准备步骤获得的训练集。
swift sft \ --model Qwen/Qwen3-0.6B \ --train_type lora \ --dataset 'train.jsonl' \ --torch_dtype bfloat16 \ --num_train_epochs 10 \ --per_device_train_batch_size 20 \ --per_device_eval_batch_size 20 \ --learning_rate 1e-4 \ --lora_rank 8 \ --lora_alpha 32 \ --target_modules all-linear \ --gradient_accumulation_steps 16 \ --save_steps 1 \ --save_total_limit 2 \ --logging_steps 2 \ --max_length 2048 \ --output_dir output \ --warmup_ratio 0.05 \ --dataloader_num_workers 4
微调模型大约需要10分钟,期间会实时打印如下所示的模型在训练集与验证集的损失变化情况:
出现以下信息表明模型微调已完成:
✓ swift export 命令执行成功检查合并结果...✓ 合并目录创建成功: output/v0-xxx-xxx/checkpoint-50-merged✓ LoRA权重合并完成!合并后的模型路径: output/v0-xxx-xxx/checkpoint-50-merged
完成该步骤会在output/v0-xxx-xxx路径下生成带有 merged 后缀的文件夹,为微调后的模型文件。
您可以在output/v0-xxx-xxx路径下中找到 images 文件夹,打开 train_loss.png(反映训练集损失) 与 eval_loss.png(反映验证集损失),根据损失值的变化趋势初步判断当前模型的训练效果:
在结束训练前 train_loss 与 eval_loss 仍有下降趋势(欠拟合)
您可以增加 num_train_epochs(训练轮次,与训练深度正相关) 参数,或适当增大 lora_rank(低秩矩阵的秩,秩越大,模型能表达更复杂的任务,但更容易过度训练)的值后再进行训练,加大模型的对训练数据的拟合程度;
在结束训练前 train_loss 持续下降,eval_loss 开始变大(过拟合)
您可以减少 num_train_epochs 参数,或适当减小lora_rank的值后再进行训练,防止模型过度训练;
在结束训练前 train_loss 与 eval_loss 均处于平稳状态(良好拟合)
模型处于该状态时,您可以进行后续步骤。本方案的 train_loss 与 eval_loss 变化如下表所示:
train_loss | eval_loss |
如果训练失败,您也可以尝试调整 learning_rate等参数。
四、验证效果
在将微调后的模型部署到实际业务环境前,我们建议先对其效果进行系统性的评测。只有通过充分验证,才能确保模型具备良好的稳定性和准确性,避免上线后出现意料之外的问题。
1.准备测试数据
测试数据的格式应与训练数据一致,以确保评测的可比性。
测试数据应使用区别于训练数据的全新样本用于测试。这样可以更准确地反映模型在新数据上的泛化能力,避免因“见过的样本”导致分数虚高。
您可以运行以下命令获取我们准备好的测试数据:
cd /root && \# 下载测试数据 test.jsonlcurl -o test.jsonl "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250610/mhxmdw/test_with_system.jsonl"
以下两行示例样本供您参考:
{"messages": [{"role": "system", "content": "你是一个专业的信息抽取助手,专门负责从中文文本中提取收件人的JSON信息,包含的Key有province(省份)、city(城市名称)、district(区县名称)、specific_location(街道、门牌号、小区、楼栋等详细信息)、name(收件人姓名)、phone(联系电话)"}, {"role": "user", "content": "电话:23204753945:大理市大理市人民路25号 大理古城国际酒店 3号楼:收件者:段丽娟"}, {"role": "assistant", "content": "{\"province\": \"云南省\", \"city\": \"大理市\", \"district\": \"大理市\", \"specific_location\": \"人民路25号 大理古城国际酒店 3号楼\", \"name\": \"段丽娟\", \"phone\": \"23204753945\"}"}]}{"messages": [{"role": "system", "content": "你是一个专业的信息抽取助手,专门负责从中文文本中提取收件人的JSON信息,包含的Key有province(省份)、city(城市名称)、district(区县名称)、specific_location(街道、门牌号、小区、楼栋等详细信息)、name(收件人姓名)、phone(联系电话)"}, {"role": "user", "content": "天津市河西区珠江道21号金泰大厦3层 , 接收人慕容修远 , MOBILE:22323185576"}, {"role": "assistant", "content": "{\"province\": \"天津市\", \"city\": \"天津市\", \"district\": \"河西区\", \"specific_location\": \"珠江道21号金泰大厦3层\", \"name\": \"慕容修远\", \"phone\": \"22323185576\"}"}]}2.设计评测指标
评测标准应紧贴实际业务目标。以本方案为例,除了判断生成的 JSON 字符串是否合法,还应该关注对应 Key、Value 的值是否正确。
本案例评测方法核心代码
def compare_address_info(actual_address_str, predicted_address_str): """比较两个JSON字符串表示的地址信息是否相同""" try: # 解析实际地址信息 if actual_address_str: actual_address_json = json.loads(actual_address_str) else: actual_address_json = {} # 解析预测地址信息 if predicted_address_str: predicted_address_json = json.loads(predicted_address_str) else: predicted_address_json = {} # 直接比较两个JSON对象是否完全相同 is_same = actual_address_json == predicted_address_json return { "is_same": is_same, "actual_address_parsed": actual_address_json, "predicted_address_parsed": predicted_address_json, "comparison_error": None } except json.JSONDecodeError as e: return { "is_same": False, "actual_address_parsed": None, "predicted_address_parsed": None, "comparison_error": f"JSON解析错误: {str(e)}" } except Exception as e: return { "is_same": False, "actual_address_parsed": None, "predicted_address_parsed": None, "comparison_error": f"比较错误: {str(e)}" }3.评测初始模型效果
我们针对 Qwen3-0.6B 模型设计了多版提示词,选取效果最好的系统提示词为:
你是一个专业的信息抽取助手,专门负责从中文文本中提取收件人的结构化信息。## 任务说明请根据给定的输入文本,准确提取并生成包含以下六个字段的JSON格式输出:- province: 省份/直辖市/自治区(必须是完整的官方名称,如"河南省"、"上海市"、"新疆维吾尔自治区"等)- city: 城市名称(包含"市"字,如"郑州市"、"西安市"等)- district: 区县名称(包含"区"、"县"等,如"金水区"、"雁塔区"等)- specific_location: 具体地址(街道、门牌号、小区、楼栋等详细信息)- name: 收件人姓名(完整的中文姓名)- phone: 联系电话(完整的电话号码,包括区号)## 抽取规则1. **地址信息处理**:- 必须准确识别省、市、区的层级关系- 省份名称必须使用官方全称(如"河南省"而非"河南")- 直辖市的province和city字段应该相同(如都填"上海市")- specific_location应包含详细的街道地址、小区名称、楼栋号等2. **姓名识别**:- 准确提取完整的中文姓名,包括复姓- 包括少数民族姓名3. **电话号码处理**:- 提取完整的电话号码,保持原有格式## 输出格式请严格按照以下JSON格式输出,不要添加任何解释性文字:{"province": "省份名称","city": "城市名称","district": "区县名称","specific_location": "详细地址","name": "收件人姓名","phone": "联系电话"}
使用上述系统提示词与测试样本对没有微调的本地 Qwen3-0.6B 模型进行评测:
# 进入 /root 目录cd /root && \# 下载并执行验证脚本curl -o evaluate_without_sft.py "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250617/ksrneh/evaluate_without_sft.py" && \curl -o evaluate_without_sft.sh "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250617/cmvbcz/evaluate_without_sft.sh" && \bash evaluate_without_sft.sh
执行后可以看到,尽管优化了提示词,测试样本准确率仅有14%:
所有预测完成! 结果已保存到 predicted_labels_without_sft.jsonl样本数: 400 条响应正确: 56 条响应错误: 344 条评估脚本运行完成
4.验证微调后模型效果
使用测试样本对微调后的模型进行评测:
# 进入 /root 目录cd /root && \# 下载并执行验证脚本curl -o evaluate.py "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250612/bzszyc/evaluate.py" && \curl -o evaluate.sh "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250612/xtgxql/evaluate.sh" && \bash evaluate.sh
针对微调后的模型,我们使用了更简单的提示词,这可以提升模型推理时的响应速度:
你是一个专业的信息抽取助手,专门负责从中文文本中提取收件人的JSON信息,包含的Key有province(省份)、city(城市名称)、district(区县名称)、specific_location(街道、门牌号、小区、楼栋等详细信息)、name(收件人姓名)、phone(联系电话)
即使使用了更简单的提示词,微调模型的准确率也达到 98%,相比微调前的 14% 准确率有了大幅提升。
所有预测完成! 结果已保存到 predicted_labels.jsonl样本数: 400 条响应正确: 392 条响应错误: 8 条评估脚本运行完成
至此,您已经成功完成了一次模型微调。
如果您需要在生产环境中使用,可以点击文末阅读原文参考后续内容。
您也可以通过在aliyun.com 直接搜索“10分钟微调,让0.6B模型媲美235B模型”即可直达技术解决方案,获得更多部署方案。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-19
从 BERT 标注到 Agent Skill:短文本标签体系的四次“工业革命”
2026-05-14
多轮 Agent 场景下,滴滴的 EAGLE-3 训推加速实践
2026-05-06
谁说 Mac 只能写代码?Google 官宣:M 芯片本地微调 Gemma 4 时代开启!
2026-04-20
用 Unsloth 微调 Embedding 模型,让你的 RAG 检索不再答非所问
2026-04-15
ComfyUI v0.19.0 更新:大量新节点、新模型、新修复与性能优化全面落地,工作流与训练能力再升级
2026-04-13
Agent 持续学习落地路径:先做 Traces,再做 Context,最后才微调模型 | Jinqiu Select
2026-03-23
养死四只龙虾的小白有感
2026-03-22
Mistral Forge 的真正意义:企业AI从“租用”走向“拥有”
2026-04-15
2026-04-13
2026-04-20
2026-05-06
2026-05-14
2026-06-19
2026-01-02
2025-11-19
2025-09-25
2025-06-20
2025-06-17
2025-05-21
2025-05-17
2025-05-14
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。