2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

如何成为 AI 工程师:一份 12 个月的完整自学路线

发布日期:2026-07-02 07:26:34 浏览次数: 1535
作者:Assistant Hub

微信搜一搜,关注“Assistant Hub”

推荐语

想成为 AI 工程师但苦无学位?这份 12 个月自学路线图,为你拆解从零到一的每一步,核心在于构建能证明你能力的项目组合。

核心内容:
1. 明确AI工程师(应用型)与研究员(研究型)的关键区别
2. 分阶段学习的核心技能:编程、LLM API、产品化
3. 构建项目组合作为求职敲门砖的具体实践

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

很多人认为做 AI 工程师必须要有计算机学位。但实际情况是,这个领域目前薪水最高的构建型岗位不看你的学位——看的是你交付过什么。

两者的差距不在学历,在项目组合。

先搞清楚一个容易被搞混的关键区别:机器学习研究员发明和训练新模型,这个角色确实很吃高等数学和学术训练,但它在市场里只占一小块;AI 工程师用已有的模型构建有用的产品,这个角色更看重软件技能、产品意识和交付纪律。绝大多数开放岗位、以及你可以不需要学位就能入行的,是第二种。

你的目标是成为「用 AI 构建东西的工程师」,不是「构建 AI 本身的科学家」。这一区分能帮你省下好几个月在当下用不上的数学上。

这个角色的位置处在三个领域的交汇点:软件工程能力、对大语言模型行为的理解、产品思维。你不需要第一天就在三方面都拔尖——能胜任并且持续提升就可以,但你需要证据。

第一阶段(第 1–3 个月):老老实实学会写代码

这一步跳不过去,也是很多人最想跳的一步。

在学其他东西之前,你必须能写出真正能跑的代码。语言选 Python——几乎所有 AI 库和框架都是 Python 优先的,这不是偏好,是现实标准。

这三个月的目标不是「我看过教程了」那种程度,而是「我能从空白文件开始写出一个小程序,不用查基础语法」的程度。变量、数据类型、控制流、函数、文件操作、调用 API、错误处理、能读懂别人的代码。从第一天开始学 Git、所有东西推 GitHub,因为你的 GitHub 就是你项目组合的前半部分。

至于对数学的担忧,先放一放。你需要对基础统计有感觉,理解数字怎么变化。不需要现在就啃线性代数和微积分——深度数学对研究员有用,你是做工程的,等将来具体项目需要时再补。

这个阶段要做什么:

• 完成一个结构化 Python 课程,每天写代码,哪怕只有 30 分钟

• 从零写 5 个小程序:计算器、文件整理工具、调用公开 API 的脚本、简单数据清洗器、命令行笔记工具

• 学 Git 基础,把 5 个项目全推到公开 GitHub

• 加入一个在做同样事情的学习社群,别闷头自学

第二阶段(第 3–5 个月):掌握 LLM API

这是整个工作的核心。

聊天界面是消费级产品。AI 工程师通过 API 工作——从自己的代码里发请求,用程序处理响应。真正的杠杆在这里,熟练掌控 API 的那一刻,你就从用户变成了构建者。

学会从你自己的脚本里给模型发消息;学会处理流式响应、管理对话历史、控制输出格式、从容应对速率限制和错误。还要搞懂一个关键能力:什么样的 prompt 能拿到一个可靠、可复现、可直接投产的答案——因为在实际产品里「基本上对」就是 bug。

这个阶段还要学会工具调用(function calling)。它让你给模型赋予行动能力:调用函数、查询系统、获取数据。一旦掌握了工具调用,Agent 的世界就彻底打开了——因为 Agent 无非就是有工具、有循环的模型而已。

这个阶段要做什么:

• 拿到 API key,一小时内从 Python 脚本发出第一次调用

• 做一个命令行工具,把自己粘贴进去的任意文本做一件有用的事(汇总、翻译、分类都行)

• 做一个有记忆的聊天机器人,能在多轮对话里记住前面说的东西

• 实现工具调用:给模型一个它有权调用的函数,确保它每次都能调对

第三阶段(第 5–7 个月):构建 RAG 系统

这是能让人拿 offer 的技能,因为大多真实 AI 产品在底层做的就是这件事。

RAG 全称是 retrieval-augmented generation,思路并不复杂。模型只知道训练数据里的东西和你当前喂给它的东西。RAG 的原理就是:从你自己的数据里捞出正确的信息,然后把这些信息喂给模型,让它对从未训练过的内容也能给出准确答案。比如你的公司文档、产品手册、知识库。

你要学会:把文档拆成块(chunking),把每块转成 embedding(语义的数值化表示),存进向量数据库,针对任意问题检索最相关的块,把这些块喂给模型,让它输出有依据的答案而不是自信的瞎猜。

从头到尾做一个能真正跑起来的 RAG 应用,用真实文档,这一步就能让你超过一大堆只聊 AI 没有动手的人。这是项目组合一。

这个阶段要做什么:

• 先搞懂 embedding 和向量数据库的概念,再落实到代码

• 在一份真实文档上做一个 RAG 应用:你自己的笔记、一组 PDF、某个 wiki 都行

• 加上检索评估:它是真的找到了最相关的块,还是只找到了相邻的块

• 把它部署到别人能访问的地方,哪怕只是一个简单的托管版本

第四阶段(第 7–9 个月):构建 Agent

现在来做所有人都在聊但没几个人能真正交付的东西。

Agent 是一个可以接收目标、拆解步骤、用工具完成每一步、再根据结果决定下一步做什么的模型。RAG 应用负责回答问题,Agent 负责做完一件事。

你在第二阶段已经学了工具调用,现在把它放进一个带目标的循环里,给 Agent 多个工具,并处理好那个烦人的现实——Agent 有时候会原地绕圈、调错工具、或者直接卡住。学会构建可靠而非仅仅在 demo 里好看的东西,正是市场最缺的能力。

讲实话:demo 级的 Agent 很简单,可靠的 Agent 很难。差距在于失败处理、清晰的工具设计和评估。把精力投在这里,因为这个差距就是「可被雇佣的工程师」和「有一个炫酷视频的人」之间的分界线。

这个阶段要做什么:

• 做一个单 Agent 系统,能用多个工具完成一个真实的多步任务

• 做一个小型多 Agent 系统,两个或多个 Agent 协作或互相校验

• 加上显式的失败处理:工具调用失败或返回空时 Agent 怎么应对

• 这是项目组合二:一个能解决真实问题的多 Agent 系统

第五阶段(第 9–11 个月):学评估和部署

这是看起来很无聊但让你真正可被雇佣的阶段,也是业余选手完全跳过的阶段。

任何人都能让 AI 功能跑通一次。公司愿意付钱的是能跑通第一万次的东西。证明你能做到这点的是评估和部署能力。

评估意味着搭建一套度量系统,用来判断你的系统到底好在哪里,一次改动是让它变好了还是变坏了。对于生成类任务,你至少要度量事实准确性、相关性、与参考答案的一致性——有时候用另一个模型打分,有时候用人工审核。一个会建评估体系的工程师就是一个可以被信任上生产的工程师。

部署意味着把系统从你的笔记本搬到网上:托管它、监控它、处理负载、追踪成本、在用户发现问题之前先发现故障。这一组技能有时被称为 MLOps,哪怕只掌握最基本的概念,在可雇佣性上就已经甩开了只会在自己电脑上跑代码的人。

这个阶段要做什么:

• 为你之前的一个项目建评估套件,包含一组测试案例和打分标准

• 选一个项目正经部署,加上监控和成本追踪

• 这是项目组合三:一个带评估和监控的已部署系统

• 把「你测了什么、怎么改进」写成文档——善于「想出声」本身就是一个可雇佣的信号

第六阶段(第 11–12 个月):入职

最后一个阶段不再涉及新的技术技能,而是确保对的人看到你做过的东西。

到这一步你手上有三个真实项目:一个带评估的 RAG 应用、一个能解决真实问题的多 Agent 系统、一个带监控的已部署系统。对大多数 AI 工程岗位来说,这套组合打开的面试机会比一个硕士学位还多。现在的工作是把它摆出去。

把每个项目写成一个清晰的案例:问题是什么、你的方案、你度量了什么、你下次会怎么做。在社区里公开构建过程,分享你的经历,把拆解文章发出去。这个领域变化太快,持续公开晒成果的构建者很快就会被看见。

然后投简历,投对层级。现实中的入门路径通常是先找一个 AI 增强的软件工程岗位过度,然后转身成为纯 AI 工程师。薪资从入门约 12 万刀到资深超过 20 万刀不等,取决于公司和地点。

面试的时候,当对方问你「说说你对 Agent 工具调用失败的处理思路」或者「解释一下你怎么评估一个 RAG 系统」,你不用背诵理论,你会直接描述你做过的事情。这就是整个游戏的全部。

这个阶段要做什么:

• 为三个项目组合各写一份清晰的案例分析

• 至少发布一篇技术拆解文章,展示你是怎么解决一个困难点的

• 广泛投递,接受 AI 增强型软件工程岗位作为现实的第一步

• 面试中多聊你实际交付了什么、会怎么改进,少背概念

这条路一些实话

12 个月是一个真实的时间线,但它只在一种情况下有效:你全程都在构建东西。

读 AI 工程文章不等于成为 AI 工程师。看教程不等于建立项目组合。能靠这条路入职的人,是每个阶段都交付了东西、并且不纠结于它是否完美的人。一直停留在「准备」阶段、从来没把东西放到真实用户面前的人,才是卡住的那批。

还有一个大家都在问的问题:如果 AI 自己都能写那么多代码了,还学这个干嘛?因为总要有人设计系统、集成组件、评估输出是否正确、决定该构建什么。AI 工具让一个有能力的 AI 工程师变得更有价值,而不是更没用。能指挥这些工具、能判断它们产出质量的工程师,正是市场愿意付钱的人。你不是在学怎么和工具竞争,你是在学怎么驾驭它们。

挡在大多数人身前的那道证书门槛,其实大部分公司已经不守着了。

一年后的今天,你可以仍然对自己说「我需要先把学位拿了」。

也可以成为那个手握三个项目、用事实证明了「不需要」的工程师。

唯一挡在你和第一阶段之间的,是今天打开一个空文件。


如果你关注 AI 助手、开发工具和软件工程实践,可以关注 Aide Hub。这里会继续分享能落地的工具教程、技术观察和项目经验。

参考

• How To Become An AI Engineer in 2026 (Without a CS Degree) - Khairallah AL-Awady on X: https://x.com/eng_khairallah1/status/2069341916798369801

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅