微信扫码
添加专属顾问
在之前的编程任务中,研发人员需要提前清楚程序运行的内部逻辑,并且用代码的形式把这些逻辑实现出来,且逻辑是确定性的,相同的输入会得到相同的输出。
随着编程任务的复杂度越来越高,研发需要付出大量的工作去搞清楚程序运行的内部逻辑,时间和人力的消耗大,一些任务已经复杂到搞清楚全部运行逻辑是普通人力和团队无法承受的程度。且无法解决一些不确定性的任务,如一张图片里到底是一只猫还是一只老虎,不同的场景下会出现不确定的结果。
面对这样的困境,研发希望不用去搞清楚程序运行的内部逻辑,也可以将逻辑实现出来,给定一个输入可以获得一个输出。
1、模型原理
人工智能就是用来解决上述问题的。人工智能(Artificial Intelligence, AI)是一个广泛的领域,涉及设计计算系统和算法,使得计算机能够执行通常需要人类智能的任务。机器学习是人工智能的一个子领域,研究如何通过从数据中自动学习和改进算法,使得计算机可以进行预言预测和决策。神经网络是机器学习中的一种模型,也是当前最流行的一种模型。
1.1、神经网络
很多任务,人类是可以完成的,人类是依赖大脑这种神经网络来完成这种复杂和不确定性的任务的,AI就是从中获取到启发。
人类的大脑是由一个一个的神经元相互连接而组成的神经网络,每一个神经元只能处理很简单的任务,但是有足够多的神经元,相互连接传递信息,却能处理很复杂的任务。受此启发,AI引入了神经网络。
神经网络是一种特定类型的AI模型,它受到人类大脑结构和功能的启发,用于识别复杂的模式和关系。神经网络由许多相互连接的节点(人工神经元)组成,这些节点通过连接(边)传递和处理信息。
一个典型的神经网络如下所示:
•神经元(节点):每个节点负责接收输入并进行特定的处理。
•层:神经网络通常包括输入层、隐藏层和输出层。
○输入层:接收原始数据,例如将一张图片转化成像素值,根据不同的任务类型有所不同
○隐藏层:处理信息,每个隐藏层都有多个神经元,这些神经元通过加权连接传递信息。
○输出层:将数值计算转换成最终的预测结果,根据不同的任务类型有所不同
1.2、隐藏层的神经元
每个神经元实际上执行了以下步骤:
1.加权求和:
○每个输入 ( x_i ) 乘以相应的权重 ( w_i ),然后将所有结果相加,加上一个偏置项 ( b_i )。 [ z = \sum_{i=1}^{n} w_i x_i + b_i ] 其中,( n ) 是前一层神经元的数量,( w_i ) 是权重,( x_i ) 是输入,( b_i ) 是偏置,( z ) 是加权求和的结果。
○所有的权重值组成一个权重矩阵w,偏置值组成偏置矩阵b,这两个矩阵可以理解为模型的参数。
2.激活函数:
○将加权求和的结果 ( z ) 通过激活函数 ( f )(例如 ReLU、Sigmoid、Tanh 等)进行非线性变换,输出结果 ( a )。 [ a = f(z) ]
○因为很多场景都是非线性的,进行非线性转换可以让一个线性的网络处理非线性问题,激活函数不涉及参数,是一个固定的函数。
神经网络可以实现对于复杂任务的模拟,其理论基础是通用近似定理。
通用近似定理表明,一个具有足够多的神经元的神经网络,只要适当选择权重和激活函数,这个神经网络可以近似任何连续可微函数,从理论上讲,可以任意接近这些函数的输出。
因此,AI可以不用搞清楚一个函数的内在实现逻辑,而是通过神经网络的方式模拟这些函数,从而获得对应函数的输出。
2、模型设计
设计模型就是设计神经网络的结构的过程,其有以下几个方面:
1.确定任务的类型
2.选择适当的层数:
3.选择神经元数量:
4.选择激活函数
5.选择层类型
6.选择超参数
目前对于不同的任务已经有大量开源的模型,比如用于图像处理的CNN,用于ChatGPT的Transformer等,研发可以在开源的基础上进行调整以最大化的满足其场景需求。
3、模型训练
模型训练的目标:通过大量的数据训练,确定合适的神经网络及其参数(如权重矩阵和偏置矩阵),从而实现对复杂任务最接近的模拟。
为了达到这一目标首先需要一个衡量指标,用来衡量当前模型对于复杂任务模拟的接近程度,这个指标就是损失函数。损失函数(Loss Function)是机器学习和深度学习中的一个重要概念,它用来衡量模型的预测结果与实际结果之间的差距,即误差。通俗地说,损失函数就像评分系统,告诉我们模型的表现有多好或者多差。通过最小化损失函数的值,我们可以不断优化模型,使其预测结果更加准确。
模型的参数(权重和偏置)在开始时通常是随机初始化的,预测值和输出有很大的差距。
前向传播:将输入数据通过网络传递,计算每个神经元的线性组合,再通过激活函数输出。
神经网络前向传播产生的输出(即预测值)和真实数据的输出(即真实值)之间的差距需要用损失函数进行衡量,损失函数一般是根据不同的任务提前设置好的,比如均方误差,计算预测值和真实值之间差的平方和的平均值。
3.1、反向传播
由于神经网络的不同的参数(权重矩阵和偏置矩阵),可以输出不同的预测值,也就是损失函数会取不同的值,训练的过程就是找到合适的参数,使得损失函数的值最小。这个过程就是反向传播。
损失函数可以通俗的理解为参数的函数,要找到其最小值可以借助梯度这一数学工具。二维函数一般情况下就是使用导数来找到最小值,但是三维以上的函数就是使用梯度。
梯度是一个向量,它的方向指向函数变化最快的方向,长度表示变化的速率。可以把梯度下降过程类比为“沿着山坡向下走”。如果我们站在函数的某个点,梯度告诉我们哪个方向是下坡最快的方向,我们一步一步地沿着这个方向走,每步步长由学习率(超参数)决定,这样我们可以逐渐接近山谷,即函数的最低点。
反向传播流程如下:
1.计算损失:根据前向传播计算出输出值和真实数据的输出值,使用损失函数(如均方误差、交叉熵等)计算损失值。
2.计算梯度:计算损失函数关于每个权重和偏置的梯度,将这些梯度用于更新权重和偏置。
3.更新权重和偏置:使用优化算法(如梯度下降、Adam 等)根据梯度更新权重和偏置。
4.迭代:重复上述过程,直到损失函数收敛或达到预设的训练轮数。
如果损失函数没有收敛,那需要调整模型或者优化算法超参数等,反之则继续训练至损失函数达到预期。
3.2、泛化
一个模型除了在训练数据集上表现良好,还需要在非训练数据集上有比较好的表现,这个过程称之为泛化。因此下一步需要在非训练集上进行验证,非训练集大体分为两种:独立数据集和验证数据集。独立数据集是指从外部下载的公开数据集,验证数据集是指从训练数据集中提取一部分数据,这部分数据没有用来训练,而是用来验证。
如果模型泛化表现依然良好,那就可以直接上线运行;反之,则需要继续调整模型或者调整训练数据集,来达到最终目的。
4、模型维护和迭代
在实际应用中不断监控模型的预测性能,特别是数据分布变更时的表现,定期更新模型训练数据,重新训练模型以适应新数据,根据用户反馈和监控结果,定期进行模型优化和调优。
成员 | 简介 |
戴中印 | 商汤云安全架构师 |
刘新 | 兰州大学信息科学与工程学院副教授、硕士生导师,主要从事代码安全和 AI 对抗研究 |
于长奇 | 字节跳动隐私合规专家,专注移动端合规技术和解决方案,如违规收集个人信息,自启动等。曾从事过内核安全、java安全和Api安全 |
杨坤 | 御林安全负责人,蚂蚁金服和美团SRC年度TOP白帽子,专注自动化漏洞挖掘和web3领域 |
赵永福 | 网商银行办公安全负责人,主要研究方向为可信纵深防御、信创安全研究、数据安全与合规 |
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-19
从 BERT 标注到 Agent Skill:短文本标签体系的四次“工业革命”
2026-05-14
多轮 Agent 场景下,滴滴的 EAGLE-3 训推加速实践
2026-05-06
谁说 Mac 只能写代码?Google 官宣:M 芯片本地微调 Gemma 4 时代开启!
2026-04-20
用 Unsloth 微调 Embedding 模型,让你的 RAG 检索不再答非所问
2026-04-15
ComfyUI v0.19.0 更新:大量新节点、新模型、新修复与性能优化全面落地,工作流与训练能力再升级
2026-04-13
Agent 持续学习落地路径:先做 Traces,再做 Context,最后才微调模型 | Jinqiu Select
2026-03-23
养死四只龙虾的小白有感
2026-03-22
Mistral Forge 的真正意义:企业AI从“租用”走向“拥有”
2026-04-15
2026-04-13
2026-04-20
2026-05-06
2026-05-14
2026-06-19
2026-01-02
2025-11-19
2025-09-25
2025-06-20
2025-06-17
2025-05-21
2025-05-17
2025-05-14
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。