2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

AI领域基础概念(上)

发布日期:2025-05-27 11:55:07 浏览次数: 2218
作者:质量之巅

微信搜一搜,关注“质量之巅”

推荐语

探索人工智能的奥秘,从基础概念到实际应用,一文带你入门AI领域。

核心内容:
1. 人工智能的定义和核心功能
2. 传统编程与机器学习的区别及应用场景
3. 自然语言处理和自然语言理解的实际应用案例

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
什么是 AI
AI (Artificial Intelligence) 人工智能是一种使机器能够模拟人类智能的技术,通过机器学习、深度学习等算法,使得计算机具备学习、推理、自我修正和解决问题等功能。
传统编程指令 vs 机器学习
传统编程定义:传统编程是一种通过明确的指令和规则来告诉计算机如何完成任务的编程方式。程序员需要详细地编写每一步操作的代码,计算机会严格按照这些指令执行。特点:明确的规则:程序员需要明确地定义每个步骤和规则。确定性:给定相同的输入,程序会始终产生相同的输出。依赖专家知识:需要程序员对问题领域有深入的理解,以便编写详细的逻辑和规则。
机器学习定义:机器学习是一种通过数据训练模型,使计算机能够自动从数据中学习模式和规律的编程方式。程序员不需要明确地编写每一步操作的代码,而是通过提供大量的示例数据,让计算机自行学习。特点:数据驱动:依赖大量的数据来训练模型。不确定性:给定相同的输入,输出可能会有所不同,取决于模型的训练和随机因素。自动化学习:计算机通过数据自主学习,不需要明确的规则定义。
训练集(Training Set):用于训练机器学习模型的数据集。它包含输入数据和对应的目标标签,模型通过学习这些数据中的模式和规律来调整其参数测试集(Test Set):用于评估机器学习模型性能的数据集。它包含输入数据和对应的目标标签,但这些数据在模型训练过程中是不可见的。
传统编程 vs 机器学习1. 编程方式:传统编程:程序员编写明确的规则和指令。机器学习:程序员提供数据和算法,模型通过学习数据中的模式来做出决策。2. 适用场景:传统编程:适用于规则明确、逻辑清晰的问题,如计算公式、数据处理等。机器学习:适用于规则复杂、难以明确定义的问题,如图像识别、语音识别、推荐系统等。3. 处理方式:传统编程:需要详细的步骤和逻辑,依赖人类专家的知识。机器学习:依赖大量数据,通过学习数据中的模式和规律来做出决策。

自然语言(NL)

自然语言处理(NLP)定义:自然语言处理(Natural Language Processing, NLP)是计算机科学和人工智能的一个子领域,致力于实现计算机对人类语言的理解、解读和生成。NLP涵盖了从文本处理到语音识别的广泛任务。例子:文本分类:电子邮件过滤系统可以使用NLP来自动将邮件分类为“垃圾邮件”或“非垃圾邮件”。情感分析:社交媒体监控工具可以使用NLP来分析用户评论的情感倾向(正面、负面或中性)
自然语言理解(NLU)定义:自然语言理解(Natural Language Understanding, NLU)是NLP的一个子领域,专注于使计算机能够理解和解释人类语言的含义。NLU涉及语义分析、意图识别、实体识别等任务。例子:意图识别:在智能语音助手中,当用户说“帮我订一张明天去纽约的机票”,系统需要识别用户的意图是“订票”。实体识别:在同一句话中,系统需要识别出“纽约”是一个地名,“明天”是一个时间表达。
自然语言生成(NLG)定义:自然语言生成(Natural Language Generation, NLG)是NLP的另一个子领域,旨在使计算机能够生成自然、人类可读的语言文本。NLG通常用于自动报告生成、内容创作等场景。例子:自动报告:金融分析工具可以使用NLG来生成每日或每周的市场分析报告。内容创作:新闻自动写作系统可以根据输入的数据生成新闻文章,如体育比赛的赛后报道。
举个栗子:假设我们有一个智能语音助手(如Siri或Alexa),以下是NLP、NLU和NLG在其中的具体应用:1.用户输入:用户说:“明天的天气怎么样?”2.自然语言处理(NLP):语音识别:首先将用户的语音转换为文本:“明天的天气怎么样?”文本预处理:清理和规范化文本,如去除多余的空格或标点。3.自然语言理解(NLU):意图识别:系统识别用户的意图是询问天气。实体识别:系统识别出“明天”是时间相关的实体。4.数据处理:系统查询天气数据库,获取“明天”的天气信息。5.自然语言生成(NLG):生成文本:系统将查询结果转换为自然语言文本:“明天的天气是晴天,最高气温25度,最低气温15度。”语音合成:将生成的文本转换为语音,并播放给用户。

监督学习(Supervised Learning)
监督学习是一种机器学习方法,模型通过已知的输入和输出数据进行训练,直到模型能够准确地匹配输入和输出的关系。分类(Classification): 分类任务是将输入数据分为离散的类别。例子:垃圾邮件过滤。给定一封电子邮件,模型需要判断这封邮件是垃圾邮件(spam)还是正常邮件(ham)。回归(Regression): 回归任务是预测连续的数值输出。例子:房价预测。根据特征(如房子的面积、位置等),模型预测房子的价格。关联规则(Association Rule): 关联规则是寻找数据中不同项之间的关系或模式。例子:购物篮分析。超市可以通过关联规则发现哪些商品常常一起被购买,比如“如果顾客买了面包和黄油,他们也很可能会买牛奶”。

无监督学习(Unsupervised Learning)

无监督学习是一种机器学习方法,模型在没有标签数据(即没有输入和输出配对)的情况下,通过数据内部的结构进行学习。聚类(Clustering):聚类任务是将数据分成不同的组,每个组中的数据项彼此相似。例子:客户细分。根据购买行为的数据,商业可以将客户分成不同的群体,比如“大宗购买者”、“偶尔购买者”等。

强化学习(Reinforcement Learning)

强化学习是一种机器学习方法,其中一个智能体(Agent)通过与环境(Environment)互动,以试错的方式学习如何完成任务或达到目标。
核心概念:1.状态(States):状态是对当前环境的一种描述。在任何时刻,智能体所处的状态反映了当前的环境情况。例子:在一个迷宫游戏中,状态可以是智能体当前所在的位置;在围棋中,状态就是棋盘上每颗棋子的布局。2.奖励(Reward):奖励是对智能体在某个状态下采取某个动作后的反馈,它可以是正的(奖励)或负的(惩罚)。例子:在迷宫游戏中,如果智能体走到正确的方向,可以获得正的奖励(例如+10分);如果撞到墙壁,可能会获得负的奖励(例如-10分)。3.智能体(Agent):智能体是执行动作并接收奖励的决策者。智能体通过不断地选择动作来改变其状态,从而尝试最大化累计奖励。例子:在自动驾驶汽车中,智能体就是控制汽车行驶的算法;在游戏中,智能体就是玩家控制的角色或者对手AI。
强化学习的过程:1.观察:智能体观察当前的状态。2.选择动作:根据当前状态,智能体选择一个动作。这个动作可能基于之前的学习,也可能是一个随机选择。3.执行动作:智能体执行所选择的动作,环境随之发生改变。4.获取反馈:环境向智能体提供执行该动作后的新状态及即时奖励。5.更新策略:智能体根据奖励更新其策略,使其在未来选择更优的动作,以获得更多的累计奖励。    强化学习通过不断试验和从环境中获得反馈,让智能体逐渐学会在不同的状态下采取最佳的行动,以获得最大的累计奖励。    机器学习模型的效果评估是确保模型能够在不同的数据集上准确预测的重要步骤。在理解这个评估过程中,有三个关键概念:欠拟合、最佳拟合和过拟合。
机器学习效果评估
欠拟合 (Under-fitting):欠拟合是指模型过于简单,无法捕捉到训练数据中的模式和特征,导致在训练数据和新数据上的表现都很差。
最佳拟合 (Optimal-fitting):最佳拟合是指模型恰当地捕捉到了训练数据中的模式和特征,同时也能很好地应用于新数据。这种情况下,模型在训练数据和测试数据上都有良好的表现。
过拟合 (Over-fitting): 过拟合是指模型过于复杂,过度地记住了训练数据中的每一个细节和噪声,从而失去了对新数据的泛化能力。过拟合的模型在训练数据上表现很好,但在新数据上表现较差。
总结:1.欠拟合 (Under-fitting):模型太简单,不能很好地捕捉数据中的模式。简单例子:用直线拟合“U”形数据。实际例子:房价预测中只用面积一个特征。2.最佳拟合 (Optimal-fitting):模型恰到好处,既能很好地拟合训练数据,也能对新数据有良好表现。简单例子:用合适的二次曲线拟合“U”形数据。实际例子:房价预测中使用了多个重要特征。3.过拟合 (Over-fitting):模型太复杂,过度记住了训练数据,无法泛化到新数据。简单例子:用复杂的高次多项式拟合“U”形数据,过度拟合了每个数据点。实际例子:房价预测中加入了很多不相关特征,结果在新数据上效果不好。总之,目标是找到让模型最佳拟合训练数据和测试数据的平衡点,既不过于简单也不过于复杂。

深度学习

深度学习是一种机器学习方法,它利用多层神经网络进行复杂的数据处理和模式识别。在理解深度学习时,我们需要了解神经网络的三种关键层:输入层(Input Layer)、隐藏层(Hidden Layer)和输出层(Output Layer)。
简而言之:1.输入层:接收原始数据。2.隐藏层:提取和转换输入数据的特征。3.输出层:给出预测结果。
通过这些层的协同工作,神经网络能够从原始数据中学习模式,并对新数据进行准确的预测或分类。神经网络(Neural Network)是模仿人脑工作原理的一种算法,由多个互相连接的节点(也叫神经元)组成。这些节点被组织成不同的层,通过层与层之间的连接和权重调整来处理数据。
神经网络
神经网络的基本概念:1.节点(Neuron):类似于人脑中的神经元,每个节点接收输入信号,进行处理后发送输出信号。2.层(Layer):神经网络的结构由多个层组成,每层包含一定数量的节点。一般分为输入层、隐藏层和输出层。3.连接(Weights):每两个相邻层之间的节点通过带有权重的连接相连,这些权重决定了信号传输的强度。
CNN(卷积神经网络)
    卷积神经网络(CNN)是一种特别设计用来处理具有类似网格结构的数据的深度学习模型,例如图像(本质上是像素的矩阵)。在最简单的术语中,CNN通过模拟我们人类的视觉系统工作来帮助计算机“看懂”图像或其他类似数据。

RNN(循环神经网络)
循环神经网络(RNN):是一种专为处理序列数据(如文字、语音或任何连续的时间数据)而设计的神经网络。与传统的神经网络不同,RNN能够处理输入之间的时间动态关系,使其特别适用于那些需要理解时间序列数据或上下文信息的场景。基本工作原理:它记住之前发生的事情,并使用这些信息来帮助作出当前的决策。RNN内部有所谓的“循环”,这使得过去的信息能够影响当前的输出。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅