AI领域基础概念(上)

发布日期：2025-05-27 11:55:07 浏览次数： 2218

作者：质量之巅

微信搜一搜，关注“质量之巅”

什么是 AI

AI (Artificial Intelligence) 人工智能是一种使机器能够模拟人类智能的技术，通过机器学习、深度学习等算法，使得计算机具备学习、推理、自我修正和解决问题等功能。

传统编程指令 vs 机器学习

传统编程定义:传统编程是一种通过明确的指令和规则来告诉计算机如何完成任务的编程方式。程序员需要详细地编写每一步操作的代码，计算机会严格按照这些指令执行。特点:明确的规则:程序员需要明确地定义每个步骤和规则。确定性:给定相同的输入，程序会始终产生相同的输出。依赖专家知识:需要程序员对问题领域有深入的理解，以便编写详细的逻辑和规则。

机器学习定义:机器学习是一种通过数据训练模型，使计算机能够自动从数据中学习模式和规律的编程方式。程序员不需要明确地编写每一步操作的代码，而是通过提供大量的示例数据，让计算机自行学习。特点:数据驱动:依赖大量的数据来训练模型。不确定性:给定相同的输入，输出可能会有所不同，取决于模型的训练和随机因素。自动化学习:计算机通过数据自主学习，不需要明确的规则定义。

训练集(Training Set):用于训练机器学习模型的数据集。它包含输入数据和对应的目标标签，模型通过学习这些数据中的模式和规律来调整其参数测试集（Test Set）:用于评估机器学习模型性能的数据集。它包含输入数据和对应的目标标签，但这些数据在模型训练过程中是不可见的。

传统编程 vs 机器学习1. 编程方式:传统编程:程序员编写明确的规则和指令。机器学习:程序员提供数据和算法，模型通过学习数据中的模式来做出决策。2. 适用场景:传统编程:适用于规则明确、逻辑清晰的问题，如计算公式、数据处理等。机器学习:适用于规则复杂、难以明确定义的问题，如图像识别、语音识别、推荐系统等。3. 处理方式:传统编程:需要详细的步骤和逻辑，依赖人类专家的知识。机器学习:依赖大量数据，通过学习数据中的模式和规律来做出决策。

自然语言（NL）

自然语言处理（NLP）定义:自然语言处理（Natural Language Processing, NLP）是计算机科学和人工智能的一个子领域，致力于实现计算机对人类语言的理解、解读和生成。NLP涵盖了从文本处理到语音识别的广泛任务。例子:文本分类:电子邮件过滤系统可以使用NLP来自动将邮件分类为“垃圾邮件”或“非垃圾邮件”。情感分析:社交媒体监控工具可以使用NLP来分析用户评论的情感倾向（正面、负面或中性）

自然语言理解（NLU）定义:自然语言理解（Natural Language Understanding, NLU）是NLP的一个子领域，专注于使计算机能够理解和解释人类语言的含义。NLU涉及语义分析、意图识别、实体识别等任务。例子:意图识别:在智能语音助手中，当用户说“帮我订一张明天去纽约的机票”，系统需要识别用户的意图是“订票”。实体识别:在同一句话中，系统需要识别出“纽约”是一个地名，“明天”是一个时间表达。

自然语言生成（NLG）定义:自然语言生成（Natural Language Generation, NLG）是NLP的另一个子领域，旨在使计算机能够生成自然、人类可读的语言文本。NLG通常用于自动报告生成、内容创作等场景。例子:自动报告:金融分析工具可以使用NLG来生成每日或每周的市场分析报告。内容创作:新闻自动写作系统可以根据输入的数据生成新闻文章，如体育比赛的赛后报道。

举个栗子:假设我们有一个智能语音助手（如Siri或Alexa），以下是NLP、NLU和NLG在其中的具体应用：1.用户输入:用户说：“明天的天气怎么样？”2.自然语言处理（NLP）:语音识别:首先将用户的语音转换为文本：“明天的天气怎么样？”文本预处理:清理和规范化文本，如去除多余的空格或标点。3.自然语言理解（NLU）:意图识别:系统识别用户的意图是询问天气。实体识别:系统识别出“明天”是时间相关的实体。4.数据处理:系统查询天气数据库，获取“明天”的天气信息。5.自然语言生成（NLG）:生成文本:系统将查询结果转换为自然语言文本：“明天的天气是晴天，最高气温25度，最低气温15度。”语音合成:将生成的文本转换为语音，并播放给用户。

监督学习（Supervised Learning）

监督学习是一种机器学习方法，模型通过已知的输入和输出数据进行训练，直到模型能够准确地匹配输入和输出的关系。分类（Classification）: 分类任务是将输入数据分为离散的类别。例子:垃圾邮件过滤。给定一封电子邮件，模型需要判断这封邮件是垃圾邮件（spam）还是正常邮件（ham）。回归（Regression）: 回归任务是预测连续的数值输出。例子:房价预测。根据特征（如房子的面积、位置等），模型预测房子的价格。关联规则（Association Rule）: 关联规则是寻找数据中不同项之间的关系或模式。例子:购物篮分析。超市可以通过关联规则发现哪些商品常常一起被购买，比如“如果顾客买了面包和黄油，他们也很可能会买牛奶”。

无监督学习（Unsupervised Learning）

无监督学习是一种机器学习方法，模型在没有标签数据（即没有输入和输出配对）的情况下，通过数据内部的结构进行学习。聚类（Clustering）:聚类任务是将数据分成不同的组，每个组中的数据项彼此相似。例子：客户细分。根据购买行为的数据，商业可以将客户分成不同的群体，比如“大宗购买者”、“偶尔购买者”等。

强化学习（Reinforcement Learning）

强化学习是一种机器学习方法，其中一个智能体（Agent）通过与环境（Environment）互动，以试错的方式学习如何完成任务或达到目标。

核心概念：1.状态（States）：状态是对当前环境的一种描述。在任何时刻，智能体所处的状态反映了当前的环境情况。例子：在一个迷宫游戏中，状态可以是智能体当前所在的位置；在围棋中，状态就是棋盘上每颗棋子的布局。2.奖励（Reward）：奖励是对智能体在某个状态下采取某个动作后的反馈，它可以是正的（奖励）或负的（惩罚）。例子：在迷宫游戏中，如果智能体走到正确的方向，可以获得正的奖励（例如+10分）；如果撞到墙壁，可能会获得负的奖励（例如-10分）。3.智能体（Agent）：智能体是执行动作并接收奖励的决策者。智能体通过不断地选择动作来改变其状态，从而尝试最大化累计奖励。例子：在自动驾驶汽车中，智能体就是控制汽车行驶的算法；在游戏中，智能体就是玩家控制的角色或者对手AI。

强化学习的过程：1.观察：智能体观察当前的状态。2.选择动作：根据当前状态，智能体选择一个动作。这个动作可能基于之前的学习，也可能是一个随机选择。3.执行动作：智能体执行所选择的动作，环境随之发生改变。4.获取反馈：环境向智能体提供执行该动作后的新状态及即时奖励。5.更新策略：智能体根据奖励更新其策略，使其在未来选择更优的动作，以获得更多的累计奖励。    强化学习通过不断试验和从环境中获得反馈，让智能体逐渐学会在不同的状态下采取最佳的行动，以获得最大的累计奖励。    机器学习模型的效果评估是确保模型能够在不同的数据集上准确预测的重要步骤。在理解这个评估过程中，有三个关键概念：欠拟合、最佳拟合和过拟合。

机器学习效果评估

欠拟合 (Under-fitting):欠拟合是指模型过于简单，无法捕捉到训练数据中的模式和特征，导致在训练数据和新数据上的表现都很差。
最佳拟合 (Optimal-fitting):最佳拟合是指模型恰当地捕捉到了训练数据中的模式和特征，同时也能很好地应用于新数据。这种情况下，模型在训练数据和测试数据上都有良好的表现。
过拟合 (Over-fitting): 过拟合是指模型过于复杂，过度地记住了训练数据中的每一个细节和噪声，从而失去了对新数据的泛化能力。过拟合的模型在训练数据上表现很好，但在新数据上表现较差。

总结：1.欠拟合 (Under-fitting)：模型太简单，不能很好地捕捉数据中的模式。简单例子：用直线拟合“U”形数据。实际例子：房价预测中只用面积一个特征。2.最佳拟合 (Optimal-fitting)：模型恰到好处，既能很好地拟合训练数据，也能对新数据有良好表现。简单例子：用合适的二次曲线拟合“U”形数据。实际例子：房价预测中使用了多个重要特征。3.过拟合 (Over-fitting)：模型太复杂，过度记住了训练数据，无法泛化到新数据。简单例子：用复杂的高次多项式拟合“U”形数据，过度拟合了每个数据点。实际例子：房价预测中加入了很多不相关特征，结果在新数据上效果不好。总之，目标是找到让模型最佳拟合训练数据和测试数据的平衡点，既不过于简单也不过于复杂。

深度学习

深度学习是一种机器学习方法，它利用多层神经网络进行复杂的数据处理和模式识别。在理解深度学习时，我们需要了解神经网络的三种关键层：输入层（Input Layer）、隐藏层（Hidden Layer）和输出层（Output Layer）。

简而言之:1.输入层：接收原始数据。2.隐藏层：提取和转换输入数据的特征。3.输出层：给出预测结果。
通过这些层的协同工作，神经网络能够从原始数据中学习模式，并对新数据进行准确的预测或分类。神经网络（Neural Network）是模仿人脑工作原理的一种算法，由多个互相连接的节点（也叫神经元）组成。这些节点被组织成不同的层，通过层与层之间的连接和权重调整来处理数据。

神经网络

神经网络的基本概念:1.节点（Neuron）：类似于人脑中的神经元，每个节点接收输入信号，进行处理后发送输出信号。2.层（Layer）：神经网络的结构由多个层组成，每层包含一定数量的节点。一般分为输入层、隐藏层和输出层。3.连接（Weights）：每两个相邻层之间的节点通过带有权重的连接相连，这些权重决定了信号传输的强度。

CNN（卷积神经网络）

    卷积神经网络（CNN）是一种特别设计用来处理具有类似网格结构的数据的深度学习模型，例如图像（本质上是像素的矩阵）。在最简单的术语中，CNN通过模拟我们人类的视觉系统工作来帮助计算机“看懂”图像或其他类似数据。

RNN（循环神经网络)

循环神经网络（RNN）:是一种专为处理序列数据（如文字、语音或任何连续的时间数据）而设计的神经网络。与传统的神经网络不同，RNN能够处理输入之间的时间动态关系，使其特别适用于那些需要理解时间序列数据或上下文信息的场景。基本工作原理:它记住之前发生的事情，并使用这些信息来帮助作出当前的决策。RNN内部有所谓的“循环”，这使得过去的信息能够影响当前的输出。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业