人工智能（AI）全景学习手册

本文档系统梳理人工智能基础、发展、分支理论、代表算法、经典模型、行业应用、工具资源与未来趋势，适合初学者、开发者及研究者查阅。

1. 人工智能概述
2. AI 发展简史与代表人物
3. 机器学习（ML）
4. 深度学习（DL）
5. 自然语言处理（NLP）
6. 计算机视觉（CV）
7. 强化学习（RL）
8. 其他分支与交叉领域
9. AI 伦理与社会影响
10. 发展趋势与前沿
11. 经典论文与书籍推荐
12. 常见问题与学习建议

1. 人工智能概述

人工智能（Artificial Intelligence, AI）是研究如何让计算机模拟、延伸和扩展人类智能的学科。AI 涉及感知、推理、学习、规划、自然语言处理等多个方面。

感知：如语音识别、图像识别
推理与决策：如自动驾驶、博弈
学习：如机器学习、深度学习
自然语言处理：如翻译、智能问答
规划与控制：如机器人路径规划

2. AI 发展简史与代表人物

1950年代：AI 概念萌芽，图灵测试（A. Turing）提出“机器能否思考”的问题；感知机（F. Rosenblatt）作为最早的神经网络模型，为后续研究奠定基础。
1960-70年代：专家系统兴起（如 DENDRAL，由 E. Feigenbaum 开发），用于特定领域推理；但受限于计算能力和数据，AI 进入“寒冬”。
1980年代：反向传播算法（G. Hinton、D. Rumelhart 等）让多层神经网络训练成为可能；机器学习开始作为独立领域发展。
1997年：IBM 深蓝（Deep Blue）击败国际象棋大师卡斯帕罗夫，标志着 AI 在特定任务上超越人类。
2012年：深度学习在 ImageNet 大赛中取得突破，AlexNet（A. Krizhevsky 等）大幅提升图像分类精度，开启深度学习热潮。
2016年：DeepMind 的 AlphaGo（D. Silver 等）战胜围棋世界冠军李世乭，展示强化学习与深度学习的强大结合。
2017年-至今：Transformer 模型（Attention is All You Need）推动 NLP 领域革命；大语言模型（GPT、BERT）与多模态 AI 成为热点。

代表人物：

Alan Turing：AI 理论奠基人，提出图灵测试。
Geoffrey Hinton：深度学习之父，反向传播算法与深度信念网络的提出者。
Yann LeCun：卷积神经网络（CNN）先驱，开发 LeNet 用于手写数字识别。
Yoshua Bengio：深度学习三巨头之一，研究 RNN 与生成模型。
Andrew Ng：AI 教育推广者，创建 Coursera 机器学习课程，推动 AI 普及。
Fei-Fei Li：计算机视觉领域先驱，创建 ImageNet 数据集，推动 CV 研究。
Demis Hassabis：DeepMind 创始人，领导 AlphaGo、AlphaFold 等项目。

3. 机器学习（ML）

机器学习（Machine Learning, ML）是让计算机通过数据自动学习规律并进行预测或决策的技术，是 AI 的核心分支之一。它基于统计学和优化理论，通过算法从数据中提取特征和模式。

3.1 代表算法与模型

线性回归（Linear Regression）：预测连续值，基于最小二乘法优化。
逻辑回归（Logistic Regression）：用于二分类，通过 sigmoid 函数将输出映射到 (0,1)。
决策树（Decision Tree）：树形结构，通过特征分裂数据，选择信息增益或基尼系数最大的特征作为节点。
支持向量机（SVM）：寻找最大间隔超平面分割数据，支持核技巧处理非线性问题。
K近邻（K-Nearest Neighbors, KNN）：基于距离度量，预测时选择最近的 K 个样本的多数类或平均值。
朴素贝叶斯（Naive Bayes）：基于贝叶斯定理，假设特征条件独立，适用于文本分类等。
集成方法：
- 随机森林（Random Forest）：多个决策树的集成，减少过拟合。
- 梯度提升树（Gradient Boosting）：如 XGBoost、LightGBM、CatBoost，通过迭代优化损失函数，广泛用于结构化数据预测。

3.2 经典应用与案例

金融领域：信用评分
- 问题：银行需评估贷款申请人的还款能力，预测违约风险。
- 解决方案：使用逻辑回归或 XGBoost，基于历史数据（收入、信用记录、负债比等）训练模型，输出违约概率。
- 效果：准确率达 85% 以上，显著降低坏账率；模型可解释性强，便于合规审查。
- 工具：scikit-learn、XGBoost。
电子商务：推荐系统
- 问题：如何为用户推荐感兴趣的商品，提高转化率？
- 解决方案：协同过滤（基于用户-物品矩阵）结合随机森林或矩阵分解，预测用户偏好。
- 效果：个性化推荐提升点击率 30%，如 Amazon、Netflix 广泛应用。
- 工具：Surprise、LightFM。
医疗：疾病预测
- 问题：基于患者数据预测疾病风险，如糖尿病。
- 解决方案：使用决策树或梯度提升模型，输入特征包括年龄、BMI、血糖值等，输出患病概率。
- 效果：早期干预降低发病率；模型结合特征重要性分析，帮助医生理解风险因素。
- 工具：scikit-learn、SHAP（解释性工具）。

3.3 主要工具与平台

scikit-learn：Python 机器学习库，涵盖分类、回归、聚类、降维等功能，适合快速原型。
XGBoost / LightGBM / CatBoost：高效梯度提升框架，竞赛和工业界标配。
Weka：Java 工具，图形化界面，适合教学。
RapidMiner / KNIME：流程化建模工具，适合非编程用户。
Kaggle：数据科学竞赛平台，提供数据集和基准模型。

3.4 代码示例

3.4.1 线性回归（基础）

python

import numpy as np
from sklearn.linear_model import LinearRegression
X = np.array([[1], [2], [3], [4]])
y = np.array([2, 4, 6, 8])
model = LinearRegression()
model.fit(X, y)
print('预测5对应的y:', model.predict([[5]]))  # 预期输出: [10.]
print('权重:', model.coef_, '偏置:', model.intercept_)  # 查看模型参数

3.4.2 决策树分类（基础）

python

from sklearn import tree
X = [[0, 0], [1, 1]]
y = [0, 1]
clf = tree.DecisionTreeClassifier()
clf = clf.fit(X, y)
print('预测:', clf.predict([[2, 2]]))  # 预期输出: [1]

3.4.3 K-Means 聚类（无监督）

python

from sklearn.cluster import KMeans
import numpy as np
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
print('聚类标签:', kmeans.labels_)  # 输出每个样本的簇标签
print('簇中心:', kmeans.cluster_centers_)  # 输出簇中心坐标

3.4.4 XGBoost 分类（进阶）

python

import xgboost as xgb
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
# 生成数据
X, y = make_classification(n_samples=1000, n_features=20, n_classes=2, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 训练模型
dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)
params = {'objective': 'binary:logistic', 'eval_metric': 'auc', 'max_depth': 6, 'eta': 0.1}
bst = xgb.train(params, dtrain, num_boost_round=100, evals=[(dtest, 'test')])
# 预测
preds = bst.predict(dtest)
print('预测概率前5个:', preds[:5])

4. 深度学习（DL）

深度学习（Deep Learning, DL）是机器学习的子领域，利用多层神经网络（Deep Neural Networks）处理复杂数据，尤其擅长图像、语音和文本等非结构化数据。DL 的核心是特征自动提取，减少人工特征工程。

4.1 发展历史与里程碑

1943年：McCulloch 和 Pitts 提出人工神经元模型。
1958年：Rosenblatt 提出感知机，但仅能处理线性可分问题。
1986年：反向传播算法（Backpropagation）由 Hinton 等推广，解决多层网络训练难题。
1989年：Yann LeCun 提出 LeNet，首个卷积神经网络，用于手写数字识别。
2012年：AlexNet 在 ImageNet 比赛中大幅超越传统方法，标志深度学习进入主流。
2014-2015年：ResNet（残差网络）解决深度网络退化问题，网络层数突破百层。
2017年：Transformer 模型提出，颠覆 NLP 领域，催生 BERT、GPT 系列。
2020年至今：大模型时代，GPT-3、DALL-E、Stable Diffusion 展示生成能力。

4.2 代表模型

前馈神经网络（FNN）：最基础的深度网络，层与层全连接，适用于结构化数据。
卷积神经网络（CNN）：专为图像设计，利用卷积核提取局部特征，减少参数量。
- LeNet (1998)：5层网络，用于手写数字识别。
- AlexNet (2012)：8层，引入 Dropout、ReLU、数据增强，ImageNet 冠军。
- VGG (2014)：16-19层，强调小卷积核堆叠。
- ResNet (2015)：引入残差连接，可训练超深网络（百层以上）。
循环神经网络（RNN）：处理序列数据，具备“记忆”能力，适用于时间序列、文本。
- LSTM (1997)：长短期记忆网络，解决 RNN 梯度消失问题。
- GRU (2014)：简化 LSTM，计算效率更高。
生成对抗网络（GAN, 2014）：由生成器和判别器组成，用于图像生成、风格迁移。
Transformer (2017)：基于注意力机制，取代 RNN，成为 NLP 和多模态任务主流。
- BERT (2018)：双向编码器，预训练+微调模式，提升文本理解。
- GPT (2018-至今)：生成预训练变换器，擅长文本生成，GPT-3/4 参数超千亿。

4.3 经典应用与案例

图像识别：ImageNet 挑战与自动驾驶
- 问题：如何从图像中准确识别物体类别？自动驾驶中如何识别行人、车辆？
- 解决方案：使用 CNN（如 ResNet、EfficientNet）在 ImageNet 数据集上预训练，再微调到特定任务；结合目标检测（如 YOLO、Faster R-CNN）定位物体。
- 效果：ImageNet 顶级模型错误率低于 3%（接近人类）；Tesla 自动驾驶系统实时检测障碍物，减少事故率。
- 工具：PyTorch、TensorFlow、MMDetection。
语音识别：智能助手
- 问题：如何将语音转录为文本，理解用户意图？
- 解决方案：结合 RNN/LSTM 或 Transformer（如 Wav2Vec）处理音频时序特征，映射为文本；后接 NLP 模型解析语义。
- 效果：如 Siri、Alexa，语音识别准确率超 95%，支持多语言。
- 工具：Kaldi、DeepSpeech、HuggingFace。
生成艺术：DALL-E 与 Stable Diffusion
- 问题：如何基于文本提示生成高质量图像？
- 解决方案：使用扩散模型（Diffusion Models）或 GAN，通过噪声逐步生成图像，结合 CLIP 模型对齐文本-图像语义。
- 效果：生成逼真艺术作品，广泛用于设计、广告；Stable Diffusion 开源后用户超千万。
- 工具：Stable Diffusion、MidJourney。

4.4 主要工具与平台

TensorFlow：Google 开发，工业级深度学习框架，支持大规模部署。
PyTorch：Facebook 开发，学术界主流，动态图计算便于调试。
Keras：TensorFlow 高层 API，简化模型构建。
MXNet / PaddlePaddle：高效框架，适合特定场景。
HuggingFace：专注于 Transformer 模型，提供预训练模型和工具。
ONNX：模型格式标准，支持跨框架转换。

4.5 代码示例

4.5.1 简单神经网络（基础）

python

import torch
import torch.nn as nn
import torch.optim as optim
class Net(nn.Module):
    def __init__(self):
        super().__init__()
        self.fc = nn.Linear(2, 1)
    def forward(self, x):
        return torch.sigmoid(self.fc(x))
model = Net()
criterion = nn.BCELoss()
optimizer = optim.Adam(model.parameters(), lr=0.01)
X = torch.tensor([[0.,0.],[0.,1.],[1.,0.],[1.,1.]])
y = torch.tensor([[0.],[1.],[1.],[0.]])
for epoch in range(1000):
    optimizer.zero_grad()
    outputs = model(X)
    loss = criterion(outputs, y)
    loss.backward()
    optimizer.step()
print('预测:', model(X).detach().numpy())

4.5.2 CNN 图像分类（进阶，使用 MNIST 数据集）

python

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
# 定义简单 CNN
class SimpleCNN(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(1, 16, 3)  # 输入通道1，输出16，卷积核3x3
        self.pool = nn.MaxPool2d(2, 2)    # 池化层
        self.conv2 = nn.Conv2d(16, 32, 3)
        self.fc1 = nn.Linear(32 * 5 * 5, 120)  # 全连接层
        self.fc2 = nn.Linear(120, 10)          # 输出10类
    def forward(self, x):
        x = self.pool(torch.relu(self.conv1(x)))
        x = self.pool(torch.relu(self.conv2(x)))
        x = x.view(-1, 32 * 5 * 5)  # 展平
        x = torch.relu(self.fc1(x))
        x = self.fc2(x)
        return x
# 数据加载
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
trainset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)
# 训练
model = SimpleCNN()
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)
for epoch in range(2):  # 仅训练2轮示例
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        running_loss += loss.item()
        if i % 100 == 99:
            print(f'[Epoch {epoch + 1}, Batch {i + 1}] loss: {running_loss / 100:.3f}')
            running_loss = 0.0
print('训练完成')

4.5.3 使用预训练模型进行图像分类（实用）

python

import torch
from torchvision import models, transforms
import cv2
# 图像预处理
preprocess = transforms.Compose([
    transforms.ToPILImage(),
    transforms.Resize((224,224)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])
# 读取图像
img = cv2.imread('cat.jpg')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
input_tensor = preprocess(img).unsqueeze(0)  # 增加 batch 维度
# 加载预训练 ResNet18 模型
model = models.resnet18(pretrained=True)
model.eval()
# 预测
with torch.no_grad():
    output = model(input_tensor)
    probabilities = torch.nn.functional.softmax(output[0], dim=0)
    top5_prob, top5_catid = torch.topk(probabilities, 5)
    print('Top 5 预测类别与概率:', [(catid.item(), prob.item()) for catid, prob in zip(top5_catid, top5_prob)])
# 注：类别 ID 需映射到 ImageNet 标签列表查看具体类别名

5. 自然语言处理（NLP）

自然语言处理（Natural Language Processing, NLP）是让计算机理解和生成自然语言的技术，包括文本分类、情感分析、机器翻译、问答系统、对话机器人等。

5.1 代表任务

文本分类：将文本分为预定义类别，如 spam/非 spam 邮件。
情感分析：判断文本的情感倾向，如积极、消极、中性。
机器翻译：将一种语言的文本翻译为另一种语言，如 Google Translate。
问答系统：根据问题提供答案，如 Siri、Alexa。
对话机器人：模拟人类对话，如 chatbot。

5.2 代表模型

RNN：循环神经网络，适用于序列数据。
LSTM：长短期记忆网络，解决 RNN 梯度消失问题。
GRU：门控循环单元网络，简化 LSTM，计算效率更高。
Transformer：基于注意力机制，取代 RNN，成为 NLP 和多模态任务主流。
BERT：双向编码器，预训练+微调模式，提升文本理解。
GPT：生成预训练变换器，擅长文本生成，GPT-3/4 参数超千亿。

5.3 主要工具与平台

NLTK：自然语言处理库，提供文本处理工具。
spaCy：现代自然语言处理库，提供高性能文本处理。
HuggingFace Transformers：提供预训练模型和工具，支持多种 NLP 任务。
Stanford CoreNLP：提供自然语言处理工具，包括分词、命名实体识别等。

5.4 代码示例

5.4.1 文本分类

python

from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
texts = ['I love AI', 'AI is the future', 'I hate bugs']
labels = [1, 1, 0]
vec = CountVectorizer()
X = vec.fit_transform(texts)
model = MultinomialNB()
model.fit(X, labels)
print('预测:', model.predict(vec.transform(['AI is great', 'bugs are bad'])))

6. 计算机视觉（CV）

计算机视觉（Computer Vision, CV）是让计算机理解图像与视频的技术，包括图像分类、目标检测、图像分割、人脸识别、姿态估计等。

6.1 代表任务

图像分类：将图像分为预定义类别，如 ImageNet。
目标检测：在图像中定位和识别物体，如 YOLO、Faster R-CNN。
图像分割：将图像分为像素级别的类别，如语义分割。
人脸识别：识别图像中的人脸，如 FaceNet。
姿态估计：估计人体姿态，如 OpenPose。

6.2 代表模型

LeNet：5层卷积神经网络，用于手写数字识别。
AlexNet：8层卷积神经网络，ImageNet 冠军。
VGG：16-19层卷积神经网络，强调小卷积核堆叠。
ResNet：引入残差连接，可训练超深网络（百层以上）。
YOLO：实时目标检测模型，基于卷积神经网络。
Faster R-CNN：目标检测模型，基于卷积神经网络和区域提议网络。

6.3 主要工具与平台

OpenCV：计算机视觉库，提供图像处理工具。
Pillow：Python 图像处理库，提供图像处理工具。
PyTorch/TensorFlow：深度学习框架，支持计算机视觉任务。
MMDetection：目标检测库，提供预训练模型和工具。

6.4 代码示例

6.4.1 图像分类（伪代码）

python

import cv2
import torch
from torchvision import models, transforms
img = cv2.imread('cat.jpg')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
preprocess = transforms.Compose([
    transforms.ToPILImage(),
    transforms.Resize((224,224)),
    transforms.ToTensor(),
])
input_tensor = preprocess(img).unsqueeze(0)
model = models.resnet18(pretrained=True)
model.eval()
with torch.no_grad():
    output = model(input_tensor)
print('预测类别:', output.argmax().item())

7. 强化学习（RL）

强化学习（Reinforcement Learning, RL）是让智能体通过与环境交互获得奖励并学习策略的技术，包括 Q-Learning、SARSA、DQN、Policy Gradient、A3C 等。

7.1 代表算法

Q-Learning：基于值函数的强化学习算法。
SARSA：基于值函数的强化学习算法，考虑状态和动作。
DQN：深度 Q 网络，结合深度学习和 Q-Learning。
Policy Gradient：基于策略的强化学习算法，直接优化策略。
A3C：异步优势演员-评论家算法，结合深度学习和 Policy Gradient。

7.2 经典应用

游戏 AI：AlphaGo、Atari 等游戏 AI。
机器人控制：机器人运动控制、抓取等。
智能调度：资源调度、交通调度等。

7.3 主要工具与平台

OpenAI Gym：强化学习环境，提供标准化接口。
Stable Baselines：强化学习库，提供预训练模型和工具。
RLlib：强化学习库，提供分布式训练支持。

7.4 代码示例

7.4.1 Q-Learning

python

import numpy as np
Q = np.zeros((5, 2))
alpha = 0.1
gamma = 0.9
for episode in range(100):
    state = np.random.randint(0, 5)
    action = np.random.choice([0,1])
    reward = np.random.randn()
    next_state = np.random.randint(0, 5)
    Q[state, action] += alpha * (reward + gamma * Q[next_state].max() - Q[state, action])
print('Q表:', Q)

8. 其他分支与交叉领域

知识图谱：结构化表示实体和关系，用于语义搜索和推荐。
推荐系统：基于用户行为或内容相似性推荐商品、内容。
联邦学习：分布式训练模型，保护数据隐私。
自动机器学习：自动化模型选择、超参数优化。
AI 芯片与硬件加速：TPU、GPU、NPU 优化 AI 计算。
生成式 AI：生成文本、图像、音频。
AI for Science：AI 加速科学研究。
多模态 AI：融合视觉、语言、音频。
高效 AI：模型压缩、量化、知识蒸馏。
可解释性与可信 AI：提升模型透明度，确保决策可追溯。

9. AI 伦理与社会影响

算法偏见：AI 模型可能继承训练数据中的偏见，导致不公平结果。
隐私保护：AI 系统收集和处理大量个人数据，存在泄露风险。
自动化失业：AI 替代重复性工作，可能导致结构性失业。
AI 治理与责任：AI 系统决策缺乏透明性，责任归属不明。
武器化与安全风险：AI 可能被用于网络攻击或自主武器。

10. 发展趋势与前沿

大模型：GPT-4、PaLM 等参数超千亿模型。
多模态 AI：融合视觉、语言、音频。
AI for Science：AI 加速科学研究。
高效 AI：模型压缩、量化、知识蒸馏。
可解释性与可信 AI：提升模型透明度，确保决策可追溯。
AI+行业：深度定制化，如智慧城市、智能制造。
量子机器学习：结合量子计算，探索更高效优化算法。
通用人工智能：从狭义 AI 走向通用智能，具备跨领域学习和推理能力。

11. 经典论文与书籍推荐

论文：
- Turing, A.M. "Computing Machinery and Intelligence" (1950)
- Hinton, G. "Learning representations by back-propagating errors" (1986)
- Vaswani, A. "Attention is All You Need" (2017)
书籍：
- 《机器学习》（周志华）
- 《深度学习》（Ian Goodfellow）
- 《统计学习方法》（李航）
- 《Pattern Recognition and Machine Learning》（Bishop）

12. 常见问题与学习建议

建议多用 Jupyter Notebook 进行实验。
包缺失可用 pip 安装，如 pip install numpy scikit-learn torch torchvision opencv-python。
先用小数据集，理解原理后再扩展到大数据。
关注社区和前沿论文，及时更新知识。
多做项目，理论与实践结合。
加入 AI 社区，与同行交流。

本文档为起航项目 AI 学习专栏，欢迎补充与交流！

人工智能（AI）全景学习手册 ​

目录 ​

1. 人工智能概述 ​

2. AI 发展简史与代表人物 ​

3. 机器学习（ML） ​

3.1 代表算法与模型 ​

3.2 经典应用与案例 ​

3.3 主要工具与平台 ​

3.4 代码示例 ​

3.4.1 线性回归（基础） ​

3.4.2 决策树分类（基础） ​

3.4.3 K-Means 聚类（无监督） ​

3.4.4 XGBoost 分类（进阶） ​

4. 深度学习（DL） ​

4.1 发展历史与里程碑 ​

4.2 代表模型 ​

4.3 经典应用与案例 ​

4.4 主要工具与平台 ​

4.5 代码示例 ​

4.5.1 简单神经网络（基础） ​

4.5.2 CNN 图像分类（进阶，使用 MNIST 数据集） ​

4.5.3 使用预训练模型进行图像分类（实用） ​

5. 自然语言处理（NLP） ​

5.1 代表任务 ​

5.2 代表模型 ​

5.3 主要工具与平台 ​

5.4 代码示例 ​

5.4.1 文本分类 ​

6. 计算机视觉（CV） ​

6.1 代表任务 ​

6.2 代表模型 ​

6.3 主要工具与平台 ​

6.4 代码示例 ​

6.4.1 图像分类（伪代码） ​

7. 强化学习（RL） ​

7.1 代表算法 ​

7.2 经典应用 ​

7.3 主要工具与平台 ​

7.4 代码示例 ​

7.4.1 Q-Learning ​

8. 其他分支与交叉领域 ​

9. AI 伦理与社会影响 ​

10. 发展趋势与前沿 ​

11. 经典论文与书籍推荐 ​

12. 常见问题与学习建议 ​

人工智能（AI）全景学习手册

目录

1. 人工智能概述

2. AI 发展简史与代表人物

3. 机器学习（ML）

3.1 代表算法与模型

3.2 经典应用与案例

3.3 主要工具与平台

3.4 代码示例

3.4.1 线性回归（基础）

3.4.2 决策树分类（基础）

3.4.3 K-Means 聚类（无监督）

3.4.4 XGBoost 分类（进阶）

4. 深度学习（DL）

4.1 发展历史与里程碑

4.2 代表模型

4.3 经典应用与案例

4.4 主要工具与平台

4.5 代码示例

4.5.1 简单神经网络（基础）

4.5.2 CNN 图像分类（进阶，使用 MNIST 数据集）

4.5.3 使用预训练模型进行图像分类（实用）

5. 自然语言处理（NLP）

5.1 代表任务

5.2 代表模型

5.3 主要工具与平台

5.4 代码示例

5.4.1 文本分类

6. 计算机视觉（CV）

6.1 代表任务

6.2 代表模型

6.3 主要工具与平台

6.4 代码示例

6.4.1 图像分类（伪代码）

7. 强化学习（RL）

7.1 代表算法

7.2 经典应用

7.3 主要工具与平台

7.4 代码示例

7.4.1 Q-Learning

8. 其他分支与交叉领域

9. AI 伦理与社会影响

10. 发展趋势与前沿

11. 经典论文与书籍推荐

12. 常见问题与学习建议