《人工智能技术入门》封面

内容简介

本书全面讲述人工智能涉及的技术,学完本书后,读者将对人工智能技术有全面的理解,并能掌握AI整体知识架构。

本书共分11章,内容包括人工智能概述、AI产业、数据、机器学习概述、模型、机器学习算法、深度学习、TensorFlow、神经网络、知识图谱、数据挖掘,以及银行业、医疗行业、公共安全、制造业等行业人工智能应用情况。附录给出了极有参考价值的人工智能术语列表。

本书适合人工智能技术初学者、人工智能行业准从业人员、AI投资领域的技术专家,也适合作为高等院校和培训学校人工智能相关专业师生的教学参考书。

作者简介

杨正洪,毕业于美国StateUniversityofNewYorkatStonyBrook,在美国硅谷从事AI和大数据相关研发工作十余年,华中科技大学和中国地质大学客座教授,湖北省2013年海外引进人才,并拥有多项国家专利。杨正洪参与了大数据和人工智能的国家标准的制定,在2016年参与了公安部主导的“信息安全技术:大数据平台安全管理产品安全技术要求”的国家标准制定。杨正洪是中关村海外智库专家顾问和住建部中规院专家顾问,曾担任在美上市公司CTO、北京某国企CIO和上海某国企高级副总裁等职。多年从事人工智能与大数据技术的实践,出版了《智慧城市》《大数据技术入门》等多本畅销书。

目录

第1章人工智能概述1
1.1AI是什么2
1.1.1火热的AI2
1.1.2AI的驱动因素3
1.2AI技术的成熟度4
1.2.1视觉识别4
1.2.2自然语言理解5
1.2.3机器人7
1.2.4自动驾驶7
1.2.5机器学习8
1.2.6游戏9
1.3AI与大数据的关系10
1.4AI与云计算的关系13
1.5AI技术路线14
第2章AI产业16
2.1基础层17
2.1.1芯片产业18
2.1.2GPU20
2.1.3FPGA20
2.1.4ASIC21
2.1.5TPU21
2.1.6的芯片22
2.1.7芯片产业小结23
2.1.8传感器24
2.1.9传感器小结26
2.2技术层27
2.2.1机器学习28
2.2.2语音识别与自然语言处理29
2.2.3计算机视觉32
2.3应用层34
2.3.1安防34
2.3.2金融35
2.3.3制造业37
2.3.4智能家居37
2.3.5医疗38
2.3.6自动驾驶40
2.4AI产业发展趋势分析44
第3章机器学习概述47
3.1走进机器学习47
3.1.1什么是机器学习47
3.1.2机器学习的感性认识48
3.1.3机器学习的本质48
3.1.4对机器学习的全面认识50
3.1.5机器学习、深度学习与人工智能50
3.1.6机器学习、数据挖掘与数据分析51
3.2机器学习的基本概念53
3.2.1数据集、特征和标签53
3.2.2监督式学习和非监督式学习54
3.2.3强化学习和迁移学习54
3.2.4特征数据类型56
3.2.5训练集、验证集和测试集56
3.2.6机器学习的任务流程57
3.3数据预处理57
3.3.1探索性分析58
3.3.2数据清洗58
3.3.3特征工程59
3.4算法60
3.5初探机器学习的开源框架61
3.5.1scikit-learn简介62
3.5.2个机器学习实例62
3.5.3JupyterNotebook64
3.5.4多实例分析67
第4章特征工程72
4.1数据预处理72
4.1.1量纲不统一73
4.1.2把定量特征二值化(用于列向量)74
4.1.3对定性特征进行编码74
4.1.4缺失值处理(用于列向量)76
4.1.5数据变换76
4.1.6数据预处理总结77
4.2特征选择77
4.2.1Filter法78
4.2.2Wrapper法78
4.2.3Embedded法79
4.2.4特征选择总结79
4.3降维79
4.4特征工程实例分析80
4.4.1数据相关性分析(手工选择特征)80
4.4.2数据预处理82
4.4.3特征抽取85
4.4.4特征工程总结86
第5章模型训练和评估88
5.1什么是模型88
5.2误差和MSE90
5.3模型的训练91
5.3.1模型与算法的区别91
5.3.2迭代法92
5.4梯度下降法93
5.4.1步长94
5.4.2优化步长94
5.4.3三类梯度下降法95
5.4.4梯度下降的详细算法96
5.5模型的拟合效果97
5.5.1欠拟合与过度拟合97
5.5.2过度拟合的处理方法98
5.6模型的评估99
5.6.1分类模型的评估99
5.6.2回归模型的拟合效果评估106
5.6.3其他的评价指标106
5.7模型的改进106
第6章算法选择和优化108
6.1算法概述108
6.1.1线性回归109
6.1.2逻辑回归109
6.1.3线性判别分析111
6.1.4分类与回归树分析111
6.1.5朴素贝叶斯112
6.1.6K近邻算法113
6.1.7学习向量量化113
6.1.8支持向量机114
6.1.9随机森林(RandomForest)115
6.1.10AdaBoost115
6.2支持向量机(SVM)算法116
6.3逻辑回归算法118
6.4KNN算法119
6.4.1超参数k120
6.4.2KNN实例:波士顿房价预测121
6.4.3算法评价124
6.5决策树算法124
6.6集成算法127
6.6.1集成算法简述127
6.6.2集成算法之Bagging127
6.6.3集成算法之Boosting128
6.7聚类算法129
6.7.1K均值聚类130
6.7.2均值漂移聚类131
6.7.3基于密度的聚类算法132
6.7.4用高斯混合模型的大期望聚类133
6.7.5凝聚层次聚类134
6.7.6图团体检测135
6.8机器学习算法实例137
6.8.1训练和预测138
6.8.2自动调参139
6.8.3尝试不同算法141
第7章深度学习144
7.1走进深度学习144
7.1.1深度学习为何崛起145
7.1.2从逻辑回归到浅层神经网络145
7.1.3深度神经网络147
7.1.4正向传播148
7.1.5激活函数148
7.2神经网络的训练148
7.2.1神经网络的参数148
7.2.2向量化149
7.2.3代价函数149
7.2.4梯度下降和反向传播149
7.3神经网络的优化和改进150
7.3.1神经网络的优化策略150
7.3.2正则化方法152
7.4卷积神经网络154
7.4.1卷积运算154
7.4.2卷积层155
7.4.3卷积神经网络(CNN)实例156
7.5深度学习的优势161
7.6深度学习的实现框架162
第8章TensorFlow164
8.1TensorFlow工具包164
8.1.1tf.estimatorAPI165
8.1.2Pandas速成165
8.1.3必要的Python知识167
8.2个TensorFlow程序169
8.2.1加载数据170
8.2.2探索数据171
8.2.3训练模型171
8.2.4评估模型173
8.2.5优化模型175
8.2.6合成特征181
8.2.7离群值处理184
8.3过度拟合处理187
8.3.1训练集和测试集188
8.3.2验证集189
8.3.3过度拟合实例190
8.4特征工程199
8.4.1数值型数据199
8.4.2字符串数据和独热编码(One-HotEncoding)199
8.4.3枚举数据(分类数据)200
8.4.4好特征200
8.4.5数据清洗200
8.4.6分箱(分桶)技术202
8.4.7特征工程实例202
第9章TensorFlow知识212
9.1特征交叉212
9.1.1什么是特征交叉212
9.1.2FTRL实践214
9.1.3分箱(分桶)代码实例217
9.1.4特征交叉代码实例220
9.2L2正则化223
9.3逻辑回归225
9.4分类227
9.4.1ROC和AUC227
9.4.2预测偏差228
9.4.3分类代码实例229
9.5L1正则化241
0章神经网络251
10.1什么是神经网络251
10.1.1隐藏层252
10.1.2激活函数253
10.1.3ReLU254
10.1.4实例代码254
10.2训练神经网络263
10.2.1正向传播算法263
10.2.2反向传播算法265
10.2.3归一化特征值267
10.2.4随机失活正则化267
10.2.5代码实例268
10.3多类别神经网络284
10.3.1一对多方法284
10.3.2Softmax285
10.3.3代码实例286
10.4嵌入301
10.4.1协同过滤301
10.4.2稀疏数据302
10.4.3获取嵌入304
10.4.4代码实例304
1章人工智能应用315
11.1银行业315
11.2医疗行业316
11.3公共安全320
11.4制造业321
附录A人工智能的历史发展322
附录B人工智能网上资料327
附录C本书中采用的人工智能中英文术语330
附录D术语列表332
······

最后修改:2024 年 07 月 25 日