Python大数据与人工智能(学术)
课程亮点:
深度原理剖析+项目实战。朝九晚九全程跟班答疑、一对一督学、定期直播串讲、五分钟内有问必答、出勤率和进度监督、作业与测试
学习目标:
1:掌握主流机器学习算法; 2:实现使用机器学习算法解决实际问题的思路和能力; 3:通过案例的讲解,真正实现学校授课与实战。
课程内容:
01章机器学习入门介绍(1小时)
01-01什么是机器学习
01-02机器学习中的名词说明:类型、字段、特征、标签等
01-03机器学习中的基本概念:分类、预测、回归;有监督、无监督;模型效果、计算速度;可解释性、泛化能力等
01-04推荐工具书
02章scikit-learn入门:Scikit-Learn库简介(0.5小时)
03章KNN-最近邻分类算法:以电影分类为例(1.5小时)
03-01模型建立基本思路
03-02KNN原理基础及其实现: KNN原理基础距离的确认:欧几里得距离、马曼哈顿距离、闵可夫斯基距离; KNN的scikit-learn实现:模型的构建与评估
03-03模型优化:学习曲线、交叉验证
03-04模型评价与总结
04章决策树算法:泰坦尼克幸存者预测为例(3小时)
04-01决策树基本原理
04-02决策树的scikit-learn实现:八个参数(Criterion、两个随机性相关的参数、五个剪枝参数)、一个属性、四个接口)解析
04-03分类模型的评估指标(混淆矩阵原理、scikit-learn中的混淆矩阵)
04-04实例:泰坦尼克号幸存者的预测(数据导入、数据处理、模型构建与评估、利用混淆矩阵调参)
05章随机森林算法:以乳腺癌预测为例(3小时)
05-01随机森林概述:集成算法概述Bagging vs Boosting、集成算法的认识
05-02随机森林分类器的实现:重要参数、重要属性和接口
06章K-Means聚类算法:以电商用户画像为例(3小时)
06-01聚类算法概述:聚类VS分类
06-02KMeans原理分析
06-03KMeans的scikit-learn实现(模型构建与评估(轮廓系数)、重要参数解析、实例:根据轮廓系数选择簇)
07章关联规则算法:啤酒与尿布关联规则分析(2小时)
07-01关联规则概述:频繁项集的产生与关联发现
07-02Apriori算法原理:先验原理
07-03使用Apriori算法来发现频繁项集(生成候选项集(函数的构建与封装)、项集迭代函数)
08章线性回归模型在数据分析领域的应用:以房价预测为例(1小时)
09章逻辑回归:以信用卡反欺诈模型为例(3小时)
09-01逻辑回归概述:模型参数、sigmoid函数、逻辑回归的返回值解析
09-02逻辑回归的特点:模型拟合效果、计算速度、返回值的可解释型
09-03逻辑回归模型的构建与优化: 认识逻辑回归的损失函数; 重要参数解析; 梯度下降求解最小损失函数参数值
10章SVM支持向量机概述、应用及scikit-leaern实现(1小时)
11章分类模型的评估指标(2小时)
12章朴素贝叶斯算法:以文本分类为例(3小时)
12-01朴素贝叶斯概述
12-02应用:文本分类的实现