解决行业问题的统计思维

免费的在线统计学课程

预测性建模和文本挖掘

预测性分析是指利用数据和统计算法来预测在当前过程和环境下可能发生的事情。

在本模块中,您将了解到在构建预测性模型中使用的一些核心方法,包括如何解决过拟合,如何选择最佳的预测性模型,以及如何使用多元线性回归和 Logistic 回归。您还将了解如何拟合其他类型的预测性模型,包括惩罚回归、决策树和神经网络。最后,您将了解如何从非结构化文本数据(如调查响应数据)中提取信息和含义。

本模块涵盖的特定主题包括:

预测性建模的要点

  • 预测性建模的介绍
  • 过拟合与模型验证
  • 评估模型性能:预测模型
  • 评估模型性能:分类模型
  • 受试者操作特征 (ROC) 曲线

决策树

  • 决策树的介绍
  • 分类树
  • 回归树
  • 带验证的决策树
  • 随机 (Bootstrap) 森林

神经网络

  • 什么是神经网络?
  • 解释神经网络
  • 带神经网络的预测性建模

广义回归

  • 广义回归的介绍
  • 使用最大似然法拟合模型
  • 惩罚回归的介绍

模型比较和选择

  • 比较预测性模型

文本挖掘的介绍

  • 文本挖掘的介绍
  • 处理文本数据
  • 管理词条列表
  • 可视化和探索文本数据
  • 分析(挖掘)文本数据