数据分析基础

数据分析流程

  1. 目的和内容:项目-整体框架、业务问题-分析对象
  2. 数据收集:准确、有效(SQL语言)
  3. 数据预处理:检验、清洗
  4. 数据分析:方法、软件
  5. 数据表现:表、图形
  6. 数据报告:整体框架、结论、建议、解决方案

数据分析方法

  1. 预处理加工:描述性统计分析(趋势、分布);相关分析(单一、多个、相关系数)
  2. 基于梳理统计:方差分析、回归分析、因子分析
  3. 数据挖掘:
    - 聚类分析(层次分析、K-均值、模糊聚类、高斯回归……);
    - 分类分析(决策树、神经网络、贝叶斯分类、SVM、随机森林……);
    - 回归分析(线性回归、逻辑回归……)

基础工具

  1. Excel、SQL:SPSS、Eviews、Tableau……
  2. R、Matlab、D3
  3. Python:Hadoop、Hive

数据的趋势

统计中的简单概念

大数据学习——Day4(数据分析基础、数据的趋势)

集中趋势

一组数据向某一中心值靠拢的程度。

  1. 平均数:算数平均数、加权算法平均数、几何算法平均数
  2. 众数
    - 出险次数多,不受极端值影响
    - 在数量较大时更有意义
  3. 分位数:分位数(Quantile),亦称分位点,是指将一个随机变量的概率分布范围分为几个等份的数值点,常用的有中位数(即二分位数)、四分位数、百分位数等。

大数据学习——Day4(数据分析基础、数据的趋势)

离中趋势

  1. 极差
  2. 分位差:与分位矩有关
  3. 平均差
  4. 方差和标准差
  5. 离散系数:/方差/平均数

相关文章:

  • 2021-04-04
  • 2021-11-29
  • 2021-08-31
  • 2021-06-06
  • 2021-05-06
  • 2021-04-03
  • 2021-06-22
猜你喜欢
  • 2021-04-08
  • 2021-08-04
  • 2021-11-26
  • 2021-12-24
  • 2021-08-27
  • 2021-12-21
  • 2022-02-25
相关资源
相似解决方案