个人主页:在线OJ的阿川
大佬的支持和鼓励,将是我成长路上最大的动力
阿川水平有限,如有错误,欢迎大佬指正


Python 初阶
Python–语言基础与由来介绍
Python–注意事项
Python–语句与众所周知
数据清洗前 基本技能
数据分析—技术栈和开发环境搭建
数据分析—Numpy和Pandas库基本用法及实例
统计学基础前 必看
数据分析—三前奏:获取/ 读取/ 评估数据
数据分析—数据清洗操作及众所周知
数据分析—数据整理操作及众所周知
数据分析与统计学不可分割
统计学概述
统计学主要是描述和推断
- 描述 
  
- 分类数据 
    
- 有限数量的类别的数据 
      
- 定序 
        
- 有顺序的 
          
- 例如金银铜三枚奖牌,金大于银大于铜
 
 
 - 有顺序的 
          
 - 定类 
        
- 例如猫的种类,不能说有顺序
 
 
 - 定序 
        
 
 - 有限数量的类别的数据 
      
 
 - 分类数据 
    
 
 
  - 数值数据 
    
- 对可进行数学运算和统计分析计算有意义的数据 
      
- 连续 
        
- 例如1~2之间区间有很多连续的数字
 
 - 离散 
        
- 只能以整数或自然数为单位的数据
 
 
 - 连续 
        
 
 - 对可进行数学运算和统计分析计算有意义的数据 
      
 
- 数值数据 
    
 

数值数据分析维度
数值数据是数据分析的重点,分析维度主要从三个方面来分析
- 集中趋势 
  
- 数据集中分布在哪里
 
 

- mean平均数
 

- median中位数
 

- mode众数
 

- 离散趋势 
  
- 数据偏离中心分布在哪里
 
 

- max-min极差
 

- var/std 方差/标准差
 

- quantile(0.75)- quantile(0.25)四分位距 
  
- 四分位距是将数据按顺序,按四等分分好并排序,处于三个分割点位置的数值就是四分位数-
 - 表示中间一半数值的离散程度 
    
- 越大说明数据越分散
 - 越小说明数据越集中
 
 
 


- 分布形状
 

- 可以看出数据的偏态、峰度、异常值
 - 分布形状主要是指直方图
plot 表示画图- kind参数具体什么形状 
    
- hist表示直方图
 
 
 - kind参数具体什么形状 
    
 

偏态解释
直方图一般为正态分布(平均值、中位数、众数差不多都位于中央)

偏态(平均数、中位数、众数偏离中央)
- 正偏态即右偏态
 - 负偏态及左偏态
 


注意一下直方图
- 数据量小,分布形状较不明显
 - 数据量大,分布形状较明显
 
好的,到此为止啦,祝您变得更强

 想说的话
实不相瞒,写的每篇博客都要写三四个小时(加上自己学习和纸质笔记,共五六小时吧),很累,希望大佬支持

| 道阻且长 行则将至 | 
|---|
个人主页:在线OJ的阿川 大佬的支持和鼓励,将是我成长路上最大的动力 ![]()  |  
  
版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/kjbd-tjx/6004.html
                