描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法
统计学的基础概念
统计学本质是收集、处理、分析、解释数据,并从中得出结论的科学。
数据类型不同维度分为不同数据:
测量尺度:分类数据、顺序数据、数值型数据;
收集方法:观测数据、实验数据;
时间状况:截面数据、时间序列数据。
数据分析的方法可分为描述统计和推断统计。
数量变量分为:
离散——度量『可数事物』的多少,离散型变量则是通过计数方式取得的,即是对所要统计的对象进行计数(计量),增长量非固定的。比如人数,客户数,生产产品数。
连续——度量『不可数事物』的多少,连续型变量是一直叠加上去的,增长量可以划分为固定的单位。比如身高,体重,重量。
(这个世界到底是离散的还是连续的?)
分类变量如“行业”,其变量值可以为“零售业”、“旅游业”、“汽车制造业”;
顺序变量如“产品等级”,其变量值可以位“一等品”、“二等品”、“次品”。
分类变量与顺序变量均可称为定性变量、属性变量。
数据的描述——数值方法
度量值来自于总体与样本的统计量。
度量值分为单变量与双变量,统计方法有:
单变量——中心位置、变异程度、分布形态、相对位置;
双变量——线性关系
中心位置的度量方法
变异程度
分布形态
线性关系
探索数据分析
在excel 数据---“数据分析---描述统计 中能得到所有指标值。
数据的概括性度量
集中趋势:平均数(算数平均数、几何平均数、调和平均数、算术-几何平均数、平均数不等式)、众数、中位数等。
离散程度:全距、内距、平均差、标准误、离散系数等。
分布:偏态系数、峰度系数,反映数据偏离正态分布的程度。
具体如图总结:
数据的图表展示
图表应简洁、合理的表达统计目的,不应在图形的修饰上花费太多时间。在绘制图形时,应避免一切不必要的装饰,注重图形所要表达的信息,图形产生的视觉效果应与数据所体现的事物特征一致,不得歪曲数据。
图表一般定义与约束
统计表左右两边不封口,列标题之间在必要时可用竖线分开,而行标题通常不必用横线分开;表中数据一般是右对齐,有小数点时小数点对齐,小数点位数统一,对于没有数字的单元,一般用“—”表示,表中不应出现空白单元格。
总结
閱讀更多 槓精君 的文章