2018年中级经济师考试(金融)笔记第四部分统计
第一篇:2018年中级经济师考试(金融)笔记 第四部分 统计
第四章
统计
一、统计与统计数据
(一)统计学分支:描述统计和推断统计。
1.描述统计:取得所需数据,用图表或数学方法对数据整理和展示,描述数据的一般性特征。2.推断统计:用样本数据来推断总体特征的统计学方法。包括参数估计和假设检验。(1)参数估计是利用样本信息推断总体特征
(2)假设检验是利用样本判断对总体的假设是否成立。
(二)变量和数据
1.变量:研究对象的属性或特征。分类:(1)定量变量或数量变量:变量取值是数量(2)定性变量或品质变量:包括: ①分类变量:变量取值是类别
②顺序变量:变量取值是类别且有一定的顺序
2.数据:对变量进行测量、观测的结果。可以将统计数据分为:
(1)分类数据:不能用数值表示,通常用文字表述,也可用数值代码表示,但不区分顺序。(2)顺序数据:不能用数值表示,通常用文字表述,也可用数值代码表示,但有顺序。(3)数值型数据:说明的是现象的数量特征。3.数据的来源(1)观测数据(2)实验数据(3)一手数据(2)二手数据
(三)统计调查 1.统计调查的种类
(1)按调查对象的范围不同,分为: ①全面调查:包括全面统计报表和普查。
②非全面调查:包括非全面统计报表、抽样调查、重点调查、典型调查等。(2)按调查登记的时间是否连续,分为: ①连续调查:说明现象的发展过程。
②不连续调查:一般是为了对总体现象在一定时点的状态进行研究。
2.统计调查的方式:包括统计报表、普查、抽样调查、重点调查、典型调查(典型调查主要是一种定性调查研究,必须同其他调查结合起来使用,才能避免出现片面性。典型调查的作用:①弥补全面调查的不足;②在一定条件下可以验证全面调查数据的真实性。典型调查不在于反映现象的总量数据特征,在于了解与统计数字有关的生动的具体情况,做到定性分析和定量分析相结合。)
二、描述统计
(一)对数据分布特征的测度:①分布的集中趋势;②分布的离散程度(反应各数据的 差异程度,和中心数据的代表程度);③分布的偏态(反应数据分布的不对称性)。1.集中趋势的测度。测度集中趋势也就是寻数据一般水平的代表值或中心值。
(1)平均数。易受极端值影响。适用于定量变量,数值型数据,不适用与分类和顺序数据。(2)中位数。不受极值个影响。适用于顺序数据和数值型数据,尤其适用分布不对称的数值型数据。不适用于分类数据。
2018年甘肃省公务员考试公告
(3)众数。不受极值个影响;可能不唯一。适用于分类和顺序变量,不适用于定量变量。2.离散程度的测度:离散程度,是指数据之间的差异程度或频数分布的分散程度。离散程度的测度,主要包括极差、方差和标准差、离散系数等。适用于数值型数据。
①极差。是总体或分布中最大的标志值与最小的标志值之差,又称全距。它反映的是变量分布的变异范围或离散幅度,不能反映其间的变量分布情况,同时易受极端值的影响。②方差:数据组中各数值与其均值离差平方的平均数。越小则均值代表性越好。按自由度不同,分为总体方差和样本方差。
③标准差,总体所有单位标志值与其平均数离差之平方的平均数的平方根。标准差与方差是应用最广泛的统计离散程度的测度方法,只适用于数值型数据,对极端值也很敏感。④离散系数。也称变异系数或标准差系数,它是一组数据的标准差与其相应的算术平均数之比,是测度数据离散程度的相对指标。离散系数主要是用于比较不同组别数据的离散程度。目的是为消除变量值水平高低和计量单位不同对离散程度测定值的影响。3.布形态的测度
①偏态系数:测度数据分布偏度的统计量。SK=0,分布对称;0<SK≤0.5,轻度右偏;0.5
<SK≤1,中度右偏;SK>1,严重右偏。SK为负值,与正值相对应,不过是左偏。②标准分数:也称为Z分数。数值减去均值所得的差除以标准差。平均数为0,标准差为1。当数据成钟型分布的时候,68%的数据与平均数距离在1个标准差内;95%的数据与平均数距离在2个标准差内;99%的数据与平均数距离在3个标准差内。4.变量间的相关分析
①变量间相关关系的分类:
按相关程度分:完全相关,不完全相关,不相关。
按相关方向分:正相关,负相关。
按相关形式分:线性相关(不一定是直线,曲线也可以),非线性相关。相关关系并不等同于因果关系,即有相关关系的变量之间,并不一定一方由另一方引起。
②散点图:可以表示两个变量之间的关系。
5.相关系数。相关系数是度量两个变量间相关关系的统计量。最常用的相关系数是Pearson 相关系数,度量的两个变量间的线性相关关系。
r的区间范围:-1≤r≤1。r>0表示正线性相关,r<0表示负线性相关;r=1表示完全正线性相关,r=-1表示完全负线性相关;r=0表示不存在线性相关关系,但并不表示没有任何关系。
三、抽样调查
(一)基本概念 1.总体与样本
①总体参数。是抽样调查中想要了解的,是未知常数;
②样本统计量又称估计量。是一个随机变量,与样本选取及设计有关,是对总体参数的估计。③抽样框。是供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。抽样中的单位必须有序,高质量的抽样框应当提供被调查单位更多的信息,并且没有重复和遗漏。
2、概率抽样和非概率抽样
①概率抽样:又称随机抽样。特点:按一定的概率以随机原则抽取样本;抽中概率可计算;考虑每个样本单元被抽中的概率。
②非概率抽样:调查者根据自己的方便或主管判断抽取样本的方法,不依随机原则。如判
断抽样(主观判断),方便抽样(如拦截式),自愿样本(如网上调查),配额抽样。
3、抽样调查的一般步骤
确定调查问题→调查方案设计→实施调查过程→数据处理分析→撰写调查报告
4、抽样调查中的误差
①抽样误差:由于抽样的随机性造成的,样本不同,对总体的估计也会不同; ②非抽样误差:抽样框误差,无回答误差,计量误差
抽样框误差:抽样框不完整造成数据的遗漏,抽样框更新不及时产生无效数据等等; 无回答误差:随机因素如恰好不在,造成方差增大;非随机因素如不愿意回答,造成方差增大、估计偏差。
计量误差:数据与真值不一致造成的误差。