亲自整理的,一些概念和重要知识点的整理,考试背诵记忆用,不过不够全面。
统计学收集整理和分析数据方法科学 抽样调查 总体抽部分 推断总体未知数字特征 常用 经济 时效强 适应面广 准确高特点
数据类型 计量尺度:分类顺序数值 收集方法:观测实验 时间:截面时序
概率抽样 随机 概率已知 对总体估计时考虑每样本抽中概:简单 分层 整群 系统 多阶:随机 样本量
非概论 非随机 根据目的要求 抽样:方便 判断 自愿样 滚雪 配额:无法推断总体 简 时 成本
审核:检错对原始:完整 准确 二手:适用 时效 筛选:找符条件某类
频数:各类个数 比例:占总体 %:比例X百 比率:不同类比值
环形-饼图 空洞 多个样总 用于比较 展示定类定序 茎叶保留原始 小批量
条形-直方 长度-面积 宽分类-组距 高频 分开-连续 分类-数值
品质:条饼环 数值:原始-茎箱 分组:直方 时序:线 多变量:散泡雷
集中趋势:众 中位 均 离散程度:异众 四分 方标准差 离散系数 形状:偏态 峰度
分类-异众 顺序-四分位差极差平均差+异众 数值-方差标准差+顺序 不同样本-离散 偏态 SK>0 右偏 峰态>0 尖
离散型 二项分布的 期望 E(X)=np 方差 D(X)=npq 泊松分布λ n大p小可用泊代二 连续
连续型 均匀正态指数 E(X)=μ D(X)=σ2 3σ准则 0.6826 0.9545 0.9773
正态分布性质 f(x)>0 最高点μ平缓度σ对称于μ两无限不交x轴 面积概率和1
当n很大二项近似服从正态N{np,np(1-p)} χ E=n D=2n t分布 E=0 D=n/(n-2)
比例抽样分布P~N(π,π(1-π)/n) 两总体均值之差分布 E=μ1-μ2 D=σ12/n1+σ22/n2 两比例E=π1-π2 π1(1-π1)/n1+π2(1-π2)/n2
评价估计量的标准: 置信水平95 z=1.96 90~1.645 无偏:估计量的抽样分布期望等于被估计总体参数
有效:同一总体参数两个无偏估计量,更小标准差估计量更有效 一致:样本量增大,点估计量值接近被估总体的参数
小概率原理:发生概率很小的事件在一次实验中是几乎不可能发生的。一但发生就可以拒绝原假设 z 95-1.96 90-1.645 99-1.58
方差分析就是通过检验各总体的均值是否相等来判断分类型变量对数值型因变量是否有显著影响。
方差分析基本假定:各总体服务正态分布 各总体方差必须相同 观测值是独立的。
组间SSA:K-1 组内SSE:n-k 总SST:n-1 ! SSR k-1 SSC r-1 SSE (k-1)(r-1) SST kr-1 独立 0<φ<1 完全相关 C 0<=C<1 取决于行列数增大
相关关系r -1~+1 对称性 rxy=ryx r大小与原点及尺度无关 仅是线性关系度量 非因果关系 不0.3低5中8高
理论回归模型的假设:因变y与自变x有线性关系;重复抽样x取值固定,非随机; E(ε)=0; 所有xε的σ2相同;正态随机独立ε~N(0,σ2)
中心极限:设从均值为μ方差为σ2一个任意总体中抽取容量n样本当n充分大,样本均值抽样分布近似服从均值μ、方差σ2/n正态分布
假设原假设H0是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。P值是假设检验中的另一个决策工具,对于给定的显著性水平a,若P<a,则拒绝原假设
指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第l+1期的预测值等于t期的实际观察值与第t期预测值的加权平均值。一次指数平滑法是适合于平稳序列的一种预测方法,其模型为Ft+1=aY1+(1-a)Ft
回归分析解决:(1)从一组样本数据出发,确定出变量之间数学关系式;(2)对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的;(3)利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度。