day10统计师考试(初级)用表格描述数据
用表格描述数据知识点一、非数值型数据的频数分布表 ★知识点二、数值型数据的频数分布表★例题由于不同类型的数据其特征不同在利用表格对其进行描述时步骤也不相同但是无论数据是何种类型我们都可以使用频数分布表来对其进行描述。知识点一、非数值型数据的频数分布表 ★非数值型数据包括分类数据和顺序数据其本身就是对事物的一种分组。因此只要先把所有的类别都列出来然后统计出每一类别的数据个数(即频数)进一步就可形成分组列表即频数分布表。如将人口按性别分为男、女两组并统计出其各自的频数按经济类型将企业划分为国有企业、集体企业、私营企业、外商独资企业、中外合资企业等等。知识点二、数值型数据的频数分布表★生成数值型数据的频数分布表时首先是将数据进行分组然后再统计出各组别的数据频数。首先要对数据进行分组。统计分组有“分”与“合两重含义即通过统计分组将不同性质的单位区分开来同时把相同性质的单位合并在一起从而显示出数据的分布特性。因此统计分组的关键一是选择分组变量二是划分各组界限。 分组数的多少要根据数据本身的特点及数据的多少来确定一般情况下以能够适当观察数据的分布特征为准。其次要确定组距。在组数确定的情况下组距等于全距(全部数据中的最大值与最小值之差)除以组数。最后各组的组距是各组的最大差异即各组变量值中的最大值(即上限各组中较大的数值)与最小值(即下限各组中较小的数值)之差。每一组组距都相等的数列称为等距数列每一组组距不全相等的数列称为不等距数列或异距数列。各组组中值等于上限与下限之和除以2。即:各组组距上限-下限各组组中值上限下限/2在确定组限时第一组的下限应小于最小值最后一组的上限应高于最大值。在确定组距时一般应当遵循下列原则首先要考虑各组的划分是否能区分总体内部各个组成部分的性质差别。如果不能正确反映各部分质的差异必须重新分组。例如按学生百分制成绩分组必须要有60分的组限否则不能反映是否及格的本质区别。其次要能准确、清晰地反映总体单位的分布特征。在确定组距时当研究的现象变动比较均匀时可以采用等距分组而当研究的现象变动很不均匀时例如急剧的增长或急剧的下降波动的幅度很大时则一般采用不等距分组。最后统计出各组的频数得出频数分布表。在统计各组频数时若相邻两组的上下限重叠恰好等于某一组上限的变量值不算在本组内而计算在下一组内即采取上限不在内的原则以保证一项数据只被分在某一组。例题【单选题】当一组数据变动比较均匀时对其分组宜采用C。A.极大值分组B.极小值分组C.等距分组D.不等距分组