欢迎来到梦题库! 请登录 注册 今天是2023/3/28 |
![]() |
![]() |
12 | ![]() |
![]() |
![]() |
![]() |
课程 | 题库 | 下载 | 答疑 |
第二节 统 计 分 组
一、统计分组的概念
统计分组是根据所研究事物的特点和统计研究的目的,把统计总体按照某一标志划分为若干性质不同而又相互联系的几个部分的一种统计方法。
统计总体具有同质性的特征,但同质性又是相对的。总体各单位的许多变异标志正是人们把总体进一步区分为性质不同的几个部分的客观依据。统计分组是在总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体,称为次级总体。这些被称为次级总体的组,同样具有统计总体的一般特征,它们几乎是可以无限地分组下去。
二、统计分组的作用
(一)划分现象的类型,即区分事物的性质。例如,工业生产可以划分为轻工业和重工业两大类型,可以分析二者在工业生产.中所处的地位以及二者的比例关系。又如,国内生产总值可以化分为第一产业、第二产业和第三产业。农业生产可以划分为作物种植业、林业、牧业、副业、渔业五大类型等等,都各有特殊的意义。
(二)研究总体内部的结构,总体内部的结构是指总体内部的各组成部分占总体的比重。例如,国内生产总值可以化分为第一产业、第二产业和第三产业。计算各个产业占总体的比重,可以分析国民经济平衡发展的状况。
(三)分析现象之间的依存关系在社会经济活动中,许多现象之间具有相互依存关系。要研究现象之间的依存关系,必须对这些现象首先进行分组。
三、统计分组的类型
(一)按分组标志的多少分为简单分组和复合分组
根据所研究现象总体的复杂程度和分析研究的任务,分组仅按一个标志来进行,称为简单分组。选择两个或两个以上的标志分别进行简单分组,就形成了平行分组体系。
简单分组实际上就是各个组按一个标志形成。
平行分组体系的特点是:每一种分组只能固定一个因素对差异的影响,同时又掩盖了其他因素对差异的影响。因此,在平行分组体系中,所采用分组标志的多少,决定了人们对社会经济现象总体认识的广度。
若分组按两个或两个以上的标志进行,并且层叠在一起,称为复合分组。所分各组是在分组标志的基础上层叠排列的,从而形成复合分组体系。复合分组实际上是各个组按两个以上的标志形成的,即先按一个标志分成组,在此基础上再按第二个标志分成小组,又再层叠地按第三个标志分成更小的组,以此类推。
复合分组体系的特点是:第一层次分组只固定一个主要因素对差异的影响,第二层次分组则同时固定两个因素对差异的影响,当进入最后一个层次分组时,则所有被选择标志对差异的影响全部被固定了。在复合分组体系中,梦题库版权所有,分组层次的多少决定于所选分组标志的多少,从而决定了人们对社会经济现象总体认识的深度。
复合分组适合运用于调查单位足够多的条件下,由于把分组标志复合在了一起,组数就大大地增加了;当调查单位为数不多时,势必发生各组单位数很少的情况,据以进行分析、作结论就没有充分的根据,尤其是在研究总体内各标志间依存关系时更是如此。
(二)按分组标志的性质分为品质分组和变量分组
品质分组是按品质标志进行的分组。例如,人口按性别、民族、文化程度、职业等标志分组;工业企业按经济类型、部门、轻重工业、甲乙部类、所属地区等标志分组;等等。这些组在性质上、界限上是稳定明确的。也有的按品质标志进行的分组非常复杂,类别繁多,这种分组统计上称为分类。这种复杂的分组,各组界限不易划分,从这一组到另一组存在各种过渡状态,边缘不清。例如,农业与动植物采集工业与森林采伐等的区分就比较困难。在实际工作中,对于这些比较复杂的分组,国家规定了统一的统计分类标准或分类目录,对不同的现象总体确定分类名称、分类标准、计量单位和编码方法,作为分组的统一依据,供长期稳定使用。完善统计分类目录,做到分类标准化是统计工作现代化的重要要求。根据国家统计局和国家标准局的《国民经济行业分类标准》,工业部门有40个大类,204个中类及547个小类。
变量分组是按数量标志进行的分组。例如,人口按年龄分组,工业企业按职工人数、生产能力、资金利润率分组等。变量分组反映总体数量特征的差异情况,通过数量变化来区分各组的不同类型和性质。变量分组在第五个问题——“统计分组的方法”中将详细介绍。
四、分组标志的选择
(一)根据统计研究的目的选择分组标志
(二)选择最能反映现象本质特征的标志作为分组标志
(三)根据现象发展的历史条件和经济条件选择分组标志
五、统计分组的方法
(一)品质分组的方法
按品质标志分组是比较简单的方法,分组标志一经确定,组名称和组数也就确定,不存在组与组之间界限区分的困难。
(二)变量分组的方法
按变量分组是指按数量标志分组的方法。按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。因此,应该以什么数量标志作为划分标准,都要依据研究的任务和现象的性质来确定。在实际工作中,变量分组常常用来分析某种指标的变动及其在各组的分配情况,这时,被研究的统计指标就成为分组的标志。23年高级统计师报名时间 高级统计师考试教材 高级统计实务教材 统计时政热点 统计师辅导 高级统计师历年真题 高级统计师押题密卷 购买点图片
变量分组由于存在很多问题,所以要在以下几方面加以阐述。
1.单项式分组和组距式分组
前面说过,变量有离散型和连续型之分。离散型变量如果变量值变动幅度比较小,变量值的项数又很少,则可依次将每一个变量值作为一组,这种分组称为单项式分组。但是,离散型变量如果变量值变动很大,项数又很多,采用单项式分组势必分组数太多,各组没占几个单位,因此就失去了分组的意义。某些场合离散型变量不能作单项式分组。大多数的离散型变量采取组距式分组。
组距式分组就是把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。
连续型变量由于不能一一列举它的变量值,不能作单项式分组,只能进行组距式分组。
按组距式分组会使资料的真实性受到一些损害。
总之,组距的大小、组数的确定应该全面分析资料所反映的社会经济内容、标志值的分散程度等因素,不能强求一致。
2.等距分组和异距分组
组距式分组区分等距分组和异距分组(不等距分组)是一个重要的问题。等距分组即标志值在各组保持相等的组距,就是说各标志值的变动都限于相同的范围。在标志值变动比较均匀的情况下,可采用等距分组。等距分组有很多好处,它便于各组单位数和标志值的直接比较,也便于计算各项综合指标,如标志值的平均数。当标志值变动很不均匀,如急剧地增长、下降,变动幅度很大时就应采用异距分组。
在异距分组中,如果标志值是按一定比例发展变化的,则可以按等比的组距间隔来分组。
总之,异距分组的组距和组数应根据研究现象本身质量关系的分析来确定,通过不相等的组距和组限来区分现象的类型和性质。
3.组限与组中值
组距两端的数值称为组限,其中每组的起点数值称为下限,每组的终点数值称为上限,下限和上限表示各组标志值变动的两端界限。
离散型变量可以一一列举,而且相邻两个数值之间没有中间数值。因此,各组的上下限都可以用确定的数值(整数)表示。
连续型变量在两数之间可能有无限多个中间数值,不可能一一列举,因此相邻组的上限和下限无法用两个确定的数值分别表示。在这种情况下,上一组的上限同时也是下一组的下限。
根据这个规定,离散型变量的分组也普遍使用各组的上限当作下一组的下限,这样不仅比较简明,而且计算组中值时不会造成麻烦。
组中值是上限与下限之间的中点数值。我们知道,经过了组距分组,各个单位具体标志值看不见了,不这样做,就难以对现象总体规律有深刻的认识。但是,在许多场合,仅仅大概地了解这些标志值变化的区间是不够的,我们还需要确定一个能代表各组标志值一般水平的数值,这个数值就是组中值,它在统计分析中应用很广泛。
组中值就是上限和下限的简单算术平均,即(上限+下限)÷2。有时候组距数列上下两端的组运用开放式的组距,即第一组用“多少以下”,最后一组用“多少以上”表示。这两个组的组中值可参照相邻组的组距来决定。
最后,组限的表述应尽量是10、50、100、1000等数字的整数倍。
第二节 统 计 分 组
一、统计分组的概念
统计分组是根据所研究事物的特点和统计研究的目的,把统计总体按照某一标志划分为若干性质不同而又相互联系的几个部分的一种统计方法。
统计总体具有同质性的特征,但同质性又是相对的。总体各单位的许多变异标志正是人们把总体进一步区分为性质不同的几个部分的客观依据。统计分组是在总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体,称为次级总体。这些被称为次级总体的组,同样具有统计总体的一般特征,它们几乎是可以无限地分组下去。
二、统计分组的作用
(一)划分现象的类型,即区分事物的性质。例如,工业生产可以划分为轻工业和重工业两大类型,可以分析二者在工业生产.中所处的地位以及二者的比例关系。又如,国内生产总值可以化分为第一产业、第二产业和第三产业。农业生产可以划分为作物种植业、林业、牧业、副业、渔业五大类型等等,都各有特殊的意义。
(二)研究总体内部的结构,总体内部的结构是指总体内部的各组成部分占总体的比重。例如,国内生产总值可以化分为第一产业、第二产业和第三产业。计算各个产业占总体的比重,可以分析国民经济平衡发展的状况。
(三)分析现象之间的依存关系在社会经济活动中,许多现象之间具有相互依存关系。要研究现象之间的依存关系,必须对这些现象首先进行分组。
三、统计分组的类型
(一)按分组标志的多少分为简单分组和复合分组
根据所研究现象总体的复杂程度和分析研究的任务,分组仅按一个标志来进行,称为简单分组。选择两个或两个以上的标志分别进行简单分组,就形成了平行分组体系。
简单分组实际上就是各个组按一个标志形成。
平行分组体系的特点是:每一种分组只能固定一个因素对差异的影响,同时又掩盖了其他因素对差异的影响。因此,在平行分组体系中,所采用分组标志的多少,决定了人们对社会经济现象总体认识的广度。
若分组按两个或两个以上的标志进行,并且层叠在一起,称为复合分组。所分各组是在分组标志的基础上层叠排列的,从而形成复合分组体系。复合分组实际上是各个组按两个以上的标志形成的,即先按一个标志分成组,在此基础上再按第二个标志分成小组,又再层叠地按第三个标志分成更小的组,以此类推。
复合分组体系的特点是:第一层次分组只固定一个主要因素对差异的影响,第二层次分组则同时固定两个因素对差异的影响,当进入最后一个层次分组时,则所有被选择标志对差异的影响全部被固定了。在复合分组体系中,梦题库版权所有,分组层次的多少决定于所选分组标志的多少,从而决定了人们对社会经济现象总体认识的深度。
复合分组适合运用于调查单位足够多的条件下,由于把分组标志复合在了一起,组数就大大地增加了;当调查单位为数不多时,势必发生各组单位数很少的情况,据以进行分析、作结论就没有充分的根据,尤其是在研究总体内各标志间依存关系时更是如此。
(二)按分组标志的性质分为品质分组和变量分组
品质分组是按品质标志进行的分组。例如,人口按性别、民族、文化程度、职业等标志分组;工业企业按经济类型、部门、轻重工业、甲乙部类、所属地区等标志分组;等等。这些组在性质上、界限上是稳定明确的。也有的按品质标志进行的分组非常复杂,类别繁多,这种分组统计上称为分类。这种复杂的分组,各组界限不易划分,从这一组到另一组存在各种过渡状态,边缘不清。例如,农业与动植物采集工业与森林采伐等的区分就比较困难。在实际工作中,对于这些比较复杂的分组,国家规定了统一的统计分类标准或分类目录,对不同的现象总体确定分类名称、分类标准、计量单位和编码方法,作为分组的统一依据,供长期稳定使用。完善统计分类目录,做到分类标准化是统计工作现代化的重要要求。根据国家统计局和国家标准局的《国民经济行业分类标准》,工业部门有40个大类,204个中类及547个小类。
变量分组是按数量标志进行的分组。例如,人口按年龄分组,工业企业按职工人数、生产能力、资金利润率分组等。变量分组反映总体数量特征的差异情况,通过数量变化来区分各组的不同类型和性质。变量分组在第五个问题——“统计分组的方法”中将详细介绍。
四、分组标志的选择
(一)根据统计研究的目的选择分组标志
(二)选择最能反映现象本质特征的标志作为分组标志
(三)根据现象发展的历史条件和经济条件选择分组标志
五、统计分组的方法
(一)品质分组的方法
按品质标志分组是比较简单的方法,分组标志一经确定,组名称和组数也就确定,不存在组与组之间界限区分的困难。
(二)变量分组的方法
按变量分组是指按数量标志分组的方法。按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。因此,应该以什么数量标志作为划分标准,都要依据研究的任务和现象的性质来确定。在实际工作中,变量分组常常用来分析某种指标的变动及其在各组的分配情况,这时,被研究的统计指标就成为分组的标志。23年高级统计师报名时间 高级统计师考试教材 高级统计实务教材 统计时政热点 统计师辅导 高级统计师历年真题 高级统计师押题密卷 购买点图片
变量分组由于存在很多问题,所以要在以下几方面加以阐述。
1.单项式分组和组距式分组
前面说过,变量有离散型和连续型之分。离散型变量如果变量值变动幅度比较小,变量值的项数又很少,则可依次将每一个变量值作为一组,这种分组称为单项式分组。但是,离散型变量如果变量值变动很大,项数又很多,采用单项式分组势必分组数太多,各组没占几个单位,因此就失去了分组的意义。某些场合离散型变量不能作单项式分组。大多数的离散型变量采取组距式分组。
组距式分组就是把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。
连续型变量由于不能一一列举它的变量值,不能作单项式分组,只能进行组距式分组。
按组距式分组会使资料的真实性受到一些损害。
总之,组距的大小、组数的确定应该全面分析资料所反映的社会经济内容、标志值的分散程度等因素,不能强求一致。
2.等距分组和异距分组
组距式分组区分等距分组和异距分组(不等距分组)是一个重要的问题。等距分组即标志值在各组保持相等的组距,就是说各标志值的变动都限于相同的范围。在标志值变动比较均匀的情况下,可采用等距分组。等距分组有很多好处,它便于各组单位数和标志值的直接比较,也便于计算各项综合指标,如标志值的平均数。当标志值变动很不均匀,如急剧地增长、下降,变动幅度很大时就应采用异距分组。
在异距分组中,如果标志值是按一定比例发展变化的,则可以按等比的组距间隔来分组。
总之,异距分组的组距和组数应根据研究现象本身质量关系的分析来确定,通过不相等的组距和组限来区分现象的类型和性质。
3.组限与组中值
组距两端的数值称为组限,其中每组的起点数值称为下限,每组的终点数值称为上限,下限和上限表示各组标志值变动的两端界限。
离散型变量可以一一列举,而且相邻两个数值之间没有中间数值。因此,各组的上下限都可以用确定的数值(整数)表示。
连续型变量在两数之间可能有无限多个中间数值,不可能一一列举,因此相邻组的上限和下限无法用两个确定的数值分别表示。在这种情况下,上一组的上限同时也是下一组的下限。
根据这个规定,离散型变量的分组也普遍使用各组的上限当作下一组的下限,这样不仅比较简明,而且计算组中值时不会造成麻烦。
组中值是上限与下限之间的中点数值。我们知道,经过了组距分组,各个单位具体标志值看不见了,不这样做,就难以对现象总体规律有深刻的认识。但是,在许多场合,仅仅大概地了解这些标志值变化的区间是不够的,我们还需要确定一个能代表各组标志值一般水平的数值,这个数值就是组中值,它在统计分析中应用很广泛。
组中值就是上限和下限的简单算术平均,即(上限+下限)÷2。有时候组距数列上下两端的组运用开放式的组距,即第一组用“多少以下”,最后一组用“多少以上”表示。这两个组的组中值可参照相邻组的组距来决定。
最后,组限的表述应尽量是10、50、100、1000等数字的整数倍。
![]() |
|
高级统计师选课中心 | |