论文网

咸宁某地各区民生活水平的统计聚类分析

更新时间:2021-01-26 00:18:13点击:

        

                      目录

一.引言1


二.主体3

  2.1.研究方法与数据 3

2.2数据的采集4

三.正文5

    3.1.生活水平因素的类平均法分析5

  3.2.生活水平因素的WARD聚类法分析 7

      3.3.结果分析 9

四.结论与建议9


附件14

开题报告16


文献综述19



外文翻译
















     咸宁某地各区民生活水平的统计聚类分析

摘要:随着社会的发展人民的生活水平不断提高,全民奔小康已经成为了时代的口号,但是贫富差距依然存在,就居民的生活水平这一衡量奔小康进程的因素,我调查了所在地的6个不同地区的居民食品,衣着,燃料,住房,以及生活用品,文化生活服务的支出等等,将这些作为影响居民生活水平的因素,利用统计方法和SAS软件进行聚类分析,假设如果结论是合为一类,说明人均生活水平均衡,结果显示,该市6个区经过 被分为两类或者三类,可见区民的生活水平存在差异,差距依然存在,我们应该采取相应的措施缩短这种差距,扫除奔小康路途上的障碍,从而尽快早日达到全民小康。

关键词:生活水平  全民奔小康  贫富差距 聚类分析  

Summary: as social of development people of living constantly improve, national ran well-off has became has era of number, but rich and gap still exists, on residents of living this a measure ran well-off process of factors, I investigation has location of 6 a different area of residents food, clothing, fuel, housing, and life supplies, culture life service of expenditures and so on, will these as effect residents living of factors, using statistics method and SAS software for poly class analysis, assumptions if conclusions is close for class, description per capita living balanced, results display, the city 6 a area after was is divided into two class or three class, visible area people of living exists differences, gap still exists, we should take corresponding of measures shortened this gap, wipe out ran well-off road Shang of obstacles, to as soon as possible early reached national well-off.

Keywords: cluster analysis of national well-off standard of living gap


                   

                    引言 

    自党的十六大以来,以胡锦涛同志为总书记的党中央从新世纪新阶段我国经济社会发展面临的新形势新任务新特点出发,提出了科学发展观的重大战略思想和构建社会主义和谐社会的重大战略任务。这是我们党执政理念的丰富和发展,是对社会主义现代化建设规律认识的深化。2003年在抗击非典斗争中,我们得到了许多启示,其中最重要的一条,就是必须统筹经济社会发展,加快解决经济社会发展“一条腿长、一条腿短”的问题。几年来,我们在发展经济的同时,更加重视发展社会事业和改善民生,经济发展与社会发展的协调性明显增强。我们取消农业税,结束了种田交税的历史;实行真正免费的义务教育;建立覆盖城乡的社会保障制度框架;实施标准更高的扶贫开发政策;制定和实施国家中长期科学和技术发展规划纲要等,这些都是我国经济社会发展中具有重要影响的大事。在应对这场历史罕见的国际金融危机冲击中,我们进一步深化了对加快转变经济发展方式重要性和紧迫性的认识。只有加快推动我国经济增长由主要依靠投资、出口拉动向依靠消费、投资、出口协调拉动转变,由主要依靠第二产业带动向依靠第一、第二、第三产业协同带动转变,由主要依靠增加物质资源消耗向主要依靠科技进步、劳动者素质提高、管理创新转变,才能更好地应对可以预见和难以预见的国际风险,不断提高我国经济的国际竞争力;才能更好地发展社会生产力,不断满足人民群众日益增长的物质文化需要;才能加快解决经济发展中不平衡、不协调、不可持续的问题,切实推动科学发展,保持社会和谐稳定。我们必须深刻认识加快发展社会事业和改善民生的重要意义,始终坚持把发展社会事业和改善民生作为贯彻落实科学发展观的重要任务,作为全面建设小康社会的迫切要求,作为转变经济发展方式、扩大国内需求的重要途径。我们已经初步具备了加快发展社会事业、改善民生的物质基础和条件,必须以更大的决心和力度,推动这方面工作取得新的更大进展。立足国情,走中国特色的农业现代化道路,加快推进农业现代化,全面建设小康社会。在全面建设小康社会的进程中,有许多的因素的影响,就这一问题,本人对本人所在的市各区进行了人民生活水平的调查,通过统计方法中的聚类分析方法分析区民生活是否水平均衡,在稳定发展提高.  

                              主体

一.研究方法与数据

1.方法:本文运用CLUSTER过程分析各区生活水平,首先对数据作标准变换,样品间的距离为欧式距离,用系统聚类分析方法中的类平均法,中间距离法,可变类平均法,和离查平方法作出合理的分类。

2.相应的数据

                   6个地区区民生活水平调查数据    (单位:元)

地区食品衣着燃料住房生活用品及其他文化生活服务

区1190.3343.779.7360.5449.019.04

区2135.2036.4010.4744.1636.493.94

区395.2122.839.3022.4422.812.80

区4104.7825.116.409.8918.173.25

区5221.1138.6412.53115.6550.825.89

区6115.8430.2612.2033.6133.773.85

3.相应数据符号

食品---------------------- 

衣着--------------------- 

燃料--------------------- 

住房--------------------- 

生活用品及其他----------- 

文化生活服务-------------- 

4.PROC CLUSTER 语句

AVERAGE/AVE-------------类平均法

CENTROID/CEN-----------重心法

       COMPLETE/COM-----------最长距离法

       DENSITY/DEN-----------密度估计法

       EML---------------------最大似然谱系聚类

       FLEXIBLE---------------可变类平均法

       MEDIAN-----------------中间距离法

       SINGLE/SIN-------------最短距离法

       WARD-------------------离差平方和

二.数据的采集

  为获取数据资料,先设计了调查问卷(问卷见附件)。本文所研究的数据全部是来自各区区民的生活水平影响因素的第一手数据资料,对数据作标准化变换,将最后将回收的有效问卷进行了整理分类,再采用EXCEL 和SAS进行相关的统计分析。 

                       


                      正文

   一.生活水平因素的类平均法分析

    为了解各区生活水平差异,我们采用聚类分析[11]中的系统聚类法将其聚类,并用系统聚类法中的类平均法。类平均法先从单个对象开始,开始时有多少个对象就有多少个类。将那些最相似(平均距离最短)的对象首先聚为类,然后根据类间的相似性把类进行合并,最后随着相似性不断下降,所有类渐渐融合为一个大类。我们各取水平进行聚类,各区的影响因素即为单个对象,该方法首先把生活水平最为接近的地区聚为类,聚类过程如下:



   The CLUSTER Procedure:

                            六个聚类变量的相关阵的特征值等信息

                                  Average Linkage Cluster Analysis


                                Eigenvalues of the Correlation Matrix


                            Eigenvalue    Difference    Proportion    Cumulative


                       1    4.72514947    3.83689649        0.7875        0.7875

                       2    0.88825298    0.58589870        0.1480        0.9356

                       3    0.30235428    0.22103163        0.0504        0.9860

                       4    0.08132265    0.07840202        0.0136        0.9995

                       5    0.00292063    0.00292063        0.0005        1.0000

                       6    -.00000000                     -0.0000        1.0000



                    The data have been standardized to mean 0 and variance 1

                    Root-Mean-Square Total-Sample Standard Deviation =        1

                    Root-Mean-Square Distance Between Observations   = 3.464102


                              类平均聚类法的并类历史过程


                                             Cluster History

                                                                                                                                       

                                                                                                         

                                                                                   Norm   T  

                                                                                    RMS   i

                                                                                          

     NCL   --Clusters Joined--     FREQ    SPRSQ    RSQ  ERSQ  CCC  PSF   PST2   Dist  e


       5    区2        区6            2   0.0239    .976     .       .     10.2     .    0.3459

       4    区3        区4            2   0.0345    .942     .       .     10.7     .    0.4155

       3    区1        区5            2   0.1055    .836     .       .      7.6     .    0.7263

       2    CL5        CL4           4   0.1909    .645           .      7.3     6.5   0.7419

       1    CL3        CL2           6   0.6451    .000     .000   0.00     .     7.3   1.2237



                            类平均聚类法的谱系聚类图

                 

(1)  统计量,即RSQ*.用于评价每次合成NCL个类是的聚合效果.  越大说明NCL个类越分开,故聚类的效果越好.  的值总在0和1之间,而且 的值总是随着类个数NCL 的减少而变小.如果用户希望通过分析 值来确定n个样品应分为几类最合适,应该看 值的变化.比如,分类之前( NcL > 3)的并类过程中  的减少是琢渐的,改变不大;当分为3 类时的 =0.836 ,而下一次合并后分为3 类时 下降较多,  =0.645这时通过分析  统计量可得出分为3个类是较合适的.

(2) 查看 变化的大小可以由合并类时的半偏 (列标题为SPRSQ)得到根据半偏  值是上一步 与该步  的差值,故某步的半偏  值越大,说明上一步合并的效果好,结果显示半偏  最大和次大分别为NCI= 2 和3,说明根据半偏RZ 准则分为三个类、或者四个类是较合适的

( 3 )伪F 统计量(列标题为PSF )用于评价分为NCL 个类的聚类效果.伪F 值越大表示这些观测样品可显著地分为NCI 个类. 结果显示伪F最大和次大分别为Ncl =3 和2(当Ncl <4),说明根据伪F 准则分为二个类、或三个类是较合适的

( 4 )伪  统计量用以评价此步合并类的效果,由该统计量的定义知伪  值大表明上一次合并的两类是很分开的,也就是上一次聚类的效果是好的,伪  最大和次大分别为NCI=2 和1,说明根据伪  准则分为三个类或两个类是较合适的

              从以上分析可以看出: 准则支持分为三类;伪F 统计量支持分为二类和三类;伪t统计量支持分为二类和三类;伪  统计量支持分为二类和三类.综合分析,认为用类平均法6 个地区分为二类或三类较合适

分为二类的结果为:  ={区1,区5}, ={区2,区3,区4,区6};

          分为三类的结果为:  ={区1,区5},  ={区3,区4}, ={区2,区6}

二.生活水平因素的WARD聚类法分析

下面给出WARD法的并类过程和谱系聚类图:

                      


                        WARD法的谱系聚类图:


       The CLUSTER Procedure

                                   Flexible-Beta Cluster Analysis


                                Eigenvalues of the Correlation Matrix


                            Eigenvalue    Difference    Proportion    Cumulative


                       1    4.72514947    3.83689649        0.7875        0.7875

                       2    0.88825298    0.58589870        0.1480        0.9356

                       3    0.30235428    0.22103163        0.0504        0.9860

                       4    0.08132265    0.07840202        0.0136        0.9995

                       5    0.00292063    0.00292063        0.0005        1.0000

                       6    -.00000000                     -0.0000        1.0000


                                            Beta = -0.25


                    The data have been standardized to mean 0 and variance 1

                    Root-Mean-Square Total-Sample Standard Deviation =        1

                    Mean Distance Between Observations               = 3.222901



                      WARD聚类法的并类历史过程


  Cluster History

                                                                                   


                                                                               Norm   T                                                                         

                                                                                        

                                                                               Flex   I

     NCL   --Clusters Joined--     FREQ    SPRSQ    RSQ   ERSQ    CCC    PSF   PST2     Dist   e


 5      区2        区6      2     0.0239    .976    .         .        10.2     .      0.3717

 4      区3        区4      2     0.0345    .942    .         .        10.7     .      0.4466

 3      区1        区5      2     0.1055    . 836    .         .         7.6     .      0.7806

 2     CL5        CL4      4     0.1909    .645    .         .         7.3     6.5     0.9991

 1     CL3        CL2      6     0.6451    .000    .000     0.00       .        7.3    1.8514



                                使用WARD聚类法的谱系图



 


从输              从上诉结果可以看出6 个地区分为二类或三类较合适

分为二类的结果为:  ={区1,区5}, ={区2,区3,区4,区6};

          分为三类的结果为:  ={区1,区5},  ={区3,区4}, ={区2,区6}


三.结果分析

  从输出的结果可以看出,不同的聚类方法得到的结果基本相同,从结果分为两类或者三类可以看出各区的居民生活水平并不一致,存在着水平高低之分,居民的生活水平也并不均衡,存在着差异。其中区2,区6区域存在生活水平偏低,故应采取相应的措施,提高该区的居民生活水平。



                                  结论与建议

     

咸宁市是本人家乡所在地,本人调查的均属社区,从调查结果可以看出人民的生活水平亟待提高,我们应该采取相应的可行性措施,快速的提高生活水平落后的居民生活,达到全民奔小康。以下是本人的一点建议,仅供参阅。

   我们社会各级单位应坚持把不断提高人民生活水平作为发展的根本出发点和落脚点,在经济发展的基础上努力提高城乡居民的收入水平和生活质量,保障全体人民共享改革发展成果。 

  第一节千方百计增加居民收入 


  一、主要任务和目标 


  积极推进收入分配制度改革,完善按劳分配为主体、多种分配方式并存的分配制度;加大收入分配调节力度,建立健全居民收入增长长效机制,促进城乡居民收入水平、生活质量与全市经济发展水平相适应,不断增强消费对经济增长的拉动作用。"十一五"时期,城镇居民人均可支配收入年均增长8%,农民人均纯收入年均增长6%。 


  二、主要政策措施 


  (一)建立城镇居民增收长效机制。改进和完善职工收入与经济效益协调增长机制,完善企业工资指导线和最低工资制度,在提高效益的基础上逐步提高最低工资标准和离退休人员待遇。积极扩大就业,加快发展就业容量大的劳动密集型产业、服务业和各类所有制中小企业;规范劳动力市场秩序,鼓励劳动者自主创业和自谋职业,促进多种形式就业,增加城镇居民收入。完善最低生活保障制度,适时提高城镇居民最低生活保障标准,积极扶持生活困难群体自主脱贫。继续完善和规范公务员工资制度。 


  (二)多渠道促进农民增收。加快农业结构调整,让农民在农业功能拓展中获得更多收益。积极发展专用粮食和蔬菜、林果、畜牧水产等高收益产业,促进农产品更新换代,提高产品附加值。加快特色产业基地建设,做大做强龙头企业,健全营销网络,提升农业产业化经营程度,带动农民增收。培植规模化特色产业集群,促进农村分散生产要素向特色产业和城镇聚集,拓宽农民就业空间和增收渠道。积极探索乡镇管理体制改革,治理乱摊派、乱收费,减轻农民负担。加快农村富余劳动力转移,增加农民家庭工资性收入。 


  (三)建立健全收入分配调节机制。坚持完善按劳分配为主体、多种分配方式并存的分配制度,鼓励劳动、资本等生产要素按贡献参与分配。更加注重社会公平,以共同富裕为目标,着力提高低收入者收入水平,扩大中等收入者比重,有效调节过高收入,努力缓解部分社会成员收入分配差距扩大的趋势。完善年薪制、职工持股、技术和知识产权入股等分配制度。合理调节行业收入分配,加强对垄断行业和收入过高企业的工资内外收入的监管。规范职务消费和公务消费,加快推进机关事业单位福利待遇货币化。规范个人收入分配秩序,治理整顿不合理收入,依法取缔非法收入。加大监察力度,严格执行最低工资制度,禁止拖欠、克扣工资等侵害职工利益的行为。加强对城镇低收入群体的扶助,发展和完善适合市场经济体制的开发式扶贫机制。认真解决好低收入群众的医疗、子女就学困难等问题。强化个人所得税征管。 


  第二节改善居民消费结构 


  一、主要任务和目标 


  加快提高城乡居民生活质量,促进以住房、交通、通信、卫生保健消费为热点的消费结构不断升级,加快由生存型向发展型、享受型转变,由满足基本生活需求向追求高档需求转变,由重视生活水平提高向重视生活质量提高转变。 


  城乡居民消费结构升级主要趋势是:恩格尔系数稳步下降,2010年,城市将稳定在35%左右,农村将稳定在38%左右。积极推进公众营养改善行动,优化居民膳食结构,促进食品消费向营养型、健康型发展;积极促进耐用消费品升级换代,推进绿色环保、节能性耐用消费品的普及;鼓励提高服务性消费,扩大教育培训、医疗保健、文教娱乐、旅游休闲等服务消费和休闲消费;健全以普通商品住房为主、社会保障性经济适用住房为辅的住房供应体系,2010年,城市居民人均住房使用面积达到17平方米,农村居民人均住房使用面积达到31平方米,居住环境和生产生活环境有较大改善。积极推进通信、计算机的普及,鼓励节能环保轿车进入家庭,2010年,城市每百户居民家庭拥有小轿车15辆。鼓励产品和服务创新,满足多层次、个性化消费需求。 


  二、主要政策和措施 


  (一)积极拓宽消费领域。加强宏观调节,加大投入力度,发展经济适用住房建设,努力增加商品房供给,控制商品房价格过快上涨,保障城市中低收入家庭住房面积和质量有较大改善。推进医疗卫生体制改革,更好满足人们健康医疗消费需求。大力发展民间办学等各类教育,抑制教育收费过快增长。加快旅游业发展,倡导积极健康的娱乐休闲方式,提高人们精神生活质量。落实带薪休假制度,完善法定节假日休假制度。积极促进农村进城务工人员落户定居城市,壮大城市消费群体的规模。 


  (二)更新居民消费观念。努力提高城乡居民收入,提高居民特别是农村居民和城镇低收入者的消费能力,启动和扩大消费需求。引导消费预期,增加即期消费。通过健全公共服务、扩大社会保障覆盖面、发展商业保险等措施,努力解除居民扩大消费的后顾之忧。积极倡导信贷消费,简化贷款手续,扩大消费信贷规模,拓宽消费信贷领域,延长贷款偿还年限,支撑和促进居民消费升级。加强消费政策引导,着重发展与人民生活密切相关的交通、通信、教育、医疗、金融、保险、房地产、商业、家庭服务、咨询等服务行业及计算机网络、软件等高科技信息产品产业的发展,为居民消费结构向更高层次发展提供条件。 


  (三)强化消费市场监督管理。加强对教育、医疗、住房等产品和服务的价格监管,遏制价格过快上涨。打击假冒伪劣产品,维护市场秩序,优化消费环境,降低居民消费风险。提高消费者素质,建立科学、健康的消费观,积极运用舆论工具,宣传消费知识,树立正确的消费观念和消费意识,把消费结构引向物质文明和精神文明相结合的方向。 


  第三节健全社会保障体系 


  一、主要任务和目标 


  统筹社会保障制度改革和城乡社会保障体系建设,完善城镇职工基本养老、医疗、失业、工伤、生育保险制度和社会救助制度;积极推进保险制度的改革,构建商业保险与社会保险相互促进的社会保障体系;增加财政对社会保障的投入,依法强化资金征集,加快"金保工程"建设,逐步做实个人账户,提高统筹层次,合理确定保障标准和方式,建立健全与经济发展水平相适应、独立于企事业单位之外、资金来源多元化、保障方式多层次、管理服务社会化的社会保障体系。"十一五"时期,城镇职工基本养老保险、基本医疗和生育保险、失业保险、工伤保险基本实现全覆盖;以最低生活保障、灾民救助和"五保"供养为基础,以医疗、教育、住房、法律等专项救助为辅助,其他救助和社会帮扶为补充、覆盖城乡的新型社会救助体系得到完善和加强。 


  二、主要政策措施 


  (一)健全完善社会保险制度。扩大城镇基本养老保险覆盖范围,加快完善社会统筹与个人账户相结合的城镇职工基本养老保险制度,确保养老金按时足额发放,完善社会统筹机制,逐步做实个人账户;建立企业年金,发展个人储蓄性养老保险和商业保险,形成多层次养老保险体系;以非公有制企业为重点,逐步将基本养老保险扩大到城镇所有从业人员,进一步扩大养老保险覆盖面。建立适合不同人群特点和满足多层次医疗需求的医疗保险体系,引导有条件的企业建立补充医疗保险,规范大额补充医疗保险的运作;健全完善生育保险制度。建立失业保险待遇与缴费适当挂钩的机制,健全和完善失业保险促进再就业功能。以高风险行业和进城务工人员为重点,发展工伤保险,实行工伤保险与安全生产、事故预防相结合,逐步形成统一制度。探索建立农村保险制度,以失地农民养老保险为重点,稳妥推进农村养老保险,发展和巩固以大病统筹为主的新型农村合作医疗制度。 


  (二)加强基础管理工作。统一建立社会保险行政管理机构、社会保险经办机构和社会保险监督机构,规范业务程序,建立健全各项工作管理制度、服务标准和考核制度,逐步形成社会保险基金筹集、运营、给付的良性循环机制,提高社会保险事业综合管理水平。建立网络互联、信息共享、安全可靠的统一社会保险信息服务网络,优化业务处理模式,建立规范的业务管理体系、完善的社会服务体系和科学的宏观管理体系。建立和完善独立于企业、事业单位之外,依托社区开展离退休人员社会化管理服务体制,将全市所有企业退休人员全部纳入社区管理。认真做好进城务工人员的社会保障工作。 


  (三)健全和完善社会救助体系。按照"应保尽保、分类施保"的原则,建立城乡居民最低生活保障标准合理增长机制,确保城乡低保对象的保障水平与全市经济发展和广大群众生活水平相协调。将"五保"供养经费列入各级财政预算,建立"五保"供养长效机制,实现由农村集体福利事业向社会福利事业转变。进一步完善医疗救助政策,逐步提高对困难户的医疗救助水平。完善教育救助制度,保障贫困家庭子女平等受教育的权力。进一步落实住房保障制度,通过建立城市廉租房等措施,确保低收入群体的基本居住条件。积极做好法律救助工作。建立和完善市、县(市)区、乡(镇)、村(居)四位一体的社会救助机构,确保救助政策落到实处。广泛动员社会力量参与社会救助事业。 


  (四)加强社会福利事业建设。加大政府对公共福利设施的投入力度,提高社会福利事业发展水平,建立健全社会福利事业投入稳定增长机制。积极发展残疾人和社会慈善事业。认真做好优抚安置工作,完善优抚保障机制。鼓励社会力量参与福利事业,鼓励社会团体和个人扶贫济困,提高社会救助能力,推进社会福利事业社会化。




本课题的参考文献资料

参考文献:

【1】周润兰.应用概率统计.北京:科学出版社,1999

【2】 魏宗舒等.概率论与数理统计教程.北京:高等教育出版社,,1983

【3】邓永录.应用概率及其理论基础【M】.北京:清华大学出版社,2005.

【4】韩冠唐.现代生活中的统计学与概率论[M】.北京:科学出版社,l987.           

【5】高惠璇.实用统计方法与SAS系统.北京大学出版社,2009.

【7】贾俊平等  .统计学[M].北京:中国统计出版社,2007.07

【8】孙山泽.  抽样调查[M].  北京大学出版,2007

【9】高惠璇.  应用多元统计分析[M].  北京大学出版社,2005

【10】杨宜勇.中国消费水平不足源于底层消费文化.2010 

【11】中国政府网:《国务院决定深化农村义务教育经费保障机制改革》;国务院:《国务院关于深化农村义务教育经费保障机制改革的通知》。


























  


                                                附录


湖北咸宁某地各区居民生活水平调查问卷

   您好!我是湖北师范学院的一名大学生,现利用暑假期间对我们区居民的生活水平进行调查,在你百忙之余打扰您,万分抱歉,麻烦你配合一下认真填完下面的问卷,谢谢!

.目前在咸宁的住房面积为:

A.30平米

B.30—60平米60—100平米

 100—150平米 150平米

7.您觉得你的住房条件怎么样?

 您现在是否需要还房贷:

您在其他家居方面的开销每月大概为:

12.您对自己在经济上的定位是:

A.非常富有

B.比较富裕.

C.中层水平

D.贫困

E.非常贫困

 .您的幸福感来自哪里:

A.家庭

B.工作待遇及环境

C.社会保障

D.假期时间长短

E.其他

14.影响你幸福感的因素是:

A.居住环境不理想

B.生活开支过大,入不敷出

C.工资过低

D.工作压力

E.其它

湖北师范学院学士学位论文(设计)开题报告

学生姓名曹文芳所在院系数学与统计学院所在班级0703指导教师蔡择林

学生学号2007111030334专业方向统计开题时间2011/3/1导师职称教授

论文题目咸宁各区民生活水平的统计聚类分析

开题报告(正文)

1.本课题的研究意义和目的 

  意义:在党中央作出全民奔小康重大战略部署的大背景下,本文通过对咸宁以县及县以下地域范围内为主的居民生活水平进行的问卷调查,集中反映了近年来区民的生活水平相关方面的发展特征和变化趋势,并在此基础上进而从宏观层面上对我国当前在全民奔小康的道路上,农村物质文明和精神文明建设事业所取得的伟大成就和亟需解决的问题进行思考总结,以得出相应的科学结论。

  目的: 通过对咸宁各区民生活中的食品,衣着,燃料,住房,以及生活用品,文化生活服务的支出等等水平的因素进行调查,算出各区的相应因素的平均值,然后建立模型,用统计软件sas中的聚类分析法分析出区民的生活水平是否相对平稳,全民是否在奔小康的道路上遇到了问题,找出问题因素,从而解决相应的影响因素,提出合理的建议和可行的措施,使全民尽快奔小康.

2.本课题的基本内容、重点及难点 

基本内容: 

(1)对影响各区区民生活水平的各种因素进行调查,并作简要的分析.

(2)对各种因素进行作相关分析说明下文采用聚类分析的合理性。 

(3)就影响各区区民生活水平的各种因素作聚类分析,按区民生活水平进行分类,找出区民生活水平不同的原因。 

(4)通过分析得到的结果,根据当今中国农村经济发展现状及宏观经济政策,有针对性提出进一步加快全民奔小康的对策。 

重点及难点:

重点:对各区区民生活水平的各种因素作聚类分析,按区民生活水平进行分类,确立不同类的区进行生活水平高低的标准,找出区民生活水平不同的原因,以及找出影响生活水平提高的因素,从而找到相应决策。 

难点:收集到完整、准确的数据并处理分析出结果。 


3.本课题的研究方法(或技术路线)

   对各区区民生活水平的各种因素作聚类分析,按区民生活水平进行分类,确立不同类的区进行生活水平高低的标准,找出区民生活水平不同的原因,以及找出影响生活水平提高的因素,从而找到相应决策。 

4.论文提纲 

本文共分为四大部分: 

第一部分是引言部分,简要介绍当前人民生活水平的状况以及影响人民生活水平的因素。 

第二部分具体介绍了构建的模型、方法的选择。 

第三部分给出对分析结果的解释。 

第四部分对全文作出总结。 

5.本课题的参考文献资料

参考文献:

【1】周润兰.应用概率统计.北京:科学出版社,1999

【2】 魏宗舒等.概率论与数理统计教程.北京:高等教育出版社,,1983

【3】邓永录.应用概率及其理论基础【M】.北京:清华大学出版社,2005.

【4】韩冠唐.现代生活中的统计学与概率论[M】.北京:科学出版社,l987.           

【5】高惠璇.实用统计方法与SAS系统.北京大学出版社,2009.

【7】贾俊平等  .统计学[M].北京:中国统计出版社,2007.07

【8】孙山泽.  抽样调查[M].  北京大学出版,2007

【9】高惠璇.  应用多元统计分析[M].  北京大学出版社,2005

【10】杨宜勇.中国消费水平不足源于底层消费文化.2010 

【11】中国政府网:《国务院决定深化农村义务教育经费保障机制改革》;国务院:《国务院关于深化农村义务教育经费保障机制改革的通知》。

6.本课题的进度安排 

2010 年 11 月 1 日——2011 年 1 月 28日     选题、查阅相关文献 

2011 年 2  月 1 日——2011 年 3 月 3 日     开题报告、外文翻译、文献综述 

2011 年 3  月 4 日——2010 年 4 月 1 日     进行论文正文的写作 

2011 年 4  月 2 日——2010 年 4 月 20日     完成论文初稿 

2011 年 4  月 21日——2010 年 4 月 30日     论文修改并定稿 

指导教师意见:



签名:                     

 年    月    日开题指导小组意见:



指导小组

组长签名                    年    月    日

说明1.学生应在开题报告前,通过调研和资料搜集,主动与指导教师讨论,在指导教师的指导下,完成开题报告。

2.开题报告分两部分,文献综述和开题报告正文。文献综述要有6篇以上相关文章阅读量,开题报告正文(2500-3000字)包括,选题背景和意义、研究目标与任务、分析或调研报告、拟定的方案或路线、撰写提纲及实施计划等。 

3.开题报告一式三份,一份交院系装入毕业设计(论文)档案袋,一份交指导教师,一份学生自存。

4.开题报告需经各系或论文指导小组讨论、院系教学指导委员会审查合格后,方可正式进入下一阶段。




        毕业设计(论文)

      

        文献综述

  



学生姓名:曹文芳                          


专业 :  统计学                           


指导教师 :蔡择林                         

                        




                          2011 年3 月8 日

                                                            




                   

                    前言

    从改革开放开始,全民奔小康已经成为了社会的主题,自 新中国成立以来,在中国共产党的正确领导下,城乡居民生活发生了翻天覆地的变化。新中国成立初期,面对连年战争留下的满目疮痍,党和国家带领人民迅速恢复生产,并在很短的时间内改善了居民的吃饭穿衣问题,广大居民安居乐业;改革开放以后,随着我国经济的快速增长,居民收入的大幅提高,城乡居民生活水平连续跨越几个台阶,从基本消除贫困,到解决温饱,再到实现总体小康,正在向全面建设小康社会目标迈进。笔者利用暑假期间调查了我市几个重点有代表性的社区的区民生活水平情况。

                                      主体

一.影响区民生活水平的因素

生活中的食品,衣着,燃料,住房,以及生活用品,文化生活服务的支出等等,

(一)食品消费

    生活的日益富足,使城市居民更舍得在吃上花钱,同时对膳食的结构要求也更高。居民对粮食的消费量逐渐下降,动物性食品的消费量明显提高,用于烟、酒、饮料、干鲜瓜果、奶及奶制品的消费明显增加,旧时的“高档食品”早已进入寻常百姓家,居民的“吃”正由主食型逐步向营养型转变,营养、风味、品种、疗效成为人们继吃饱吃好之后新的追求。饮食结构向多维生素、高蛋白、低脂肪方向发展。“吃”的方式也在改变。传统的自己买、洗、烧消耗了大量时间和精力,如今居民越来越青睐于在外就餐或炒几个热菜、买些熟菜带回家。据调查,2006年居民在外就餐达到月人均84.3元,是1991年的9.69倍,居民对各种食物的成品、半成品购买量也在不断增加。

(二)衣着

    衣着水平逐步提高,从“一衣多季”到“一季多衣” 。随着人们收入水平的不断提高,对服装的需求也越来越高。人们不仅对服装的质量、花色进行挑选,还要追求品牌和时尚,体现个性与修养,“一季多衣”取代了“一衣多季”。人们在选择服装时,更加强调“绿色环保”和“保健功能”,多数消费者喜欢购买棉、麻、毛、丝等天然纤维面料的服装。衣着消费逐年增加, 2006年是1991年的10倍。

(三)住房

   居住条件逐步改善,家庭耐用消费品逐渐趋于高档化、个性化。90年代初期,经历房改后,虽然多数居民实现了“居者有其屋”的梦想,但居住条件还不是很好。进入二十一世纪初期,各级政府和部门采取了积极有效的措施,改善居民的居住条件,使广大城镇居民的居住面积不断增加,住房条件得到较大的改善。据抽样调查,2006年每百户城镇居民有64户居住楼房。城市居民人均住房建筑面积达到33.42平方米。居民购建房支出持续增加,2000年、2001年、2002年、2003年、2004年、2005年、2006年人均年购建房支出分别为38.6元、74.9元、90.87元、119.64元、230.19、336.45和643.36元,分别是1991年的1.02倍、2.92倍、3.75倍、5.26倍、11倍、16.6倍和32倍。住房设施也在不断完善,据2006年100户居民抽样调查结果显示,东胜69%市民住房有暖气设施,69%的住房配有卫生设施。居民对耐用消费品的消费也逐渐趋于高档化、个性化。从90年代开始,彩电、冰箱、洗衣机等家用电器在居民家庭中已大范围地普及。进入2000年,消费结构全面升级,居民对耐用消费品的需求逐渐向高档化、高科技化转变。大屏幕、高清晰度彩电、大容量多开门冰箱、全自动化洗衣机以及层出不穷的个性化小家电在不断更新,提升着居民家庭耐用消费品的档次。通讯工具全面普及,电脑和汽车消费逐渐成为一种新时尚,正快速步入普通居民家庭,悄悄改变着人们的生活方式。

东胜居民家庭平均每百户耐用消费品拥有量表

(四)燃料

燃料是人们日常生活中必不可少的物资。在90年代初我区城市居民90%以上是使用煤来做主要燃料的。但随着社会的发展以及居民生活水平的不断提高。2006年,全区居民有69%使用液化气当作厨房燃料来使用,1%居民用上了天然气。那种煤烟取暖的时代在我区居民家庭消费中将逐渐消失,新的环保能源将会出现在更多居民家庭中。

  (五)文化生活

   居民家庭在物质消费达到了量的满足后,追求精神文化生活的消费欲望日益增强,教育文化娱乐消费支出大幅度上升,成为居民消费的新亮点。2006年东胜区年人均教育文化娱乐消费支出为1783元,是1991年的(人均5.2元)343倍。经济的发展和科技的进步,使人们愈来愈认识到科学知识的重要性,而科学技术的竞争最终归结为人才的竞争,促使人们在教育方面的投入逐年增加。居民对子女教育的投资增加,尤其是对义务教育阶段以外的孩子,教育投资增加明显。选好幼儿园、上各种兴趣班,同时,托幼费、家教费、培训班支出也不断上涨。各大专院校的扩招以及成人教育规模的扩大,使教育消费成为热点。接受高等教育的人一年比一年多,加之高校学生的学杂费和生活费不断攀升,使得居民用于这方面的支出也是一年年看涨。另外,成人教育消费支出也在不断提高。

随着人们生活观念的更新,闲暇消费成为人们消费生活中一个重要的组成部分,其中走出家门、走出国门、外出旅游观光是人们首选的文化娱乐方式,其次是健身活动,逐渐呈现多元化的态势

  

(六)、其他消费

    

二.主要方法说明   

 聚类分析又称群分析,它是研究对样品或者指标进行分类的一种多元统计方法。所谓类,就是相识元素的集合

    在实际问题中,经常会遇到分类问题,例如对某城市按大气污染的轻重分为几类区域;对某年级学生按学习成绩的好坏分为几组;对人体测量的几十个部位的尺寸按反映人体身高,反映人体胖瘦及人体畸形的部位分为几类;在经济学中根据人均收入,人均农业产值,人均消费水平等多种指标对世界上所有国家的经济发展状况进行分类,等等。随着生产技术和科学的发展,在许多领域都将遇到分类问题。

     聚类分析正是解决分类问题的方法,它是实用多元统计的一个洗新的分支,它的职能是建立一种分类方法,将一批样品或者变量,按照他们在性质上的亲疏,相识程度进行分类

      聚类分析方法十分丰富,按其聚类的方法可分为以下几种:

系统聚类法:开始每个对象自成一类,然后每次将最相似的两类合并,然后合并后重新计算新类与其它类的距离或相近测度。这一过程一直继续直到所有对象归为一类为止。并类的过程可用谱系聚类图描述。

动态聚类:首先对n个对象初步分类,然后根据分类的损失函数尽可能小的原则对分类进行调整,直到分类合理为止。

 最优分割法(有序样品聚类法):开始将所有样品看成一类,然后根据某种最优准则将它们分割为二类、三类,一直分割到所需的K 类为止,这种方法适月于有序样品的分类间题,也称为有序样品的聚类法.

模糊聚类法:利用模糊集理论来处理分类问题,它对经济领域中具有模糊特征的两态数据或多态数据具有明显的分类效果.、

图论聚类法:利用图论中最小支撑树的概念来处理分类问题,创造了独具风格的方法

聚类预报法:利用聚类方法处理顶报问题,在多元统计分析中,可用来作预报的方法很多,如回归分析和判别分析但对一些异常数据,如气象中的灾害性天气的预报,回归或判别分析处理的效果都不好,而聚类预报弥补厂这一下足,这是一个值得重视的方法。

      聚类分析根据分类对象的不同分为R 型和Q 型两大类,R 型是对变量(指标)进行分类处理,Q 型是对样品进行分类处理R 型聚类分析的目的有以下方面:

① 可以了解变虽间及变量组合间的亲疏关系;

② 对变量进行分类;

③ 限据分类结果及它们之问的关系,在每一类中选择有代表性的变量作为重要变量,利用少数几个重要变量进一步作分析计算,如进行回归分析或Q 型聚类分析等

Q 型聚类分析的日的主要是对样品进行分类分类的结果是直观的,且比传统分类方法更细致、全面、合理当然使用不同的分类方法通常会得到不同的分类结果对任何观测数据都没有惟一' ’正确的”的分类方法实际应用中,常采用不同的分类方法,对数据进行分析计算,以便对分类提供意见,并由实际工作者决定所需要的分类数及分类情况


CLUSTER(系统聚类法)是目前在实际应用中使用最多的一类方法.它是将类由多变到少的一种方法

 下面介绍n个m 维的样品记为 (i=1,2,3,……,n),

一、系统聚类法的基本思想和基本步骤

设有n个样品,每个样品测得m项指标,系统聚类方法的基本思想是:首先定义样品间的距离(或相似系数)和类与类之间的距离,开始将n个样品各自自成一类,这时类间的距离与样品间的距离是等价的;然后将距离最近的两类合并,并计算新类与其他类的类间距离,再按最小距离准则并类这样每次缩小一类,直到所有的样品都并成一类为止,这个并类过程可以用谱系聚类图形象地表达出来。

由以上系统聚类法的基本思想,即可得出它的基术步骤红下:

数据变换:可以对数据进行变换.数据变换目的是为了便于比较、计算止的方便或改变数据的结构,选择度量样品间距离的定义(如欧氏距离>及度量类间距离的定义(如最短距离法,参见下面“系统聚类分析的方法”) .             

. 计算,个样品两两间的距离、得样品间的距离矩阵 

一开始(第一步:i = 1 ) ,n个样品各自构成一类,类的个数k = n个类 (i=1,2,…n)。此时类间的距离就是样品间的距离(即 ) .然后对步骤i=2 , … ,n执行并类过程的步骤3 和4.

每次合并类间距离最小的两类为一新类,此时类的总个数k减少l 类,即k=n-i + 1 

 计算新类与其他类的距离,得新的距离矩阵 ,若合并后类的总个数龙仍大于l ,重复3 和4步;直到类的总个数为1 时止.

画潜系聚类图;

决定分类的个数及各类的成员.




                                    总结

CLUSTER (系统聚类)过程分别采用十一种方法对SAS 数据集中的观测进行系统分类.聚类所需的数据可以是数值型的坐标值,也可以是距离数据如果数据是坐标值,ClUSIER 过程计算(可能是平方)欧氏距离.如果想对非欧氏距离的数据进行聚类分析,可以使书TYPE =DIS TANCE 的数据集作为输入数据集,比如对属性数据的情况,类型为DISTANCE 的距离矩阵可以通过DATA步使用有关的量度公式进行计算,CLUSTER过程还生成一个记录并类过程的输出数据集,TREE 过程根据这个数据集提供的信息画, CLUSTER (系统聚类)研究的主要对象是客观事物的变量间的统计关系,不同水平变量的类因素分析是聚类分析的一个重要应用。在聚类分析的运用中,我们还强调系统聚类。聚类分析的理论和方法在近些年来也得到不断发展,统计学中许多方法都与聚类分析有着密切的联系。由此看来,聚类分析随着它本身的不断完善和发展以及应用领域的不断扩大,必将为人类社会的发展起着它独到的作用。



参考文献:

【1】周润兰.应用概率统计.北京:科学出版社,1999

【2】 魏宗舒等.概率论与数理统计教程.北京:高等教育出版社,,1983

【3】邓永录.应用概率及其理论基础【M】.北京:清华大学出版社,2005.

【4】韩冠唐.现代生活中的统计学与概率论[M】.北京:科学出版社,l987.           

【5】高惠璇.实用统计方法与SAS系统.北京大学出版社,2009.

【7】贾俊平等  .统计学[M].北京:中国统计出版社,2007.07

【8】孙山泽.  抽样调查[M].  北京大学出版,2007

【9】高惠璇.  应用多元统计分析[M].  北京大学出版社,2005

【10】杨宜勇.中国消费水平不足源于底层消费文化.2010 

【11】中国政府网:《国务院决定深化农村义务教育经费保障机制改革》;国务院:《国务院关于深化农村义务教育经费保障机制改革的通知》。









































































推荐文章

搬家公司 上海搬家公司 北京搬家公司