内容简介
分层线性模型是1990年代在国际统计学界迅速推广并得到广泛应用的新的统计分析技术,本书是这一分析方法的代表作。本书提供的技术细节适合大多数社会科学和行为科学研究人员的需要,包括足够多的实际操作建议和研究示范,并与HLM软件结合,是多层分析者的手册和用户指南。
作者简介
[美]斯蒂芬·W.劳登布什(Stephen W. Raudenbush),美国密歇根大学教育学院教授、统计学系教授,密歇根大学调查研究中心高级研究员。主要研究领域:多层分析与历时研究的统计方法。
[美]安东尼·S.布里克(Anthony S. Bryk),美国芝加哥大学社会学系城市教育Marshall Field IV 冠名教授。领导了芝加哥大学学校改进中心,并且是芝加哥大学学校研究协会的资深指导。主要研究领域:学校组织、城市教育改革、可计量性及教育统计学。
郭志刚,男,北京大学社会学系教授、博士生导师。1982年于中国人民大学工业经济系获学士学位,1985年于加拿大西安大略大学社会学系获硕士学位,1990年于中国人民大学人口研究所获博士学位。1992年9月至1994年2月于美国布朗大学人口研究中心从事博士后工作研究。1985年至1999年在中国人民大学人口研究所从事教学与研究工作。1987年7月被评为讲师。1991年7月被评为副教授。1994年7月被教授。2000年调入北京大学社会学系任教。主要研究领域包括婚姻家庭、生育率、人口预测、人口政策与人口发展战略等方面,以及社会统计分析的方法与应用。
目录
致谢(英文版第2版)
丛书主编对分层线性模型的介绍
丛书主编对第2版的介绍
第一部分 原理
1 导言
分层数据结构:一个常见现象
分层数据分析中持续存在的两难问题
分层模型统计理论的发展简史
分层线性模型的早期应用
个体效应的改进估计
对层次之间效应的建模
分解方差协方差成分
本书第1版问世以来的新发展
结果变量范围的扩展
与交互分类数据结构的结合
多元模型
潜在变量模型
贝叶斯推断
本书的框架结构
2 分层线性模型的原理
初步知识
对某一学校的社会经济状况与成绩关系的研究
对两个学校的社会经济状况与成绩关系的研究
对J个学校的社会经济状况与成绩关系的研究
一般模型及其简单子模型
带随机效应的单因素方差分析
将平均数作为结果的回归模型
带随机效应的单因素协方差分析
随机系数回归模型
将截距和斜率作为结果的回归模型
非随机变化斜率模型
本节概要
基本分层线性模型的推广
多元X和多元W
对层-1和层-2上的误差结构的推广
超出基本的两层分层线性模型的扩展
选择X和W的定位(对中)
X变量的定位
W变量的定位
本章术语及注释概要
简单的两层模型
注释与术语概括
一些定义
子模型的类型
3 分层线性模型估计及假设检验的原理
估计理论
固定效应的估计
随机层-1系数的估计
方差协方差成分的估计
假设检验
固定效应的假设检验
随机层-1系数的假设检验
方差协方差成分的假设检验
本章术语概要
4 示例
引言
单因素方差分析
模型
结果
以均值作为结果的回归
模型
结果
随机系数模型
模型
结果
以截距和斜率作为结果的模型
模型
结果
估计一个特定单位的层-1系数
最小二乘法
无条件收缩
条件收缩
区间估计的比较
需要注意的问题
本章术语概要
第二部分 基本应用
5 组织研究中的应用
组织效应研究的背景
建立模型
个人层次模型(层-1)
组织层次模型(层-2)
例1:通过随机截距模型对组织共同效应建模
一个简单的随机截距模型
例子:考察学校对教师效率的影响
与传统的教师层次和学校层次分析结果的比较
包括层-1协变量的随机截距模型
例子:写作的项目效果评估
与传统的学生层次和班级层次分析结果的比较
例2:通过以截距和斜率为因变量的模型来解释组织的不同效应
过去在建立以斜率为因变量的回归模型时所遇到的困难
例子:公立学校和天主教学校成绩的社会分布
层-1既有随机斜率又有固定斜率的应用实例
专题
层-1方差异质性情况下的应用
例子:对数学成绩的层-1残差方差的类别效应建模
层-1存在异质性情况下的数据分析建议
组织效应研究中层-1自变量的对中
层-1固定系数的估计
分离个人层次效应和构成效应
对层-1协变量调整后的层-2效应估计
估计层-1系数的方差
估计层-1随机系数
使用方差统计量的削减比例
估计个别组织的效应
具体组织的效应的概念化
常用的学校业绩估计
经验贝叶斯估计的使用
对业绩指标进行有效推断所面临的威胁
设计两层组织效应研究时对功效的考虑
6 个体变化研究中的应用
个体变化研究中的背景问题
建立模型
重复观察模型(层-1)
个人层次模型(层-2)
线性增长模型
例子:教导对认知发展的作用
二次增长模型
例子:母亲的语言能力对儿童词汇量的影响
其他形式的增长模型
在层-1误差结构更为复杂时的情况
分段线性增长模型
随时间变化的协变量
个体变化研究中层-1自变量的对中
线性增长模型中截距的定义
在高阶多项式模型中其他增长参数的定义
在研究随时间变化的协变量时的可能偏差
增长参数的方差估计
比较分层模型、多元重复测量模型和结构方程模型
多元重复测量模型
结构方程模型(SEM)
例1:观察数据是平衡的
例2:完整数据是平衡的
例3:完整数据是不平衡的
层-1中缺失观测值的影响
利用分层模型来预测未来情况
增长与变化的研究设计中有关功效的考虑
7 HLM在元分析和其他层-1方差已知情况下的运用
引言
元分析数据的分层结构
扩展到其他层-1“方差已知”的问题
本章结构
为元分析建立模型
标准化均值差异
层-1(研究之内)模型
层-2(研究之间)模型
组合模型
估计
例子:教师对学生智商期望的效应
无条件分析
条件分析
贝叶斯估计的元分析
其他层-1方差已知时的问题
例子:关联的多样性
多元的方差已知模型
层-1模型
层-2模型
不完整多元数据的元分析
层-1模型
层-2模型
示例
8 三层模型
制定和检验三层模型
完全无条件模型
条件模型
多种可能的替代模型
三层模型的假设检验
例子:对教学的研究
研究组织内的个人变化
无条件模型
条件模型
层-1的测量模型
例子:学校氛围的研究
例子:对以学校为基础的职业社区及其促进因素的研究
估计三层模型中的随机系数
9 评价分层模型的恰当性
引言
考虑模型的假定条件
本章的安排
两层分层线性模型的关键假定
建立层-1模型
指导建立层-1模型的经验方法
层-1的模型设置问题
对层-1随机效应的假定条件的检查
建立层-2模型
指导建立层-2模型的经验方法
层-2模型设置问题
检查关于层-2随机效应的假定
稳健标准误
示范
在样本为小样本时推断的有效性
对固定效应的推断
对方差分量的推断
对层-1随机系数的推断
附录
对层-1结构模型的错误设置
层-1自变量测量有误
第三部分 高级应用
10 分层一般化线性模型
作为分层一般化线性模型特例的两层分层线性模型
层-1抽样模型
层-1连接函数
层-1结构模型
二分类结果的两层和三层模型
层-1抽样模型
层-1连接函数
层-1结构模型
层-2和层-3模型
一个贝努里分布的例子:泰国学生留级研究
总体平均模型
一个二项分布的例子:九年级第一学期的课程失败
计数数据的分层模型
层-1抽样模型
层-1连接函数
层-1结构模型
层-2模型
例子:芝加哥社区的杀人犯罪率
序次数据的分层模型
单层数据的累计概率模型
扩展到两层模型
一个例子:教师控制力与教师敬业度
多项数据的分层模型
层-1抽样模型
层-1连接函数
层-1结构模型
层-2模型
示例:升学去向
在分层一般化线性模型中的估计工作考虑
本章术语概要
11 潜在变量的分层模型
有缺失数据的回归
基于多元模型填补缺失数据
分层线性模型应用于缺失数据的问题
自变量有测量误差的回归
在分层模型中纳入测量误差信息
有缺失数据和测量误差的回归
对潜在变量直接和间接效应的估计
一个有测量误差和缺失数据的三层示例
模型
分析个人成绩增长的两层潜在变量举例
非线性分项反应模型
单项反应模型
多特征的分项反应模型
二参数模型
本章术语概要
缺失数据问题
测量误差问题
12 交互分类的随机效应模型
对交互分类的随机效应模型的公式化和检验
无条件模型
条件模型
例1:苏格兰教育成绩中的邻里效应与学校效应
无条件模型
条件模型
估计社会剥夺的随机效应
例2:儿童在小学阶段认知发展中的班级效应
小结
本章术语概要
13 分层模型的贝叶斯推断
贝叶斯推断的导论
经典的观点
贝叶斯方法的观点
例子:正态均值的推断
经典方法
贝叶斯方法
有关推广和推论的一些问题
贝叶斯视角下的分层线性模型
对γ、T和σ2的完全最大似然估计
对T和σ2的REML估计
两层HLM的贝叶斯推断基础
观测数据的模型
第一阶段的先验
第二阶段的先验
后验分布
完全贝叶斯推断与经验贝叶斯推断之间的关系
例子:贝叶斯与经验贝叶斯的元分析
贝叶斯模型
参数估计与推断
完全贝叶斯推断与经验贝叶斯推断的比较
吉布斯抽样以及其他计算方法
将吉布斯抽样器应用于词汇量增长数据
本章术语概要
第四部分 估计理论
14 估计理论
模型、估计方法及算法
最大似然估计与贝叶斯估计的综述
最大似然估计
贝叶斯推断
对两层分层线性模型做最大似然估计
基于期望最大化的最大似然估计
模型
最大化步骤(M-Step)
期望替代步骤(E-Step)
将各部分结合起来
基于费舍尔得分的最大似然估计
费舍尔得分在两层模型中的应用
多元分层线性模型中的最大似然估计
模型
期望最大化算法
费舍尔-迭代一般最小二乘法(IGLS)算法
其他协方差结构的估计
讨论
分层一般化线性模型的估计
分层模型的数值积分
应用于二分类结果的两层模型
惩罚性准似然估计
最大似然估计的更精确近似
将积分表示为拉普拉斯转换
拉普拉斯方法应用于两层的二分类数据
向其他层-1模型推广
总结与结论
参考文献
索 引
前言/序言
中文版译者序
《分层线性模型——应用与数据分析方法》(第2版)的中文版终于与读者见面了。
分层线性模型是1990年代在国际上形成并正在迅速推广应用的新统计分析技术。由美国芝加哥大学的布里克教授和密歇根州立大学的劳登布什教授于1992年合著的《分层线性模型——应用与数据分析方法》是这一统计分析方法的代表作之一。
我是在1990年代后期才知道这种分析方法的。2000年,在美国执教的朋友王丰博士送给我此书。在研读过程中,我深为其方法论上的推进和其广泛的应用性所吸引。
此书既是一本专著,也可以作为教材,因为作者实际上是按教材体例写的。该书首先从方法论角度展开,指出研究实践中最常用的常规回归模型在处理多层次关系时的无效性。然后介绍了分层线性模型的原理,讨论了该模型在多种典型情况下的应用,并附以许多例题的分析示范,十分解渴。显然,此书的宗旨并不囿于证明一种新方法,而是考虑了能够为更多的研究人员和学生所理解,以促进该方法的普及应用。事实上,该书作者同时也是同名的专门统计软件HLM的研制者。
我于2001年开始组织一些教师和博士研究生一起分工翻译该书。2002年,劳登布什教授与布里克教授又出版了该书的第2版。其内容大大扩展,从原来的10章扩展为14章,从原来的260页扩展为480页,以充分反映10年来这一方法取得的新进展。我们随即决定中止第1版的翻译工作,改为翻译第2版。本来我们翻译此书的目的只是团结一批有志于量化研究方法的青年学者一起追踪国际学术前沿,但经过2年时间的反复校正与修改,最终我们形成了格式统一、译法一致、图表俱全的译稿。
北京大学社会学系马戎教授等同仁见到这个译本后,一致鼓励我们应当争取正式出版,并且还为此事多方联系。但是出于各种原因,正式出版之事一再受挫。最后,在社会科学文献出版社谢寿光社长的鼎力支持下,这本译著才得以正式出版。
本书的翻译采用团队工作形式,由郭志刚(第1、2、8、10、12章)、郑真真(第11章)、陈卫(第5章)、周皓(第6、7、14章)、李强(第3、4章)、葛建军(第13章)、张磊(第9章)共同承担,最后由郭志刚负责全书的统稿和校对工作。我的研究生巫锡炜、赵联飞、李睿、王军协助进行最后的清样校对工作。
感谢杨桂凤编辑高度认真负责的精神,她的辛勤努力使这一中文版增强了文本的一致性,并提高了语言上的易读性。
由于译者水平有限,对此学术前沿巨著的理解和翻译难免有不当之处,恳请读者指教。
郭志刚
于海淀蓝旗营
致谢(英文版第2版)
自本书第1版出版以来的十年中,分层模型的有关方法得到了长足的发展,并且在各领域中得到了广泛的运用。因此可以说,本书第2版一方面是原作者之间长期大量合作的成果,另一方面也是与更多的其他同事合作与讨论的成果。需要感谢太多的人,但在此处不能一一列出。无论如何,其中一些人是必须提到的。正是因为有了他们,本书才最终得以付梓。
与Darrell Bock、 Yuk Fai Cheong、 Sema Kalaian、 Rafa Kasim、 Xiaofeng Liu和Yasuo Miyazaki等人在方法论上的讨论,不断地挑战着我们的想法。Yeow Meng Thum的工作启发了本书第6章和第11章中有关多元分析的应用。Mike Seltzer对第13章的贝叶斯方法提出了极为重要且非常有用的批评,并慷慨地允许将其研究成果作为最后一个例子加入该章。Meng-Li Yang和Matheos Yosef在发展“分层一般化线性模型”(第10章)中所用的最大似然估计方法方面做了基础工作。Young-Yun Shin仔细阅读了本书的初稿,并提出了许多建设性意见。Guang-lei Hong对初稿提出的批评意见促使第12章交互分类模型的形成。作为应用程序员和长期的朋友,Richard Congdon的工作体现在本书的每一章中。Stuart Leppescu也为第2版的数据处理和新的分析工作提供了协助。
芝加哥社区人类发展项目(the Project on Human Development in Chicago Neighborhoods, PHDCN)中的同事,包括Felton Earls、 Rob Sampson和Christopher Johnson,都对本书第2版有着重要影响,这体现在第10章和第11章中关于社区效应的例子上。的确,我们还要感谢麦克阿瑟基金会(the MacArthur Foundation)、国家司法研究所(the National Institute of Justice)和国家精神卫生研究所(the National Institute of Mental Health)对芝加哥社区人类发展项目的资助,该项目也支持了本版新章节中关键性方法论方面的工作。
我们特别感谢Pamela Gardner,她帮助检查、编辑并录入了本书的全稿。她的高效率和幽默感是保证整个工作顺利进行的基础。
匿名评论者对这一版的新章节提出了许多有益的建议。作为Sage出版社的方法论编辑,C.Deborah Laughton对本书的出版给予了令人钦佩的耐心和精神上的支持;我们还要再次感谢系列丛书的主编Jan de Leeuw的鼓励。
丛书主编对分层线性模型的介绍
在社会科学中,数据结构经常在以下意义上是分层的:我们有描述个体的变量,但是个体又组成较大的群体,每一群体由一定数量的个体组成。对于较大群体还有一系列变量来描述。
首推的例子也许是教育。学生组成班级,既有变量描述学生,又有变量描述班级。班级变量也许是学生变量的汇总指标,诸如学生数量或社会经济状况的平均值。但是班级变量也可以是教师(如果本班只有一个教师),或者是本班的教室(如果本班总是聚会于同一教室)。此外,在这个例子中,层次结构还会相当自然地延伸。班级还会进一步组成学校,学校构成校区,等等。我们也可以有描述学校的变量和描述校区的变量(如教学方式、学校建筑、邻里状况等)。
一旦我们发现这个分层数据结构的例子,我们就会看到更多的例子。它们自然地发生于地理和(区域)经济中。在某种意义上,社会学的基本问题就是将个人属性与所寓于其中的群体和结构的属性联系起来。以同一种方式,经济学的问题是将微观层次与宏观层次联系起来。此外,许多重复测量也是分层的。如果我们不断追踪调查一些个体,那么对任一个体的观察构成一组测量,按照同一种方式,一个学校或班级也构成一组测量。当每个调查员调查一组对象时,调查员便处于较高层次。只要对这些分层结构多加思索便会不可避免地导致一个结论,即使不能说大多数,至少也能说很多社会科学数据都有这种嵌套的或分层的结构。
在意识到分层数据的重要意义之后,下一步是考虑如何在统计技术上体现对分层结构的分析。有两种做法已经遭到否定。第一种做法是将所有高层变量分解(disaggregate)到个体水平。比如将教师、班级和学校的特征全都赋予学生个人,然后在个体层次进行分析。这一方法的问题是,要是我们知道一些学生是同一班级的,那么我们也就知道他们在班级变量上取相同的值,于是,我们便不能采用经典统计技术的基本假定,即各观测之间相互独立。另一种做法是先将个体水平的变量汇总到较高层次,然后在较高层次进行分析。比如我们将学生特征汇总到班级,然后再对班级进行分析,分析时也许还需要按规模对班级加权。这种做法的主要问题是,我们抛弃了所有的组内信息,它也许占到最初分析时信息总量的80%或90%。其结果是,汇总变量之间的关系总是显得较为密切,然而这常常与直接分析未曾汇总的变量所反映的情况大相径庭。于是,我们不但浪费了信息,而且要是我们企图在个体层次解释汇总分析结果,还将导致对结果的曲解。所以,汇总方法和分解方法都不能令人满意。
如果仅限于用常规线性模型进行分析,我们知道其基本假定有线性、正态性、方差齐性、独立性。我们希望保留前两项,但需要对后两项(尤其是关于独立性的假定)加以修改。修改的主要原因在于:由于同组的个体之间比异组的个体之间更为接近或相似,所以一个学生与其他班级的学生可能是相独立的,而与同一班级的学生在许多变量上相同。那么,这些变量并不需要观察,这意味着它们从线性模型中消失,进入误差部分,并导致残差之间出现相关。这一思路可以用方差成分
分层线性模型:应用与数据分析方法(第2版) epub pdf mobi txt 电子书 下载 2025
分层线性模型:应用与数据分析方法(第2版) 下载 epub mobi pdf txt 电子书 2025