流行病学队列研究思维导图-米儿火

队列研究04队列研究

队列研究

队列研究属于分析流行病学研究，是将人群按是否暴露于某可疑因素及其暴露程度分为不同组，追踪其各组的结局，比较不同组之间结局频率的差异，从而判定暴露因素与结局之间有无因果关联及关联大小的一种观察性研究方法。

暴露

暴露是指研究对象接触过某种待研究的物质或具有某种待研究的特征或行为，同时，暴露一定是本研究需要探讨的因素，是与特定的研究目的密切相关的。

暴露可以是有害的，也可以是有益的。

队列、出生队列与暴露队列

队列表示一个特定的研究人群。

如在某特定时期内出生的一组人群，叫出生队列；

具有某种共同暴露或特征的一组人群，可称为某暴露队列。

队列的分类

根据人群进出队列的时间不同，队列又可分为两种：

一种叫固定队列，是指人群都在某一固定时间或一个短时期之内进入队列，之后对他们进行随访观察，直至观察期终止，不再加入新的成员。队列规模会因为成员死亡、失访或发生研究的结局事件而逐渐变小；

另一种叫动态队列，即在某队列确定之后，原有的队列成员可以不断退出，新的观察对象可以随时加入，即在研究期内，队列成员是动态变化的。

危险因素与保护因素

危险因素，又称为危险因子，泛指能引起某特定不良结局发生，或使其发生的概率增加的因子，包括个人行为、生活方式、环境和遗传等多方面的因素。

危险因素的反面称为保护因素，两者都可作为研究因素，可统称为决定因素或影响因素。

队列研究的基本原理

在一个特定人群中选择所需的研究对象，根据目前或过去某个时期是否暴露于某个待研究因素，或其不同的暴露水平而将研究对象分成不同的组，如暴露组和非暴露组，高剂量暴露组和低剂量暴露组等，随访观察一段时间，检查并登记各组人群待研究的预期结局的发生情况，比较各组结局的发生率，从而评价和检验研究因素与结局的关系。

如果暴露组某结局的发生率明显高于或低于非暴露组，则可推测暴露与结局之间可能存在因果关系，暴露是影响该结局发生的决定因素。

队列研究的基本特点

1、属于观察法；2、设立对照组；3、由“因”及"果”；4、检验暴露与结局的因果联系能力较强。

队列研究的研究目的

1、检验病因假设

2、评价预防措施效果

当某些可能的预防措施（暴露）不是人为给予的，而是研究对象的自发行为时，对这种预防措施的效果评估即可采用队列研究。

3、研究疾病的自然史

4、新药的上市后监测

队列研究研究类型

队列研究依据研究对象进入队列时间及终止观察的时间不同，分为：前瞻性队列研究、历史性队列研究、双向性队列研究。

前瞻性队列研究

前瞻性队列研究是队列研究的基本形式。

研究对象的分组是根据研究对象现时的暴露状况而定的，此时研究的结局还没有出现，需要前瞻观察一段时间才能得到。

这样的设计模式即称为前瞻性或即时性队列研究。

前瞻性队列研究的特点

在前瞻性队列研究中，由于研究者可以按设计要求直接获取关于暴露与结局的第一手资料，因而资料的偏倚较小，结果可信；

其缺点是所需观察的人群样本很大，观察时间长、花费大。

历史性队列研究

研究对象的分组是根据研究开始时研究者已掌握的有关研究对象在过去某个时点的暴露状况的历史材料做出的；研究开始时研究的结局已经出现，不需要前瞻性观察，这样的设计模式称为历史性或非即时性队列研究，或回顾性队列研究。

历史性队列研究的特点

在历史性队列研究中，虽然研究是现在开始的，但研究对象是在过去某个时点进入队列的，暴露与结局的资料是过去累积的；

暴露与结局虽然跨时较长，但资料搜集及分析却可以在较短时期内完成；

尽管搜集暴露与结局资料的方法是回顾性的，但究其性质而言仍是从因到果的。

历史性队列研究的优缺点

优点：省时、省力、出结果快。

缺点：因资料积累时未受到研究者的控制，所以内容上未必符合要求。

双向性队列研究

也称混合型队列研究，即在历史性队列研究的基础上，继续前瞻性观察一段时间，它是将前瞻性队列研究与历史性队列研究结合起来的一种设计模式，因此兼有上述两类的优点，且相对地在一定程度上弥补了各自的不足。

选用前瞻性队列研究的考虑

1、有明确的检验假设，检验的暴露因素必须找准；

2、所研究疾病的发病率或死亡率应较高，如不低于5‰；

3、明确规定暴露因素的测量，并有把握获得观察人群的暴露资料；

4、明确规定结局变量，如发病或死亡，并且要有确定结局的简便而可靠的手段；

5、有把握获得足够的观察人群，并将其清楚地分成暴露组与非暴露组；

6、大部分观察人群能被随访到研究结束，并取得完整可靠的资料；

7、有足够的人力、财力、物力支持该项工作。

选用历史性队列研究的考虑

1、有明确的检验假设，检验的暴露因素必须找准；

2、所研究疾病的发病率或死亡率应较高，如不低于5‰；

3、明确规定暴露因素的测量，并有把握获得观察人群的暴露资料；

4、明确规定结局变量，如发病或死亡，并且要有确定结局的简便而可靠的手段；

5、有把握获得足够的观察人群，并将其清楚地分成暴露组与非暴露组；

6、考虑在过去某段时间内是否有足够数量的、完整可靠的、有关研究对象的暴露和结局的历史记录或档案材料。

双向性队列研究的选用

当基本具备进行历史性队列研究的条件下，如果从暴露到现在的观察时间还不能满足研究的要求，如结局事件还没有发生或没有完全发生，还需继续前瞻性观察一段时间时，则选用双向性队列研究。

结局变量

结局变量也叫结果变量，简称为结局，是指随访观察中将出现的预期结果事件，也即研究者希望追踪观察的事件。

结局就是队列研究观察的自然终点。

暴露人群

暴露人群即暴露于待研究因素的人群。

根据研究的方便与可能，通常有四种选择：职业人群、特殊暴露人群、一般人群、有组织的人群团体。

对照人群的四种常用形式

1、内对照：即先选择一组研究人群，将其中暴露于所研究因素的对象作为暴露组，其余非暴露者即为对照组。

2、外对照：当选择职业人群或特殊暴露人群作为暴露人群时，往往不能从这些人群中选出对照，而常需在该人群之外去寻找对照组，故称之为外对照。

3、总人口对照：这种对照可认为是外对照的一种，是利用整个地区的现成的发病或死亡统计资料，即以全人群为对照，而不是与暴露组平行地设立一个对照组进行调查。

4、多重对照：或叫多种对照，即同时用上述两种或两种以上的形式选择多组人群作对照，以减少只用一种对照所带来的偏倚，增强结果的可靠性。

计算样本量时需考虑的问题

1、暴露组与对照组的比例：通常是等量的。只有当暴露组样本不够时，为了达到统计学要求，可考虑增加对照组样本。

2、失访率：假设失访率为10%，则可按计算出来的样本量再加10%作为实际样本量。

影响样本量的因素

1、一般人群（对照人群）中所研究疾病的发病率（p0）：p0↑→n↓

2、暴露组与对照组人群发病率之差（d）：d ↑→n↓

3、要求的显著性水平：α↑→n↓

4、效力：又称把握度（1-β）：β↑，即β↓→n↑

基线资料

在研究对象选定之后，必须详细收集每个研究对象在研究开始时详细的基本情况，包括暴露的资料及个体的其他信息，这些资料一般称为基线资料或基线信息。

基线资料一般包括待研究的暴露因素的暴露状况，疾病与健康状况，年龄、性别、职业、文化、婚姻等个人状况，家庭环境、个人生活习惯及家族疾病史等。

观察终点

观察终点就是指研究对象出现了预期的结果，达到了这个观察终点，就不再对该研究对象继续随访。

观察终止时间

观察终止时间是指整个研究工作截止的时间，也即预期可以得到结果的时间。

质量控制的措施

①调查员的选择；②调查员培训；③制定调查员手册；④监督。

队列研究的资料整理表

根据统计分析的要求和资料性质，队列研究的资料一般整理成表4-1的模式（对累积发病率资料）或表4-2的模式（对发病密度资料）。

表4-1固定队列研究资料归纳整理表表 4-2动态队列研究资料归纳整理表

资料整理表

人时的概念

是用来描述观察对象的暴露经历，人时即观察人数与观察时间的乘积，常用的人时单位是人年。

三种常用的人年计算方法

1、以个人为单位计算人年（精确法）

将每个人的精确的观察时间（精确到天）相加，最后折算成年。

2、用近似法计算人年

近似法即用每年观察的平均人数作为该年的观察人年数，然后将各年的观察人年数相加即得到观察的总人年数。

3、用寿命表法计算人年

利用简易寿命表方法也可以计算人年。常用的计算方法是规定观察当年内进入队列的个人均作1/2人年计算，失访或出现终点结局的个人也作1/2人年计算。

累积发病率

如果研究人群的数量较大且比较稳定，则无论其发病强度大小和观察时间长短，均可用观察开始时的人口数作分母，以整个观察期内的发病（或死亡）人数为分子，计算某病的累积发病率（或累积死亡率）。

累积发病率（CI）=观察期内的发病人数/观察开始时的人数

发病密度

如果队列研究观察的时间比较长，就很难做到研究人口的稳定。此时需以观察人时为分母计算发病率，用人时为单位计算出来的率带有瞬时频率性质称为发病密度，反映的是速率。

发病密度（ID）=观察期内的发病人数/观察总人时数

标化比

当研究对象数目较少，结局事件的发生率比较低时，无论观察的时间长或短，都不宜直接计算率，而是以全人口发病（死亡）率作为标准，算出该观察人群的理论发病（死亡）人数，即预期发病（死亡）人数，再求观察人群实际发病（死亡）人数与此预期发病（死亡）人数之比，得到标化发病（死亡）比。

标化死亡比（SMR）

标化死亡比（SMR），这一指标在职业流行病学研究中常用。

是以全人口死亡率作为标准，算出该观察人群的理论死亡人数，即预期死亡人数，再求观察人群实际死亡人数与此预期死亡人数之比，得到标化死亡比。

标化比例死亡比（SPMR）

如果某单位的历年人口资料不能得到，而仅有死亡人数、原因、日期和年龄，则可改算标化比例死亡比（SPMR）。

其计算方法是以全人口中某病因死亡占全部死亡的比例乘以某单位实际全部死亡数而得出某病因的预期死亡数，然后计算实际死亡数与预期死亡数之比。

相对危险度RR

这里的相对危险度通常包括了①危险度比(RR)或②率比(RR)。

①危险度比是暴露组的累积发病率与对照组的累积发病率之比。

②率比是暴露组与对照组的发病密度之比。

危险度比和率比都是反映暴露与发病(死亡)关联强度的最有用的指标，RR表明暴露组发病或死亡的危险是对照组的多少倍。

RR值越大，表明暴露的效应越大，暴露与结局关联的强度越大。

归因危险度（AR）

又叫特异危险度、危险度差（RD）和超额危险度，是暴露组发病率与对照组发病率相差的绝对值，它表示危险特异地归因于暴露因素的程度。

RR与AR的区别

1、RR说明暴露者发生相应疾病的危险是非暴露者的多少倍；AR则是指暴露人群与非暴露人群比较，所增加的疾病发生数量，如果暴露因素消除，就可减少这个数量的疾病发生。

2、前者具有病因学的意义，后者更具有疾病预防和公共卫生学上的意义。

归因危险度百分比(AR%)

又称为病因分值(EF)，是指暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比。

人群归因危险度与人群归因危险度百分比

人群归因危险度(PAR)与人群归因危险度百分比(PAR%)

人群归因危险度百分比也叫人群病因分值(PEF)。

PAR是指总人群发病率中归因于暴露的部分，而PAR%是指PAR占总人群全部发病(或死亡)的百分比。

剂量-效应关系

如果某种暴露存在剂量-效应关系，即暴露的剂量越大，其效应越大，则该种暴露作为病因的可能性就越大。

具体的分析方法是先列出不同暴露水平下的发病率，然后以最低暴露水平组为对照，计算其他各暴露水平组的相对危险度和归因危险度。

必要时，应对危险度(或率)的变化作趋势性检验。

选择偏倚

选择偏倚是由于研究对象的选择不当，而导致的研究结果偏离真实的情况。

队列研究中选择偏倚常发生的情况

最初选定参加研究的对象中有人拒绝参加；

在进行历史性队列研究时，有些人的档案丢失了或记录不全；

研究对象由志愿者组成，他们往往或是较健康的，或是有某种特殊倾向或习惯的；

早期病人，在研究开始时未能发现等，都可造成研究对象的选择偏倚。

失访

在一个长的随访期间，暴露组和对照组成员中总会有些人或对参加该研究不感兴趣，或因身体不适不便继续参加研究，或移居外地，或其他原因死亡等原因而退出研究。

我们称这种退出为失访。

失访偏倚

由于队列研究的随访时间长，失访往往是难以避免的。如果暴露组和对照组的失访人数相等，而且各组中失访者和未失访者的发病率相同，则可认为失访对研究结果没有大的影响；否则，暴露与结果之间的关系可能因失访而被歪曲，这种歪曲被称为失访偏倚。失访偏倚本质上也属于选择性偏倚。

如果暴露组失访者的发病率高于未失访者，则从继续观察者获得的发病率要低于全部研究对象的实际发病率，使暴露与结局的联系被低估；如果暴露组失访者的发病率低于未失访者，则其偏倚效应相反。

选择偏倚的预防

1、要有一个正确的抽样方法，尽可能遵守随机化的原则；

2、严格按规定的标准选择对象。

3、尽量提高研究对象的应答率和依从性。

4、在进行历史性队列研究时，要求目标人群的档案资料齐全，丢失或不全的记录必须在一定的限度之内，否则应谨慎选用。

5、如果有志愿者加入或有选定的研究对象拒绝参加，则应了解他们的基本情况后，与正常选择参加的人群进行比较，如果两者之间在一些基本特征上没有差异，则可认为导致的选择偏倚可能很小，否则，将引起的选择偏倚不能忽视。

信息偏倚

在获取暴露、结局或其他信息时所出现的系统误差或偏差叫信息偏倚，信息偏倚又称为错分偏倚。

错分偏倚若发生于一组而不发生于另一组，或两组错分的程度不同，则结果可能比实际的相对危险度高或低。

通常将前者称为非特异性错分，将后者称为特异性错分。

常用的预防信息偏倚的方法

选择精确稳定的测量方法、调准仪器、严格实验操作规程、同等地对待每个研究对象、提高临床诊断技术、明确各项标准、严格按规定执行等。

此外，还应认真做好调查员培训，提高询问调查技巧，统一标准，并进行有关责任心和诚信度的教育。

估计信息偏倚的常用办法是通过对一个随机样本进行重复的调查与检测，将两次检测的结果进行比较，以估计信息偏倚的可能与大小。

混杂偏倚

混杂偏倚是指由于某个第三变量的作用，致使研究因素与结果的联系被歪曲，这个第三变量就叫混杂变量或混杂因子。

混杂因子一定是疾病的一个影响因素，又与所研究的因素有联系，它在暴露组与对照组的分布是不均衡的。

在流行病学研究中，性别、年龄是最常见的混杂因素。

队列研究的优点

1、由于研究对象的暴露资料是在结局发生之前收集的，并且都是按照设计由研究者亲自观察得到的，所以资料完整可靠，信息偏倚相对较小。

2、可以直接获得暴露组和对照组人群的发病或死亡率，可直接计算出和等反映疾病危险强度的指标，可以充分而直接地分析暴露的病因作用。

3、由于病因发生在前，疾病发生在后，因果现象发生的时间顺序是合理的，加之偏倚较少，又可直接计算各项测量疾病危险强度的指标，故其检验病因假说的能力较强，一般可证实病因联系。

4、有助于了解人群疾病的自然史，有时还可能获得多种预期以外的疾病的结局资料，可分析一因与多种疾病的关系。

队列研究的局限性

1、不适于发病率很低的疾病的病因研究，因为在这种情况下需要的研究对象数量太大，前瞻性队列研究一般难以达到。

2、由于随访时间较长，对象不易保持依从性，容易产生失访偏倚。

3、在随访过程中，未知变量引入人群，或人群中已知变量的变化等，都可使结局受到影响，使分析复杂化。

4、研究耗费的人力、物力、财力和时间较多，其组织与后勤工作亦相当艰巨。

为您推荐

流行病学队列研究思维导图