简介
qualitative comparative analysis,中文叫定性比较分析方法。研究对象往往涉及多案例,单个的案例已经不能满足研究的需要。此类事件的成因存在着多元并发组合的原因变量。
QCA是一种以案例研究为向导的基础理论结合研究思路。自小样本数据信息中构建出科学研究话题的因果性关系。系统化调查事件产生的成因及其内部转化成因子中间的互动交流关系、概率关系组成,尝试表述促使事件造成的重要因子、因子中间的互相联络及其激起事件造成的错综复杂的成因组成。
QCA主要包含明确集、模糊集和多值集三种具体步骤方式。对总样本展开多次细化分,产生不一样的子样本集,进而得到更加细致和趣味的结果。
确定/清晰集定性比较分析csQCA
csQCA只能处理原因变量和结果变量均为二分变量的案例,无法处理统计分析中所出现的大量的定距变量( 定距变量:各类别之间的距离,只能加减而不能乘除或倍数的形式来说明它们之间的关系。 )。
模糊集定性比较分析fsQCA
基于模糊集的定性比较分析方法fsQCA突破了这一问题,是对csQCA的一个拓展。 在现实生活中,往往能观察到的特征在不同个案中的差别是连续的,因此采用二分变量来刻画这些特征是不合适的。
拉金(Ragin,1987)提出可以采用多个值(比如:0、0.5、1)来刻画个案的某些属性。 比如,在fsQCA里,个案的某个特征是否可以被观察到的程度可以刻画为从0-1之间的任何数,而不局限于0或1这两个数。这被称为成员身份度(membership score)。 fsQCA的运算原理与csQCA一致,拉金(Ragin,2008)提出可以利用成员身份度模糊集形成真值表,然后以真值表为基础算出结果特征是哪些原因特征组合的子集,最后通过布尔代数算法简化这些原因特征组合。这主要是运用集合关系和集合间的逻辑运算规则来探索多个案中事先确定的原因条件对结果产生的影响。 此外,拉金等人还开发了fsQCA的计算软件fs/QCA2.0,并得到了广泛应用。
3.多值集定性比较分析mvQCA
多值集可以看作是确定集和模糊集之间的一个中间状态。 与模糊集不同的是,多值集方法并不是将变量的数值处理成 0 到 1 之间的隶属度分数,而是在确定集的二分法基础上,对变量的数值进行多分,以增加变量的信息。 多值集在扩展二分法的基础上,将原来的清晰集拓展成了一种可以处理类别变量的方法。这种方法还可以通过分类的方式,将定距变量转化为类别变量而纳入分析模型之中。
研究思路
利用布尔代数运算法则简化原因条件与结果条件之间的关系。
1.将变量先做二分处理,即解释变量和结果变量各有两种,变量取值为0或1。某条件发生或存在时,变量用大写字母表示,取值为1,某条件不发生或不存在时,变量用小写字母(不发生)或-(不存在)表示,取值为0。
+代表或,*代表和,->和=均代表导致。比如A *B=Y表示A和B同时发生导致Y的发生。
2.QCA的分析逻辑与定量分析不同,原因条件对结果的效应时相互依赖的,且同一个社会现象的发生可能是由不同的原因组合所导致的。一个条件对结果的影响同时取决于其他条件,即同一个结果的产生肯由多个不同的原因组合导致。同一个原因条件的发生或不发生与不同的社会情景相结合,都能产生同样的结果。A*B+a *D=Y
3.QCA的分析单位是条件组合而不是案例。研究者以所有的条件组合作为分析的基础,根据布尔代数算法简化条件组合,布尔代数最基本的运算逻辑是寻找不同组合的共同点。
4.QCA是基于必要条件和充分条件的推断逻辑,而不是统计判断的逻辑。 非对称因果关系
实际应用(fsQCA)
研究步骤:
1.选取典型案例
原则:(1)所选案例具有代表性,即具有较大的社会影响力;
(2)案例类型具有多元性;
(3)案例具有阶段确定性结果,即注明起止时间以明确其阶段性结果;
(4)案例支撑材料具有全面性,将获得的二手资料通过三角检定法反复对比进行交叉检验,以获得较高信度。
2.设置变量及研究模型
社会运动理论系统分别从资源、 政治、 主体和文化等不同视角着力,共同构建起一个从微观、中观到宏观的理论框架, 具备较强的系统性和关联性,因此作为本研究条件变量的选择依据,具备一定的合理性。
3.构建真值表及数据处理
由于 QCA 运算的分析单位是条件组合而不是案例,因此将各变量按照表 2 的赋值标准进行具体赋值后,会得到条件变量与结果变量的所有组合, 即真值表,并进一步通过 fsQCA 软件对其进行布尔最小化运算,进而得到单个条件变量的必要性分析结果和条件组合情况。
4.数据分析
(1)单变量的必要性分析
常规的 QCA 运算中,单变量必要性分析是通过一致性指标 (Consistency ) 来判断的,将一致性公式简化如下:Consistency (Xi≤Yi) =∑ [min (Xi, Yi) ] /∑Xi
如果条件 X (单个条件或条件组合 ) 是 Y 的充分条件,则 X 的模糊集分值应小于等于 Y 的模糊集分值,且一致性指标大于 0.8。同时也可通过一致性指标 Consistency (Yi≤Xi) 来判断 X 是否为 Y 的必要条件,如果大于 0.9, 则可认为 X 是 Y 的必要条件。在完成充分或必要条件判断后, 可进一步通过覆盖率指标 (Coverage ) 来判断条件 (或组合 ) X 对于结果 Y 的解释力度, 将覆盖率公式简化如下:
Coverage (Xi≤Yi) =∑ [min (Xi, Yi) ] /∑Yi
该指标描述了条件 (或组合 ) X 对结果 Y 的解释力度。覆盖率指标的数值越大,则说明X 在经验上对 Y 的解释力越大。通过 fsQCA 软件进行运算后得到单个条件变量的必要性分析结果:
(2)条件组合分析
通过运算后一般可以得到三种方案类型: 复合方案 (Complex Solution ) 、 吝啬方案 (Parsimonious Solution ) 和中间方案 (Intermediate Solution ) , 其中复合方案是完全按照变量进行参数设置而出现的结果,因此也是 QCA 分析中的惯例分析方案。从复合方案的输出结果中可以看到整体覆盖率 (Solution Coverage ) 和整体一致性 (Solution Consistency ) 分别达到 0.818792 和 0.976000,表明所有条件组合能够解释约 82%的案例,且具有较高的必要性解释力度。具体来看,共有 10 种条件组合路径且一致性(Consistency ) 得分均大于 0.9,表示这 10 条组合路径均具备较强解释力。
总结
使用条件:符合多因并发,即案例本身包含较多因素相互作用的原因结构。
案例规模:10-40的中等程度。
案例勾连的问题需要有理论支持。
软件安装:fsQCA
操作流程:
1.确定研究问题确定样本案例以及针对研究目标的结果变量(理论支持);
2.确定条件(解释)变量(基于前人研究经验作为指导,提炼);
3.构建真值表(Truth Table)以案例为单位对各个变量进行数据编码;
默认数据表的第一行包含对应那一栏的变量名称
第二行是数据的开始,一个案例单独一行
每一栏各个单元格是同一类数据
4.QCA运算;
5.QCA运算结果分析;
清晰集(最基本,二分)
得到这个结果由这几条可能的路径值得分析
覆盖率:这条因果路径能够解释百分之多少的成功案例
净覆盖率:约有百分之多少的成功案例仅能被该条因果路径解释
一致性:条件变量x和结果变量y在集合隶属上的充分关系、必要关系(一般以0.75以上为临界点)一致性测量的分值越接近1,表明案例共享某一条件的程度越高。
对每个路径进行回归案例的分析
csQCA:0/1划分
fsQCA:个案的某个特征是否可以被观察到的程度可以刻画为从0-1之间的任何数
mvQCA:多值集分析
T-QCA:条件变量发生的先后顺序对最终结果有影响,时序分析