注册登录才能更好的浏览或提问。
您需要 登录 才可以下载或查看,没有账号?立即注册
×
实验室Q C 的历史观点:我们的现状和今后怎么办! James O. Westgard,PhD
译者 冯仁丰 2011年9月 不学习过去只是重复是有罪的。在2011年的AACC/ASCLS回顾上,Dr. Westgard综述了实验室质量控制历史,以及它现有的问题和未来的展望。 - 从Shewhart开始
- 接着是Levey和Jennings,和第一代QC - 自动化开始 - 第二代QC - 第三代QC - TQM和第四代QC - 六西格玛和第五代QC - CLIA质量依从和“等当QC” - 未来的QC - 回到第一代QC或登上第六代QC? - 做什么 - 参考文献 在2011年的AACC会议上,我在Bio-Rad “质量控制的未来”专题会议上简要地介绍了QC历史。我想与会者会感到太繁琐,但惊讶的是,今天的许多实验室科学家却不知道从哪里开始QC、又如何适应技术上的变化。这个历史对于指导我们的未来和预防再次获得相同的错误很重要。例如,会议期间,我们被实验室科学家提问了许多QC问题。其中一个关心的问题是多个检测的QC应用,其他的是使用2s控制限值、以及重复检测控制品的做法。回答和解决那些问题可由解决过去发生在多通道分析仪上的问题予以指导。我们可以在以后讨论中回到这些问题,但现在是介绍历史的时候! QC的开始是Shewhart! 工业QC由Shewhart在1930年代引入的,该人是Bell实验室的统计师。他的经典著作“制备产品质量的经济控制”,提供了进行统计质量控制(SQC)的理论和实践。建议的技术是抽样一组样品,确定关键特性的均值和范围(极差),所以SQC的第一个工具实际上为均值和范围图,将多次检测的平均值点于均值图、将检测结果的最大值和最小值的差异绘制于范围(极差)图。这个技术今日依然为工业上的标准实践。 1940年代,Deming(曾经与Shewhart一起工作过)负责为美国工业提供培训SQC,以确保战争时期产品的质量。产品质量和SQC是美国武器的战略之一,以后成为美国工业的广泛实践。 在1940年代后期和1950年代,Deming被要求去支持日本工业改善产品质量,特别是电话,是当时改善通讯的需求。另外,Juran开始提供质量管理的更广泛培训。他们的努力开创了全面质量管理和继续质量的原理和实践。 出现了Levey和Jennings和第一代QC也是在1950年,两个临床病理学家 - Levey和Jennings -对医学实验室引入SQC。做法上引用一个病人样品,进行双份检测。当然, 这些双份检测的均值说明了大量变异的平均水平,因为病人与病人检测间的差异;但极差反映了精密度的度量,给出了一个监视严密检测过程的做法。 Henry和Segalove很快克服了因病人变异的局限性,他们在1952年建议以病人混合血清为控制样品,以提供一个可在较长的实践内是稳定的标本。与稳定的控制样品一起,他们还建议仅做单次检测,而不是双份检测,这就是今天“单个值”QC的实践。所以,闻名的Levey-Jennings控制图事实上是Henry和Segalove改变为仅作单次检 测的。常用的做法成为仅分析单次控制品、并应用2s控制限值。
然后出现了自动化 1960年代在临床实验室实现了自动化。SQC成为标准实践,厂商开始提供稳定的市售控制品,支持常规实验室QC。
Technicon AutoAnalyzer是1951年由Leonard Skeggs医师发明,他工作于肾透析。因为他也在临床实验室,他对如何自动检测血液有兴趣,他的“透析仪”发明是一个突破点,可使检测过程的蛋白分离步骤自动化。在50年代形成了相对较小的AutoAnalyzer后,随后它们成为了1960年代标准做法,使实验室检测开始激增。 随着自动化,QC也成为标准的做法。记住:AutoAnalyzer是一个连续流动设施,意即它基本上是一个泵浦,通过与不同粗细与长短的管道组合,控制了样品与试剂的用量和反应时间,针对每个检测项目形成一个单独的反应组合块。分析速度是每小时40个样品,由此形成了“批量(一批)检测”的做法:检测标准安排在最先、然后检测一些控制品、然后是检测病人样品,最后还有较多的控制品。
从中你可以领会,泵浦连着管道使内含反应液蠕动向前,容易使检测结果随时间出现漂移;因此批量控制对于监视检测结果对于时间的稳定性非常必要,即使相对于较短的一个小时也是必须的。很快,将单个项目检测的AutoAnalyzer组合在一起,成为高容量自动检测(葡萄糖和尿素)和电解质的分析仪。不久,Technicon公司的同时检测多项目的多通道分析仪(Simultaneous MultichannelAnalyzers,SMA系列)成为实验室检测的大型仪器,它们在大小上从60年代的6通道、12通道,到70年代的20通道(注:每个项目为一个通道,即一个反应组合块)。但同时,QC的做法依然继续使用2 SD控制限值,造成许多实验室因固有的假性拒绝过多的困难。每个人知道即使在检测过程运行完善下,超过2 SD限值的可能性为5%。随着控制品数量的增多,假性拒绝可能性(Pfr)也增加。使用2个控制品时,Pfr约为9.5%,用3个控制品的Pfr为14%,4个控制品为18%。当时很少懂得,在多通道分析中,每个不同检测通道会出现相同的问题;所以,随着SMA检测通道的增多,假性拒绝的机会(至少在检测通道上)也增加,所以,经常需要至少对组合的一个检测项目进行重复检测,严重影响了分析仪的工作效率。在Bio-Rad会议上,我讲了一个例子,若在20通道分析仪上和使用1 SD为控制限值时,我们几乎经常必须至少对一个检测项目进行重复检测。我指出:如果我们增加控制品为两个,我们可能永远不断地总是重复分析一组标本,这样因为我们将不再必须收集更多的病人标本而可节省更多时间的金钱。这个故事是一个笑话,但是很少人理解我讲的是什么。这就是实验室人员今天不知道这个历史(也说明我已经多老了)的示例。我们可能不断地再次遭遇这些相同错误(因为我们不知道这个历史)。今天,在多通道分析中实施QC的种种困难,还是如何处理这个多通道分析中假性拒绝的问题。 第2代QC 1966~1977年,正当在瑞典Uppsala大学休假时,我开始研究工业的QC实践,去深入了解实验室QC实践的起点,也学习了如何改善实验室的QC实践。从SMA分析仪上经验的反思,很明显,必须消除2SD限值,但用什么来替代?工业上的标准实践使用的3SD限值,仅以2SD为警告规则,这也是原先Shewhart的建议。当3SD限值依然具有 低的假性拒绝,却具有在误差检出上对于医学项目的使用不足够的危害。所以,看来以2SD为警告规则、3SD为拒绝规则是合适的,然后考虑其他可改善误差检出的规则。通过计算机模拟研究,我们能确定用于工业上绝大多数规则的拒绝特性,然后建议一个做法:为了使QC性能最佳,首先消除假性拒绝,再使用系列控制规则增强误差检出。1981年发表的文献详细示例,叙述使用“Shewhart Multirule Control Chart”。 在80年代,许多实验室实施了自动系统的多规则QC,必要的QC软件提供了实验室信息系统。Technicon是第一个厂商使用该多规则QC,并以“Westgard 多规则”命名闻名。该多规则被广泛应用的一个原因是Westgard 多规则处于公众需求的状态、也发表在科学文献上,并仅对“复制”做了保护。在当时作为大学研究目的是解决问题,而不是去保护发现和设法去获取经济利益。在手工方法上使用第1代的Levey-JenningsQC后,多规则QC被考虑为自动分析仪上用于所有检测项目的第2代QC,就像Levey- JenningsQC适用于所有检测项目被普及了。 第3代QC 在这个相同的时间,分析系统得到了极大地改善。在80年代,DuPont ACA成为自动随机进入分析仪(Automated Random Access Analyzer)的稳定性新标记。以往从来没有这样的分析仪可稳定完整的一天、可以稳定多天、甚至数周。若我们仍然按照以往的经验做法频繁地运行控制品,很明显是不合适了。这个新的分析系统需要较少频率的控制,在技术改善下我们需要改变我们的QC实践做法。ACA给我们上了课:应在不同的分析系统上使用不同的QC程序,这就是选择或设计QC程序的开始,去适应不同分析系统和技术的性能特性。这可以认为是第3代QC。
TQM和第4代QC 幸运的是,美国工业在1980年代显现了全面质量管理(TQM),致力于和日本工业高质量产品的竞争。Deming和Juran现在领导着美国工业区实施了与日本工业的相同技术。这个努力较SQC(Statistical QC,统计质量控制)更广泛,特别强调管理责任和对质量的保证。现在对质量定义有多个,如:“产品或服务的特征和特性符合满足给定需求的能力”[American Society for Quality,ASQ],对使用的合适性[Juran],对需求的依从[Crosby],满足客户的需求[Deming]。所有这些定义集中关注于“预期的使用”和为了提供相应的质量,需要理解客户的需求。 在这个时候,满足客户的需求取决于方法性能的初始确认,然后应用QC用于监视方法可用的性能。当我们已经形成了方法确认的方案和指标,为判断与质量要求有关的性能,以“允许总误差”(TEa)表示,SQC程序对于某检测项目要求的质量、某方法观察到的精密度和偏倚等,不是最佳。我们在1986年的“费用有效的质量控制”一书中,首先概述了做这个的通用方法学,这个方法学应用了TQM的原理到医学实验室实践中。 在90年代,出现了高稳定性、高精密度、高产率的随机进入分析仪(Automated Random Access Analyzer),如Hitachi系列。 除了将QC改变适应分析系统外,很明显,不同的QC程序(规则、N)应与在相同系统上检测的不同项目相适应。TQM的原理指导我们,依据该项目的预期用途要求的质量、和该特定方法观察到的精密度和偏 倚,使QC程序性能最佳化。由于减少了假性拒绝率而改善了产率,展示了最佳QC涉及的费用有效性。 六西格玛和第5代QC 为改善QC设计的强大推动力,是由六西格玛管理提供的,这是在90年代工业上提出的,并已经在卫生保健组织中实施,在90年代末期实验室也开始应用。六西格玛强调了确定“容许限值”的要求,来叙述预期的用途、设定“世界等级质量的六西格玛目标、和提供统一的做法叙述失败、失败率、每百万次的失败率(DPM)、以及自身的六西格玛尺度(Scale)。“西格玛-度量QC选择工具”已经涉及来自早期“临界误差”工具,并事实上已经包括在CLSI C24A3导则“定量检测的统计质量控制”。所以,标准QC计划工具成为可用的手工工具,以及计算机计划。在这个时候,Parvin正在改善QC设计,特别考虑了QC的频率。他展示了环绕已知和未知事件的结构QC的需求。已知的事件为检测过程发生的改变,知道发生改变的时间,如:试剂瓶的变化、分析仪的保养、机械部件的更换等。QC样品应按照这样的已知事件安排,将一些样品在事件间进行常规分析,以检出可能会发生的未知变化。考虑连续报告检测结果(相对于批量报告)的做法,也要求以控制品不断进行的过程监视。这样,多步骤QC的战略成为了第5代QC,对于一个分析过程常规操作中,在不同时间应用不同的QC设计。 一个建议的战略,是应用在一批开始时具有高误差检出的开始QC程序,然后“监视”在整个一批检测中设计是否具有很低的假性拒绝,最后加上病人数据的QC,如正常结果平均值算法(Average of Normal algorithms,AoN),去度量一批的长度。 CLIA质量依从和“等当QC” 1988年,临床实验室修正法规(CLIA)成为法规,1992年按照CLIA规则和管理区实施法律。除了法律的一部分要求FDA“批准”厂商的QC建议或说明被延缓了,这个CLIA法律提供了临时最低标准,即每批至少分析两个水平的QC、或每24小时2个水平。这个临时的最低QC大致上每2~3年被持续至2003年,在最终CLIA法规中规定了以往的QC做法。此时,每天2个水平的最低QC成为实际上存在的做法,使规定的QC做法毫无进展却退回到在许多实验室的第1代Lavey-Jennings的单规则QC。 在90年代,POC设施已经普遍,CMS(CMS:the Centers for Medicare and Medicaid Services,医疗保险服务中心。注:这是美国实施医疗保险的管理机构)感到即使每天至少做2个水平QC也具有困难。厂商争论说,仪器内的控制应足够了,CMS临时允许这样的设施以“电子QC”替代使用液体控制品,直至实施QC批准的规定。电子QC事实上没有新东西!使用相似的仪器检查有许多年了,但是从来没有作为独立控制样品的替代物。例如,DuPont ACA应用了每天“过滤平衡”程序,是一个电子检查,先于病人样品和控制品的常规分析。但是,在许多POC应用中SQC实施的困难,导致主要依赖厂商设定在内的控制品。 由于在最终法规批准的内部实施QC中,CMS对于POC应用的新补救办法,要求实验室进行确认方案,将分析每天两个水平替代控制品减少为每周两个水平、或甚至每月两个水平。这被称为“等当QC”,是比较方便的,但也很混淆的“电子QC”新做法。CMS在联邦操作手册(State Operations Manual,SOM)发布了新的EQC导则,叙述 了为减少QC频率对验证某设施的确认方案。不幸的是,这些确认方案它们自己没有被确认,因为时间太短了。例如,建立在内部控制品的设施,监视完整的检测过程,该方案要求在10天期间进行内部控制品的检测实验室间控制,若没有观察到失控问题,替代控制品的频率可减少至每月一次。很明显,观察到稳定操作的10天,不能确保设施将可稳定30天,但每月EQC依然认可了设施。 未来的QC - 第1代或第6代? “等当QC”问题在工业上和实验室用户中都显而易见。2005年3月,CLSI举行了“未来的质量控制”学术会议。最后由CLSI委员会去形成一个新导则文件,处理因EQC引入的问题。6年后,我们依然再等候该导则的发布。2010年发表了提议文件“依据风险管理的实验室质量控制”,预期在2011年末为“批准”版。 风险分析涉及评审分析检测过程的系统,以证实所有可能的失败模式。然后每个失败模式的风险依据它发生的可能性、若它发生对它的检出率、若检出不出危害的严重性等予以估计。证实的高度风险失败模式,然后形成一个做法,通过预防发生和/或最佳的检出(和为恢复必须的纠正措施)去消除它们的危害。在医学实验室,对于风险减轻的主要方式是改善检出,意即对每个高度风险失败的模式实施相应的控制机制。这些控制机制被组合在“QC计划”中,规定它们的运行、频率、和为恢复采取的纠正措施。需要评价QC计划的“残余风险”,以确定对于实验室检测预期使用的可接受性。一旦该计划被实施,检测过程的质量和性能必须被监视去证实要求改善的无效。 进行风险分析的工具被称为EMEA(Failure Modes and Effects Analysis, 失败模式和影响分析),在工业上有很长的使用历史,但是对医学实验室总的来说是新的。所以,如果风险分析是提供形成实验室QC计划的可靠方式,将是难以接受的一个学习曲折。近期ISO和CLSI导则叙述了定性方法学,对残余风险的可接受性做了武断的决定。较定量的方法学通过组合六西格玛和其度量是可能的,但使风险分析过程对于更多的需求,并主要进行中难度和高难度检测的实验室更合适,对于POC设施打算使用EQC的、和推动形成CLSI风险管理的QC导则是不适用的。 风险分析并不是替代EQC。除非CMS在联邦操作手册中取消了EQC方式。EQC验证的时间和努力,较什么需要进行风向分析要少得多,所以风险分析对于复杂分析系统有真正的好处,可适当地监视临界失败模式,有必要形成详细的QC计划。对于厂商的优点是:若希望形成“选择的QC”方式的适用性文件,对于实验室的好处是:若实验室需要为实验室形成的检测项目(Laboratory Developed Tests,LDT)提供相应的QC计划。作为常规QC的一部分,它将促进更相应的监视分析前和分析后失败模式。实施将得到Auto-Verification软件的协助,但关键要明确SQC是否依然是自动确认规则被实施的一部分。 该怎么做? 如果近期EQC方式依然保持,则我们被回归到第1代QC,对那些需要依从法规的实验室是这样的!若相应的QC计划被完善地形成,将会导致改善和实施第6代QC!这样的优点是对于今天的高度复杂的自动分析系统、以及对新的复杂检测技术是需要的,传统的SQC程序被实施提供相应分析前、分析中、和分析后失败模式。 我们正处于前进路途中的分岔口,是选择高速路还是低速路。克服质量依从的最后10年,可能现在是对厂商和医学实验室走向改善质量系统的重要问题。风险分析可以是一个新方式,获得质量系统的改善,但是,这也是容易成为仅仅是一个质量系统的外貌的一个方式,被滥用和误用。对华尔街、与深水油井风险分析的问题的理解,应按照我们的理念予以更新,才使得我们知道风险分析本身是冒险的业务。 |