标准样品普及讲座(12)标准样品标准值的测量不确定度

发布时间:2005-10-05 02:53        发稿部门:全国标准样品技术委员会 陈柏年 徐大军

  1 标准样品特性标准值的测量不确定度评定和GUM的关系
  从理论上讲,测量不确定度仅仅是对一个具有溯源性的测量结果离散程度的描述,在《国际通用计量学基本术语》(VIM)中是这么定义的:与测量结果相联系的参数,表征合理地赋予被测量之值的分散性。因此,要合理地评定一个测量结果的不确定度,就必须首先确认其溯源性上的特点,即:是溯源到SI框架体系?还是溯源到一个特定的测量程序?
  从实践上讲,虽然评定任何测量不确定度的技术依据都应是1993年由7个国际组织发布(1995年重新确认)的《测量不确定度表示指南》(GUM)。但是,由于1981年发布的ISO导则31《标准样品证书内容要求》就已经提出了采用标准偏差(实际上就是测量不确定度)来评定标准样品特性标准值的离散性(参照采用该国际导则的国家标准GB/T15000.4-1994第6.7条中也给出了采用标准偏差和不确定度来评定标准样品特性标准值的实例)。因此,标准样品特性标准值测量不确定度概念的提出实际上是上个世纪七十年代末,和1993版GUM的前身、国际计量局(BIPM)1980年提出的国际建议INC-(1980)《实验不确定度表示》几乎是同步的。而且由于GUM第1章中明确规定了该指南"主要涉及表示很好定义了的、物理量的测量不确定度",也就是说:1993年版GUM研究的重点是适用于能够用数学物理方程定义的物理量;有关标准样品的ISO导则研究的重点则是化学特性、生物特性等不属于SI框架体系或采用该框架体系有困难的其它量。当然,在标准样品特性标准值属于SI框架体系时(即特性标准值主要依据测量仪器确定时,也就是可以采用第11讲中规定的单个实验室权威方法定值方式时),可以按GUM规定的程序进行测量不确定度评定。但是当标准样品特性标准值主要依据特定的测量程序(即采用第11讲中其它3种定值方式)时,标准样品特性标准值一般就无法采用合适的数学模型(例如采用数学化学、数学生物、数学工程或数学感官方程)来定义,这时,就应该采用ISO导则35:2005《标准样品的定值 总则和统计学原理》中规定的程序。实际上,这一点在GUM中也有明确的规定: GUM要求在这种情况下,必须另外选择其它合适的评定程序,因为上述特定的测量程序一般无法用合适的数学模型来描述各种输入量的离散性(例如化学分析中制备样品程序、特定操作人员的操作手法)和标准样品特性标准值离散性(即测量不确定度)之间的关系。从而就无法采用GUM中规定的不确定度传播率来评定该标准值的合成测量不确定度。
  同时还应该特别注意:在评定标准样品特性标准值的测量不确定度时,除了要评定测量程序引入的不确定度分量之外,还要评定样料不均匀性、长周期稳定性和短周期稳定性引入的不确定度分量。因此,对大多数标准样品而言,它标准值的测量不确定度中除了包含特定的测量程序引入的不确定度分量之外,还包含有样料不均匀性、长周期稳定性和短周期稳定性引入的不确定度分量,这就需要采用不同于GUM中提出的、特定的评定程序。由于这个特定的评定程序涉及到标准测量方法(测量程序)、参加定值实验室技术能力的一致性和被定值样料的稳定性均匀性三个要素,所以它是一个既符合GUM规定的基本准则、又具有自己独特要求的专业化的测量不确定度评定程序。
  
2 评定标准样品特性标准值测量不确定度的统计数学模型
  根据ISO5725《测量方法和结果的准确度(精密度和正确度)》的规定,多个实验室采用一个特定的测量程序对相同的被测量进行测量获得的测量结果的统计数学模型如下:
  X =μ+δ+β+e
  这里: X是一个特定实验室一次测量获得的结果;
  μ是被测量的真值,理想条件下存在,但实际上是找不到的。
  δ是测量程序固有的系统误差,不同的测量程序固有系统误差的幅度不同;由于真值实际上是找不到的,所以这个误差也常常是未知的,但可以通过测量不确定度评定对其进行合理的估计。
  β是重复性条件下,实验室固有的系统误差。每个实验室都存在,但幅度不一样。在复现性条件下服从正态分布,可以通过测量不确定度评定进行估计。
  e是重复性条件下,每次测量中引入的随机误差。每次测量都存在,虽然幅度不一样,但在重复性条件下服从正态分布,可以通过测量不确定度评定进行估计。
  下面就简单分析在确定标准样品特性标准值时,如何评定它们引入的测量不确定度。
  2.1 测量程序(测量方法的细化)的系统误差δ引入的不确定度
  当对在复现性条件下,参加定值的实验室采用同一个测量程序获得的检测结果之间的差异进行考查时,由于对于同一个测量程序来说,它的系统误差δ是固定不变的,不会反映在差异之中。因此对溯源到同一测量程序的标准样品来说,可以忽略这个固定的系统误差,在评定标准样品的测量不确定度时不考虑它。但是,当采用几个准确度水平相当的测量程序进行定值时,则首先要确定这些不同测量程序固有的δ是否相当, 或确实存在一个公认的约定真值μ(一般能溯源到SI框架体系的量都符合这个要求)时,就必须考虑测量程序固有的系统误差δ引入的不确定度。
  2.2 实验室的系统误差β引入的测量不确定度
  对在重复性条件下,参加定值的单个实验室采用同一个测量程序获得一组检测数据之间差异进行考查时,由于同一个实验室的系统误差β是固定不变的,所以不会反映在差异之中。但复现性条件下,不同实验室的β是不同的。不过只要这些实验室的技术能力相当,则ISO5725-2假定这个β的分布是正态的,可以采用实验室间方差来评定
  β引入的方差被称为实验室间方差,表示如下:
  var(β) = σL2
  这里:σL包括操作员之间(包括操作手法和经验)、测量设备之间(包括制造方面的差异、时间漂移、温度漂移和测量标准校准时引入的差异)和时间不同(包括环境条件和控制条件变化)引入的变化。
  在采用实验室间联合定值方式时,这些分量没有被分别处理,而是统计在复现性标准偏差中的。一般地说,β可以被考虑为是一个随机性的系统误差分量。即对于重复性条件,它是系统误差;对于复现性条件,它是随机误差。
  当参加定值的各个实验室测量获得数据显示出多峰值时,也就是不符合正态分布时,这就意味着:来自各个实验室的数据缺乏一致性。也就是说,各个实验室技术能力不相当,各个实验室的β不具有随机分布特性,无法采用统计方法评定β引入的测量不确定度。这时就要重新考核、确认各个参加定值实验室技术能力的一致性。
  2.3 实验室的随机误差e引入的测量不确定度
  e代表的是在重复性条件下,参加定值实验室提供的每个检测数据中引入的随机误差,按ISO5725的规定,e服从正态分布。采用重复性条件下的方差来评定,被称为实验室内方差,表示如下:
  var(e) = σw2
  由于不同实验室操作人员水平的差异,所以虽然测量程序相同,因此不同的实验室有不同σw。但是在对标准样品定值时,由于要求所有实验室的技术能力是相当的,所以这些差异可以不考虑。这样,参加定值的所有实验室可以获得一个共同的实验室内方差值。这个值是实验室内方差的算术平均值,称为实验室内重复性方差,表示如下:
  var(e) (的平均值)= σr 2
  这个算术平均值包括所有参加定值实验室的方差(排除提供的离群值)。
  2.4 扩展不确定度的确定
  一般按正态分布、置信水平为95%来确定扩展不确定度,包含因子k = 1.96 。但当有效自由度比较小(即参加定值的实验室比较少、每个实验室提供的重复性检测数据比较少时),则按t 分布选择包含因子,置信水平仍为95%。
  3 标准样品特性标准值测量不确定度评定的基本数学模型
  应该知道:建立标准样品特性标准值测量不确定度的数学模型,既不是一项常规性的工作,也不是一项严格的数学工作,而是一项非常专业化、非常复杂的工作,随专业不同、特性定值方式的不同而不同,所以应该仔细地考虑与每个标准样品研制程序相关的所有详细情况(这些程序是用来制备样料和对样料定值的)。模型的基本要求之一是:那些对标准样品特性值不确定度有显著贡献的所有因素应全部被包含。所以,为了确保完整,一个标准样品的合成不确定度应该包含参加定值实验室技术能力不一致因素、材料不均匀性、长(短)周期稳定性因素以及批量表征化引入的因素(特定的情况下也应包括测量程序固有的系统误差引入的不确定度)。一个标准样品的测量不确定度包含如下分量:
  * 实验室技术水平不一致引入的不确定度;
  * 表征化时测量程序(测量方法的细化)引入的不确定度;
  * 转换成单个包装引入的不确定度(均匀性);
  * 交付给销售商时引入的不确定度(短周期稳定性);
  * 从销售商到用户时引入的不确定度(长周期稳定性);
  确定一个标准样品特性标准值的测量不确定度要考虑如下影响:
  * 材料完全表征化引入的不确定度;
  * 用户一次仅仅使用一个样品引入的不确定度;
  * 材料被用户或生产者长期贮存引入的不确定度;
  * 材料必须运输到用户时引入的不确定度。
  这些因素都显著地贡献测量不确定度给一个标准样品的特性标准值。对这些影响因素的正确理解是:应与正常测量相同。评定测量不确定度时,不需要考虑不适当的、错误的测量,不适当的应用和不适当的运输等等引入的不确定度分量(这些检测数据应作为异常值加以剔除)。这与GUM第3.4.8条的要求是一致的。第3.4.8条明确指出:虽然本指南提供了评定不确定度的框架,但是它不能代替批判性的思考、认识上的直觉(经验)、专业上的技能。实际上,不确定度的评定既不是一个常规性的工作程序,也不是一个纯粹的数学工作,它要依赖对被测量性质的详尽了解(即测量人员的专业技能和经验)。所以,一个测量结果的不确定度的质量和效用,最终依赖于对被测量的了解(经验)、批判性的分析(直觉)、和对赋予它值的所有因素完整性的认识(哲学上的批判)。
实际统计数学模型如下:
  xCRM = xChar +δbb + δlts + δsts
  这里:
  xCRM表示标准值;
  xChar 表示对一批材料表征化获得的特性值,或对在单个人工制造样品定值情况下,从这个样品获得的特性值;
  δbb 表示由于瓶-瓶之间差异引入的误差;
  δlts表示由于长周期引入的误差;
  δsts表示由于短周期引入的误差(这里没有考虑实验室能力不一致引入的误差)。
  通常,采用这样一种方式进行研究:对于一个特定的样品,这些误差项的值为零(即在对一个特定样品进行测量时,该特定样品本身不存在这些误差),但是要注意:它们的不确定度不为零(因为测量不确定度反映的整批样品在有效期内的离散性)。
  假定这些输入量是独立的,则一个标准样品特性标准值的测量不确定度UCRM为(Uchar2 + Ubb2 + Ults2 + Usts2)的正平方根(如果不独立,还要考虑协方差)。
  采用GUM中提供的不确定度数学模型,则瓶-瓶间不确定度分量Ubb、长周期稳定性不确定度分量Ults、短周期稳定性不确定度分量Usts分别相应于模型中的各个输入量的测量不确定度。
  有时,长周期稳定性项还是时间的函数,例如放射性同位素类的CRM。对这类CRM定值时,应计算标准值与时间之间的依赖关系。
  对测量进行模型化的总的建议见ISO导则35:2005〈标准样品定值 总则和统计学原理〉第7到10章。
  在有些情况下,不采用这个基本模型也是可以的。这些情况包括:样品不需要运输;证书上明确规定不确定度不包含样品运输;关于这些不确定度分量评定见ISO导则35:2005《标准样品定值 总则和统计学原理》第7、8、9和10章。
  如果一个样品对于在运输中温度的变化是敏感的,当温度提高时,一个星期内样品就会发生严重变化,而从生产者运送到用户则需6个星期,这时候就必须在证书上加以说明(或在附加文件中规定)。
  4 GUM第8章中给出的测量不确定度评定程序
  一般来说,标准样品特性标准值的测量不确定度按上述的原则进行评定。但是,当它具有溯源到SI框架体系特点时,则一般也可按GUM第8章给出的程序对标准样品特性标准值测量不确定度进行评定。该程序摘要如下:
  4.1 找出标准特性标准值和各个输入量之间的关系。即找出标准值和所有影响其变化的输入量之间的数学关系式。这个关系式应包括所有可能显著影响标准值不确定度的输入量,我们将这个数学关系式称为测量的数学模型。
  作为输出量的标准样品特性标准值Y和它所有的输入量Xi之间的关系:
  Y = f(Xi)。
  这里:i = 1,2,3,……,N
  4.2 确定输入量Xi的估计值xi,可以依据对一组已经获得的观察值进行统计分析得到;也可以依据其它非统计分析方法得到。
  4.3 采用A类方法评定输入量得到的一组数据的标准不确定度,采用B类方法评定所有的其它量标准不确定度。
  4.4 评定任何输入量之间的协方差。
  4.5 计算特性值y,并将这个值确认为标准值。
  4.6 采用GUM第5章给出的传播率,来确定标准值的、与来自与输入量相关的标准不确定度和协方差的合成标准不确定度。
  4.7 为了得到扩展不确定度U,确定包含因子k。这时候,可以假定:有理由为标准值的大部分落在区间[x-U,x+U]之内。选择包含因子的依据是置信水平(常常为95%)、y的概率密度函数和自由度。
  4.8 按ISO指南31的要求,报告特性值、扩展不确定度U和包含因子k。