当前位置: 华文星空 > 知识

暖通中的底层数学知识应用2

2018-03-24知识

2018.2.11 更新

修正更新了对于泊松分布的说明详细内容。补充内容主要是对洁净度测试和高效检测的最小取样量和非零原则进行说明

2018.2.7 更新

对于本文,尽管标题叫做泊松分布,其实主要还是介绍了两个东西

1.洁净度测试时候为什么有一个最小空气取样流量,这个流量是怎么来的?

2.高效过滤器的粒子计数器挑战性检漏测试,如何进行最终计量粒子量的修正

由于以上两个问题较复杂,许多规范和资料的语焉不详。

且实际制药项目中一般采用光度计质量流量检测法>=0.01%.

因此找到一本好的书籍来介绍并不容易。

这里我给有学习研究意愿的朋友们推荐本资料

ISO14644-3 1999 EN或者CN中有详细的对于粒子检测的分析 计算方法 以及案例,并且对测试各项内容进行了详细的说明,特别是针对观测值和实际值的差异--泊松分布 对于观测时间的说明--建议机器自动检测等等,对理解此问题有很大帮助

比国内的那本GB50591-2010 洁净室施工及验收规范 中的关于粒子检测的说明要详细得多

泊松分布在强大的知乎中,有许多资料提及过。但其实暖通中也有对于泊松分布的应用。我先按下不表。我们先来看一看泊松分布

1.泊松分布

泊松是法国数学家,其在1838年发布了这个结论,后来该概率分布就以他的名字命名

正如大家所知道的一样,生活中许多实例符合正态分布,比如人的身高分布,收入分布, 人的智商分布,情商分布。如在我的上一篇文章中讲述的

中的例子一样,对于温度 湿度 洁净度的房间内部的测试,房间内部的各个点的数值或者计量也符合正态分布

但是大家也不要小看泊松分布,在我们的生活中,同样存在着大量的实例符合泊松分布的特点。比如

某医院妇产科的在一段时间里面的接生数量的概率分布

某超市的乐事薯片的在一段时间里面的销售情况的概率分布

飞机在一段时间里面失事的概率分布等等

2.概率中的泊松分布密度函数和泊松过程

工科概率论课本中解释较简单,主要是针对工科应用层面的解说。

泊松分布是离散型概率中的一种

作者注:常用离散型概率有0-1分布,二项分布,泊松分布,几何分布等

概率论中的泊松分布是从二项分布演化而来的

二项分布:假定我有100个不同的硬币,每个硬币分别投掷,问其中有1个硬币出现正面,另外99个硬币出现反面的概率就是一个典型的二项概率,其概率的密度分布为

P(X=K)=C( \frac{k}{100})*p^{k}*(1-p)^{100-k}

P为概率,本例中为0.5,K为正面向上的次数,本例中为1次, 且因为这一次可以出现在100个硬币中的任何一个,因此C(1,100)

因此计算公式如下

P(x=1)=c(1,100)*(0.5^1)*(0.5^99)=7.89*10^(-29),这是一个非常小的概率

当我们将硬币的数量从100个增加到1000个 10000个 十万个 一百万个之后,也即参与的样本越大,则二项分布就逼近了泊松分布。

泊松分布的密度函数是

P(X=k)=\frac{e^{-\lambda}*\lambda^{k}}{k!} ,这里K对应着发生1次2次3次....n次的次数, P则对应着发生相应次数下的概率。

书中的解释是说,当某一个事件发生的概率特别小,也就是p非常小,而样本空间的数量特别大,也就是n特别大的时候,n*p= \lambda 。一般n>=20,p<=0.05就很符合泊松概率了

估计很多人不明白 \lambda 到底是什么,这是教材编的不好的原因

其实我说白话大家就明白了,这里的 \lambda 就是长期观察的一段时间或者一段空间容量下的发生事件的次数,其实就是期望E=n*p

比如

长期观察下来,某妇产科在一年当中基本上接生100个婴儿,那么 \lambda 就是100/年*1年

长期观察下来,乐事薯片在一个星期里面可以卖10包,那么 \lambda 就是10/星期*1星期

长期观察下来,世界上飞机在一年内失事的次数是1次,那么 \lambda 就是1/年*1年

只不过,在这种情况下,泊松分布的公式要改写成泊松过程的公式,如下

P(X=k)=\frac{e^{-\lambda*t}*(\lambda*t)^{k}}{k!} 或者 P(X=k)=\frac{e^{-\lambda*V}*(\lambda*V)^{k}}{k!}

以上分别指单位时间或者单位空间单位体积流量中的泊松分布公式

我举个实用的例子,比如一个小超市长期观察下来,发现其薯片的销售是每周能够卖10包,请问现在到了月初需要备货了,问这个超市考虑可能的销量,一周内应该怎么储备薯片才合理呢

现在我们已知 \lambda =10/周,则泊松过程公式为

P(X=k)=\frac{e^{-10*t}*(10*t)^{k}}{k!}

我们考虑一周内其可能卖出的数量和对应的概率,则t=1[如果考虑两周的备货量,则t=2]

公式为

P(X=k)=\frac{e^{-10}*(10)^{k}}{k!}

K=0,也就是一周内一个都没有卖出去,P(K=0)= e^{-10} =4.54*10^(-5)

K=1,也就是一周内只卖出一个, P(K=1)= e^{-10} *10=4.54*10^(-4)

K=2,也就是一周只卖出两个,P(K=2)= e^{-10}*10^2/2! =2.27*10^(-3)

......

整理成表格如下,我使用EXCEL自动计算了结果

结果可以看到,如果在一周内备货15个,其已经满足了95%的可能性了,这也就是说在一周内,95%的可能性是销售掉0-15个之间的数量,因此备货15个则基本不会出现备货不足的情况。而备货18个,其累计概率已经是99%了

从上面这个例子,我们看到了泊松分布的实际应用。

笔者注:简而言之,泊松分布就是考虑一个事件重复进行测试,获得了单位时间的平均次数[期望]的情况下.考虑在下一个单位时间里面发生0次,1次,2次.... 的各自概率

那么有人问了,你罗嗦了这么多,和暖通有什么关系!

3. 暖通中的泊松分布

3.1洁净度检测的最小取样量:非零准则-根据泊松分布概率计算

笔者注:这里指的是单点洁净度测试中的取样量,而不是一个房间中的各个点的洁净度分布。即不是正态分布或者t分布分析。下面的原话是每一测点

在规范GB50591-2010 洁净室施工及验收规范中,有这样一句话--注意看数字3

有人知道这个公式中的3是怎么来得吗?

在洁净室内部,单位容量--每立方米或者每升下的粒子浓度是非常低的,因此单位容量下的粒子分布可以按照泊松分布来描述,

我们以一个ISO7万级的洁净室为例,已知其5um粒子浓度应该在千级到万级之间的一个数值,也即平均期望为293粒-2930粒/立方米=0.293粒-2.93粒/升, 即单位容量下,比如一升里面的粒子数量,其期望是一定的,下限为0.293粒 这显然符合泊松分布,其每次检测V升中,能够发现粒子数量K粒的概率分布表达式为

P(X=k)=\frac{e^{-0.293*V}*(0.293*V)^{k}}{k!} (k=0,1,2....)

我们希望出现粒子计数器检测不到,也即X=0的概率小于5%,也即检测到至少一粒的概率至少为95%的计算公式如下:

笔者注:此为泊松分布的非零准则

P(X=0)=\frac{e^{-0.293*V}*(2.93*V)^{0}}{0!}<=0.05 ,推出 e^{0.293V}>=20

化简得到

V>=\frac{3}{0.293} 升=10.2升

右侧算式中的分子就是GB规范中出现的结果3. 本质是ln20的结果

而计算结果就是10.2升---大家看上面GB图表中也会发现,针对ISO7级5um的粒子其最小采样量就是我的计算结果10.2

同理,我们可以获得不同粒径,不同等级下的各种最小采样量,这里我就不计算了,方法都是一样的。具体参见上面的GB表格

3.2高效过滤器检漏中的95%置信--泊松分布置信问题

如果有人从事洁净室高效过滤器的安装检漏工作,也许就明白我在说什么。

高效过滤器的挑战性实验也是典型的泊松分布应用。

下面以高效过滤器为例讲述

在高效过滤器生产完毕以后,以及在高效过滤器安装在现场之后,我们按照规范

GB50591-2010 洁净室施工及验收规范

GBT 25915.3-2010 洁净室及相关受控环境 ISO4644-3

等相关规范进行现场的高效过滤器的挑战性实验--粒子计数器法检漏

上图就是一个典型的高效过滤的现场检漏和示意图

本文不是专门讲述高效过滤器特性的文章,因此不详细介绍高效过滤器的内容,这里只简单说一下高效过滤器的分类,见下表

上图中我们发现美国标准A级相当于欧标的p3, 而C级相当于欧标的p4

C级别以上的检测就是我们常用的DOP测试方法,其总效率为99.99%.且局部效率要求也是99.99%.其用光度计测量质量中径在0.4-0.5um的多分散相粒子的质量浓度前后百分比

而欧标中对于p4的高效过滤器,采用了总效率为99.995%,而局部效率为99.975%的MPPS最易穿透粒径的方法测量,其测量粒子数量的前后百分比

作者注: 本质上,MPPS的最易穿透粒径在0.2-0.3um之间,而DOP采用的热发尘的质量中径在0.45um左右,几何粒径也基本在0.3um左右,因此实际上两者基本相同。

同理我们在,泊松分布这个概率对于我们进行高效过滤器检漏有什么知道意义呢?

记得上一篇文章我说到了样本数据求平均值的置信区间计算方法应该采用t分布表计算的问题

在高效过滤器的检测中,我们同样需要使用置信区间来考量, 这里的考量就不能采用95%置信区间的t分布表了。

我们需要采用泊松分布的小样本或者大样本的95%置信区间的表格修正检测结果。如下图

此表来自ISO14644-3 2005

比如理论计算下游的粒子接收器1分钟能够接收到5个,实际扫描中只能观测到3个,请问验收合格吗?

答案是否定的,因为按照泊松分布的95%的置信上限表,当计算结果为5.6的时候,观测结果不应该超过1个,如果超过则说明有泄漏风险。

这时需要靠近可能的漏点做静止测试,采样时间长一些,计算理论的上限值,和实际测量值比较.这时的采样需要使用大样本的近似正态分布的置信计算了,就不展开了。

理论上测量时间越长,接收数量越多,则95%置信偏差越小。比如理论上计算1min应该接收10000个粒子,根据置信计算,应该观测到9800,两者已经很接近了、这是因为随着接收数量的上升,泊松分布逐渐逼近正态分布。

具体可以参见ISO14644-3中的检测方法

3.3后记

目前中国的实际项目操作有两种方法进行高效过滤器的检漏,分别是

光度计检漏--常用检测方法,为FDA和EMEA认可

粒子计数器检漏--不常用

本文说的是后一种,从实际效果来看,并不太理想。主要原因是多方面的,包括上游的发尘情况无法获得,房间本底洁净度,检验人员的素质,接收的设备的质量,分析总结能力等等。

因此实际的制药行业项目操作中,以上游发尘,计算质量总量,下游使用光度计检漏计算下游质量总量,比较百分比,超过0.01%即为漏的原则来检测

参考文献

  1. GB50591-2010 洁净室施工及验收规范
  2. 关于最小采样量问题的探讨——国标【洁净室施工及验收规范】编制组研讨系列课题之一暖通空调 HV &A C 2007 年第 37 卷第 10 期
  3. 空气洁净度测试中的若干问题

4. ISO 14644-1 2015

5. ISO 14644-3 1999

最后给大家一个泊松分布的题目,请大家自行计算

已知一家银行,从长期的统计结果来看,每小时会有10名顾客进入银行办理业务,请问银行在早上开门后的9:00-10:00这一小时期间,有15人来办理业务的概率是多少?

答案在下面

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

0.034718

关注本人专栏和讲座,细节问题去值乎

本人还刚刚注册一个一个微信公众号----建筑暖通小识

如果有新的文章发表,会和知乎同步的。欢迎关注哦!!!