2018.2.11 更新
修正更新了對於卜瓦松分布的說明詳細內容。補充內容主要是對潔凈度測試和高效檢測的最小取樣量和非零原則進行說明
2018.2.7 更新
對於本文,盡管標題叫做卜瓦松分布,其實主要還是介紹了兩個東西
1.潔凈度測試時候為什麽有一個最小空氣取樣流量,這個流量是怎麽來的?
2.高效過濾器的粒子計數器挑戰性檢漏測試,如何進行最終計量粒子量的修正
由於以上兩個問題較復雜,許多規範和資料的語焉不詳。
且實際制藥專案中一般采用光度計質素流量檢測法>=0.01%.
因此找到一本好的書籍來介紹並不容易。
這裏我給有學習研究意願的朋友們推薦本資料
ISO14644-3 1999 EN或者CN中有詳細的對於粒子檢測的分析 計算方法 以及案例,並且對測試各項內容進行了詳細的說明,特別是針對觀測值和實際值的差異--卜瓦松分布 對於觀測時間的說明--建議機器自動檢測等等,對理解此問題有很大幫助
比國內的那本GB50591-2010 潔凈室施工及驗收規範 中的關於粒子檢測的說明要詳細得多
卜瓦松分布在強大的知乎中,有許多資料提及過。但其實暖通中也有對於卜瓦松分布的套用。我先按下不表。我們先來看一看卜瓦松分布
1.卜瓦松分布
帕松是法國數學家,其在1838年釋出了這個結論,後來該概率分布就以他的名字命名
正如大家所知道的一樣,生活中許多例項符合正態分布,比如人的身高分布,收入分布, 人的智商分布,情商分布。如在我的上一篇文章中講述的
中的例子一樣,對於溫度 濕度 潔凈度的房間內部的測試,房間內部的各個點的數值或者計量也符合正態分布
但是大家也不要小看卜瓦松分布,在我們的生活中,同樣存在著大量的例項符合卜瓦松分布的特點。比如
某醫院婦產科的在一段時間裏面的接生數量的概率分布
某超市的樂事薯片的在一段時間裏面的銷售情況的概率分布
飛機在一段時間裏面失事的概率分布等等
2.概率中的卜瓦松分布密度函數和帕松過程
工科概率論課本中解釋較簡單,主要是針對工科套用層面的解說。
卜瓦松分布是離散型概率中的一種
作者註:常用離散型概率有0-1分布,二項分布,卜瓦松分布,幾何分布等
概率論中的卜瓦松分布是從二項分布演化而來的
二項分布:假定我有100個不同的硬幣,每個硬幣分別投擲,問其中有1個硬幣出現正面,另外99個硬幣出現反面的概率就是一個典型的二項概率,其概率的密度分布為
P(X=K)=C( \frac{k}{100})*p^{k}*(1-p)^{100-k}
P為概率,本例中為0.5,K為正面向上的次數,本例中為1次, 且因為這一次可以出現在100個硬幣中的任何一個,因此C(1,100)
因此計算公式如下
P(x=1)=c(1,100)*(0.5^1)*(0.5^99)=7.89*10^(-29),這是一個非常小的概率
當我們將硬幣的數量從100個增加到1000個 10000個 十萬個 一百萬個之後,也即參與的樣本越大,則二項分布就逼近了卜瓦松分布。
卜瓦松分布的密度函數是
P(X=k)=\frac{e^{-\lambda}*\lambda^{k}}{k!} ,這裏K對應著發生1次2次3次....n次的次數, P則對應著發生相應次數下的概率。
書中的解釋是說,當某一個事件發生的概率特別小,也就是p非常小,而樣本空間的數量特別大,也就是n特別大的時候,n*p= \lambda 。一般n>=20,p<=0.05就很符合帕松概率了
估計很多人不明白 \lambda 到底是什麽,這是教材編的不好的原因
其實我說白話大家就明白了,這裏的 \lambda 就是長期觀察的一段時間或者一段空間容量下的發生事件的次數,其實就是期望E=n*p
比如
長期觀察下來,某婦產科在一年當中基本上接生100個嬰兒,那麽 \lambda 就是100/年*1年
長期觀察下來,樂事薯片在一個星期裏面可以賣10包,那麽 \lambda 就是10/星期*1星期
長期觀察下來,世界上飛機在一年內失事的次數是1次,那麽 \lambda 就是1/年*1年
只不過,在這種情況下,卜瓦松分布的公式要覆寫成帕松過程的公式,如下
P(X=k)=\frac{e^{-\lambda*t}*(\lambda*t)^{k}}{k!} 或者 P(X=k)=\frac{e^{-\lambda*V}*(\lambda*V)^{k}}{k!}
以上分別指單位時間或者單位空間單位體積流量中的卜瓦松分布公式
我舉個實用的例子,比如一個小超市長期觀察下來,發現其薯片的銷售是每周能夠賣10包,請問現在到了月初需要備貨了,問這個超市考慮可能的銷量,一周內應該怎麽儲備薯片才合理呢
現在我們已知 \lambda =10/周,則帕松過程公式為
P(X=k)=\frac{e^{-10*t}*(10*t)^{k}}{k!}
我們考慮一周內其可能賣出的數量和對應的概率,則t=1[如果考慮兩周的備貨量,則t=2]
公式為
P(X=k)=\frac{e^{-10}*(10)^{k}}{k!}
K=0,也就是一周內一個都沒有賣出去,P(K=0)= e^{-10} =4.54*10^(-5)
K=1,也就是一周內只賣出一個, P(K=1)= e^{-10} *10=4.54*10^(-4)
K=2,也就是一周只賣出兩個,P(K=2)= e^{-10}*10^2/2! =2.27*10^(-3)
......
整理成表格如下,我使用EXCEL自動計算了結果
結果可以看到,如果在一周內備貨15個,其已經滿足了95%的可能性了,這也就是說在一周內,95%的可能性是銷售掉0-15個之間的數量,因此備貨15個則基本不會出現備貨不足的情況。而備貨18個,其累計概率已經是99%了
從上面這個例子,我們看到了卜瓦松分布的實際套用。
筆者註:簡而言之,卜瓦松分布就是考慮一個事件重復進行測試,獲得了單位時間的平均次數[期望]的情況下.考慮在下一個單位時間裏面發生0次,1次,2次.... 的各自概率
那麽有人問了,你羅嗦了這麽多,和暖通有什麽關系!
3. 暖通中的卜瓦松分布
3.1潔凈度檢測的最小取樣量:非零準則-根據卜瓦松分布概率計算
筆者註:這裏指的是單點潔凈度測試中的取樣量,而不是一個房間中的各個點的潔凈度分布。即不是正態分布或者t分布分析。下面的原話是每一測點
在規範GB50591-2010 潔凈室施工及驗收規範中,有這樣一句話--註意看數碼3
有人知道這個公式中的3是怎麽來得嗎?
在潔凈室內部,單位容量--每立方米或者每升下的粒子濃度是非常低的,因此單位容量下的粒子分布可以按照卜瓦松分布來描述,
我們以一個ISO7萬級的潔凈室為例,已知其5um粒子濃度應該在千級到萬級之間的一個數值,也即平均期望為293粒-2930粒/立方米=0.293粒-2.93粒/升, 即單位容量下,比如一升裏面的粒子數量,其期望是一定的,下限為0.293粒 這顯然符合卜瓦松分布,其每次檢測V升中,能夠發現粒子數量K粒的概率分布運算式為
P(X=k)=\frac{e^{-0.293*V}*(0.293*V)^{k}}{k!} (k=0,1,2....)
我們希望出現粒子計數器檢測不到,也即X=0的概率小於5%,也即檢測到至少一粒的概率至少為95%的計算公式如下:
筆者註:此為卜瓦松分布的非零準則
P(X=0)=\frac{e^{-0.293*V}*(2.93*V)^{0}}{0!}<=0.05 ,推出 e^{0.293V}>=20
化簡得到
V>=\frac{3}{0.293} 升=10.2升
右側算式中的分子就是GB規範中出現的結果3. 本質是ln20的結果
而計算結果就是10.2升---大家看上面GB圖表中也會發現,針對ISO7級5um的粒子其最小采樣量就是我的計算結果10.2
同理,我們可以獲得不同粒徑,不同等級下的各種最小采樣量,這裏我就不計算了,方法都是一樣的。具體參見上面的GB表格
3.2高效過濾器檢漏中的95%置信--卜瓦松分布置信問題
如果有人從事潔凈室高效過濾器的安裝檢漏工作,也許就明白我在說什麽。
高效過濾器的挑戰性實驗也是典型的卜瓦松分布套用。
下面以高效過濾器為例講述
在高效過濾器生產完畢以後,以及在高效過濾器安裝在現場之後,我們按照規範
GB50591-2010 潔凈室施工及驗收規範
GBT 25915.3-2010 潔凈室及相關受控環境 ISO4644-3
等相關規範進行現場的高效過濾器的挑戰性實驗--粒子計數器法檢漏
上圖就是一個典型的高效過濾的現場檢漏和示意圖
本文不是專門講述高效過濾器特性的文章,因此不詳細介紹高效過濾器的內容,這裏只簡單說一下高效過濾器的分類,見下表
上圖中我們發現美國標準A級相當於歐標的p3, 而C級相當於歐標的p4
C級別以上的檢測就是我們常用的DOP測試方法,其總效率為99.99%.且局部效率要求也是99.99%.其用光度計測量質素中徑在0.4-0.5um的多分散相粒子的質素濃度前後百分比
而歐標中對於p4的高效過濾器,采用了總效率為99.995%,而局部效率為99.975%的MPPS最易穿透粒徑的方法測量,其測量粒子數量的前後百分比
作者註: 本質上,MPPS的最易穿透粒徑在0.2-0.3um之間,而DOP采用的熱發塵的質素中徑在0.45um左右,幾何粒徑也基本在0.3um左右,因此實際上兩者基本相同。
同理我們在,卜瓦松分布這個概率對於我們進行高效過濾器檢漏有什麽知道意義呢?
記得上一篇文章我說到了樣本數據求平均值的置信區間計算方法應該采用t分布表計算的問題
在高效過濾器的檢測中,我們同樣需要使用置信區間來考量, 這裏的考量就不能采用95%置信區間的t分布表了。
我們需要采用卜瓦松分布的小樣本或者大樣本的95%置信區間的表格修正檢測結果。如下圖
比如理論計算下遊的粒子接收器1分鐘能夠接收到5個,實際掃描中只能觀測到3個,請問驗收合格嗎?
答案是否定的,因為按照卜瓦松分布的95%的置信上限表,當計算結果為5.6的時候,觀測結果不應該超過1個,如果超過則說明有泄漏風險。
這時需要靠近可能的漏點做靜止測試,采樣時間長一些,計算理論的上限值,和實際測量值比較.這時的采樣需要使用大樣本的近似正態分布的置信計算了,就不展開了。
理論上測量時間越長,接收數量越多,則95%置信偏差越小。比如理論上計算1min應該接收10000個粒子,根據置信計算,應該觀測到9800,兩者已經很接近了、這是因為隨著接收數量的上升,卜瓦松分布逐漸逼近正態分布。
具體可以參見ISO14644-3中的檢測方法
3.3後記
目前中國的實際專案操作有兩種方法進行高效過濾器的檢漏,分別是
光度計檢漏--常用檢測方法,為FDA和EMEA認可
粒子計數器檢漏--不常用
本文說的是後一種,從實際效果來看,並不太理想。主要原因是多方面的,包括上遊的發塵情況無法獲得,房間本底潔凈度,檢驗人員的素質,接收的器材的質素,分析總結能力等等。
因此實際的制藥行業專案操作中,以上遊發塵,計算質素總量,下遊使用光度計檢漏計算下遊質素總量,比較百分比,超過0.01%即為漏的原則來檢測
參考文獻
- GB50591-2010 潔凈室施工及驗收規範
- 關於最小采樣量問題的探討——國標【潔凈室施工及驗收規範】編制組研討系列課題之一暖通空調 HV &A C 2007 年第 37 卷第 10 期
- 空氣潔凈度測試中的若幹問題
4. ISO 14644-1 2015
5. ISO 14644-3 1999
最後給大家一個卜瓦松分布的題目,請大家自行計算
已知一家銀行,從長期的統計結果來看,每小時會有10名顧客進入銀行辦理業務,請問銀行在早上開門後的9:00-10:00這一小時期間,有15人來辦理業務的概率是多少?
答案在下面
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
0.034718
關註本人專欄和講座,細節問題去值乎
本人還剛剛註冊一個一個微信公眾號----建築暖通小識
如果有新的文章發表,會和知乎同步的。歡迎關註哦!!!