利用 AOTF 近紅外光譜儀檢測中藥中微生物的方法

利用 AOTF 近紅外光譜儀檢測中藥中微生物的方法

 

摘?? 要??? 本文采用 AOTF 近紅外光譜技術以漫反射方式對新癀片中的微生物即細菌和霉菌進 行光譜掃描,分別建立了偏最小二乘法(PLS1)回歸模型和主成分分析模型。通過偏最小二 乘法(PLS1),建立了菌體數量的回歸模型,并探討了菌體數量梯度對模型預測結果的影響, 最終確定了以多模型分步快速菌檢法的預測方法。通過主成分分析模型,結果顯示 AOTF 技 術建立的數學模型不僅能夠分辨出樣品中的菌體數量是否合格,還能夠對菌體是否具有活性 進行定性。實驗結果表明,AOTF-NIR Luminar 5030 光譜儀利用使用光譜數據和校準模型, 能夠快速準確地對新癀片中的菌體進行定量分析和定性分析。

主題詞?? 聲光可調濾光器;近紅外光譜;微生物;偏最小二乘法(PLS1)

在中藥制藥行業,對細菌等微生物的的檢測按照國家藥典的規定是必須進行的一項檢測 項目,常規的檢測方法是利用培養基培養計數的方式來進行檢測[1],該方法操作復雜、費時 費力,至少需要 48 小時才能得到最終的檢測結果,不能夠保持一個流暢的生產過程。如何 尋找一種快速的檢測方式,能夠迅速得到檢驗結果,對中藥制藥行業的生產具有重大的意義。 近幾年在中國興起的近紅外檢測技術,作為一門獨立的分析檢測技術具有不需要樣品的預處 理,檢測速度快(秒級速度),不消耗試劑、綠色環保分析等特點,符合菌檢快速檢測的要 求,但是,能否利用近紅外技術對細菌等微生物進行檢測,檢測結果的準確度如何?以往從 未見此方面的論文或報道。鑒于此,我們利用美國 Brimrose 公司的 Luminar 5030 型便攜式 AOTF 技術近紅外光譜儀對廈門中藥廠有限公司提供的 20 個樣品進行光譜采集,建立模型并 預測,以考察 AOTF-NIR 技術能否在菌檢項目中成功應用。聲光可調濾光器(Acousto-optic tunable filter,簡稱 AOTF)是基于各向異性的雙折射晶體的聲光衍射原理,利用超聲波 與特定的晶體作用而產生分光的光電器件[2,3,4]。與傳統的基于機械調諧分光元件的光譜儀器 相比,以 AOTF 作為分光元件的光譜儀具有明顯的優越性:它結構簡單,光學系統無移動性 部件,體積小,集光能力強,最吸引人之處在于它的掃描速度快、信噪比高[5]。

1. 實驗部分

1.1 ?儀器條件和樣品處理

儀器:美國 BRIMROSE 公司產的 Luminar 5030 型便攜式 AOTF 技術近紅外光譜儀,主要 部件包括:光學部分、控制部分、電源適配器、筆記本電腦。儀器波長范圍為 1100nm 到 2300nm, 2nm 的波長增量,掃描次數為 300,采用 InGaAs 檢測器。挪威 CAMO 公司 The Unscrambler 分析軟件。

樣品:新癀片不規則顆粒狀樣品 20 個,編號為 1-20,其中 1 號和 2 號樣品中的微生物 已經殺死,為死菌體;3-20 號樣品中的微生物為活菌體。并提供每個樣品細菌數和霉菌數 的數據,單位為:個/克。見表 1 所示。

表 1: 樣品的編號及微生物個數值

新癀片批號 1 2 3 4 5 6 7 8 9 10
細菌數(個/g) 10 10 10 10 10 10 500 10 10 10
霉菌數(個/g) 50 10 1050 1400 1630 170 100 10 10 50
新癀片批號 11 12 13 14 15 16 17 18 19 20
細菌數(個/g) 300 1000 500 500 1000 1700 10 300 500 10
霉菌數(個/g) 30 10 100 3550 600 250 4500 200 50 100

 

1.2 實驗方法:?

本次實驗掃描新癀片樣品數量 20 個,樣品狀態為不規則的顆粒狀。使用美國 Brimrose 公司 Luminar 5030 型近紅外光譜儀采集樣品的光譜數據。將樣品放置于樣品盒的槽中,用 盒蓋將樣品刮平,連同盒蓋一起放置于支架上,光譜儀的探頭卡在樣品盒蓋的圓孔中,垂直 卡緊,采用漫反射的測樣方式采集光譜。每一張光譜都是 300 次掃描的平均結果。波長范圍 從 1100nm 到 2300nm,波長增量為 2nm。每個樣品均連續掃描 5 張光譜,共得到 100 張光譜。 將 100 個光譜數據經過一階微分處理(9 點平滑),導入 The Unscrambler 分析軟件,然后 利用 PCA 對光譜數據進行計算創建定性校正模型;將細菌數和霉菌數的數據與樣品一一對 應,采用 PLS1 方式進行計算建立定量校正模型。

1.3 光譜及預處理

?新癀片樣品的原始吸收光譜(見圖 5),從圖中可以看出,所有光譜排列整齊有序,沒 有異常的樣品光譜。新癀片樣品的一階微分光譜(見圖 6),同樣整齊有序,有比較明顯的 吸收峰,光譜排列更加緊密,光譜與光譜之間的相似性較強,采集到的光譜信息量大。

2.建立 PLS1 定量分析模型

2.1 模型的建立

表 1 為所提供樣品的編號及每個樣品所對應的細菌數和霉菌數的數據。在 The Unscrambler 軟件中,將每個樣品的光譜數據與細菌和霉菌個數的數據一一對應,如圖 3 所 示。

采用偏最小二乘法(PLS1),完全交互驗證(Full Cross Validation)的方式建立細 菌和霉菌的回歸定量分析模型。

2.2 結果分析

從圖 4 圖 5 的細菌和霉菌的回歸模型看:兩者都有很好的相關性,相關系數分別為 0.9791 和 0.9895。因此,我們可以初步判斷利用近紅外光譜可以得到微生物有效的信息。 因為建立模型所用的樣品數量比較少,無法進行未知樣品的驗證,因此,我們用所建 立的模型對所有掃描的光譜進行一個內部的驗證,所得到的結果與外部驗證相似,可以說明

相同的問題。表 2 是調用模型對細菌和霉菌的一個驗證結果:

表 2.模型對細菌和霉菌的預測結果

樣品編號 細菌預測值 細菌實際值 霉菌預測值 霉菌實際值
11 23 10 510 50
12 -42 10 33 50
13 105 10 66 50
14 17 10 205 50
15 44 10 373 50
21 -121 10 -192 10
22 8 10 59 10
23 32 10 -13 10
24 34 10 -85 10
25 -187 10 -82 10
31 38 10 1086 1050
32 214 10 1117 1050
33 13 10 1255 1050
34 -39 10 993 1050
35 52 10 1152 1050

 

41 41 10 1666 1400
42 -126 10 1593 1400
43 -61 10 1407 1400
44 -256 10 1409 1400
45 -9 10 1409 1400
51 59 10 1483 1630
52 32 10 1645 1630
53 45 10 1429 1630
54 -27 10 1652 1630
55 -17 10 1378 1630
61 13 10 84 170
62 -29 10 366 170
63 16 10 388 170
64 14 10 182 170
65 263 10 570 170
71 759 500 218 100
72 487 500 -709 100
73 704 500 -50 100
74 548 500 57 100
75 761 500 -311 100
81 211 10 114 10
樣品編號 細菌預測值 細菌實際值 霉菌預測值 霉菌實際值
82 38 10 -97 10
83 80 10 377 10
84 -44 10 394 10
85 18 10 78 10
91 3 10 648 10
92 -9 10 108 10
93 129 10 646 10
94 -216 10 479 10
95 28 10 -56 10
101 -9 10 527 50
102 80 10 340 50
103 1 10 102 50
104 5 10 -32 50
105 9 10 70 50
111 235 300 77 30
112 257 300 52 30
113 240 300 -136 30
114 299 300 59 30

 

 

115 286 300 129 30
121 986 1000 292 10
122 1147 1000 324 10
123 712 1000 -47 10
124 975 1000 86 10
125 1032 1000 239 10
131 450 500 527 100
132 245 500 9 100
133 414 500 250 100
134 459 500 171 100
135 530 500 74 100
141 502 500 2525 3550
142 502 500    
2776 3550
143 518 500    
2125 3550
144        
454 500 2626 3550
145 500 500    
2427 3550
151 960 1000    
721 600
152        
718 1000 690 600
153 1036 1000    
690 600
154 1001 1000    
586 600
樣品編號 細菌預測值 細菌實際值 霉菌預測值 霉菌實際值
155 1002 1000 615 600
161 1674 1700 -334 250
162 1729 1700 -163 250
163 1675 1700 -284 250
164 1720 1700 -226 250
165 1518 1700 -381 250
171 85 10 4231 4500
172 -9 10 4386 4500
173 -6 10 4424 4500
174 34 10 4499 4500
175 -36 10 4496 4500
181 284 300 211 200
182 283 300 7 200
183 292 300 201 200
184 280 300 170 200
185 183 300 -147 200
191 471 500 -157 50
192 653 500 -355 50
193 499 500 -70 50

 

194 496 500 -461 50
195 521 500 70 50
201 79 10 886 100
202 298 10 984 100
203 221 10 873 100
204 63 10 714 100
205 237 10 662 100

從表 2 可以看出:細菌數量大于 300 個的樣品和霉菌數量大于 600 個的樣品的模型預 測結果都接近于實際值,比較準確。但是對數量比較少的樣品預測的結果差別非常大。這是 因為兩個模型的數據梯度非常大,數據從幾個到幾千,在這么寬的數據范圍內,由于樣品量 有限,沒有很好的梯度間隔,而且,微生物個數少的樣品其信號反應也相對較弱,因此,很 難預測其準確的個數。

2.3 模型的改進

針對細菌而言,如果我們的最終結果只是要求將細菌的個數控制一個數量之下,

比如少于 7000 個為合格,那么以上模型雖然對細菌少的樣品預測不夠準確,但能夠達到控

制的要求。對于霉菌來說,國家標準要求是少于 100 個為合格,那么我們換一個思路,用霉

菌數量少于等于 100 個的樣品建立霉菌的模型,看能夠達到什么樣的預測效果。在掃描的 100 個光譜中,霉菌數量 100 個以下的樣品的光譜個數共為 55 個。利用這 55 個光譜數據和 對應的霉菌個數值,建立 100 個以下霉菌的模型,見圖 6。

從圖 6 可以看出,霉菌小范圍模型有更好的相關性,相關系數達到了 0.9913,利用這個

模型對建模用的 55 個光譜進行預測,得到表 3 的結果。

 

 

 

 

表 3.霉菌 100 以下小范圍模型預測結果與實際值的比較

 

樣品

編號

預測值 實際值 絕對

偏差

樣品

編號

預測值 實際值 絕對

偏差

11 50 50 0 104 53 50 -3
12 46 50 4 105 51 50 -1
13 54 50 -4 111 32 30 -2
14 48 50 2 112 27 30 3
15 51 50 -1 113 31 30 -1
21 12 10 -2 114 36 30 -6
22 11 10 -1 115 30 30 0
23 9 10 1 121 9 10 1
24 10 10 0 122 11 10 -1
25 7 10 3 123 11 10 -1
71 98 100 2 124 11 10 -1
72 100 100 0 125 7 10 3
73 101 100 -1 131 100 100 0
74 97 100 3 132 101 100 -1
75 100 100 0 133 96 100 4
81 11 10 -1 134 98 100 2
82 14 10 -4 135 97 100 3
樣品

編號

預測值 實際值 絕對

偏差

樣品

編號

預測值 實際值 絕對

偏差

83 9 10 1 191 51 50 -1
84 6 10 4 192 53 50 -3
85 12 10 -2 193 50 50 0
91 8 10 2 194 53 50 -3
92 8 10 2 195 51 50 -1
93 10 10 0 201 99 100 1
94 8 10 2 202 100 100 0
95 7 10 3 203 105 100 -5
101 53 50 -3 204 98 100 2
102 48 50 2 205 97 100 3
103 54 50 -4        

從表 3 可以看出:霉菌的 100 以下小范圍模型對 100 個以下的樣品預測的結果準確度非 常高,只有正負幾個的絕對偏差。小范圍模型預測霉菌數量少的樣品比較準確,那么預測霉 菌數量大于 100 個的樣品的結果會怎么樣?表 4 是霉菌數量大于 100 的樣品的預測結果。

表 4.小范圍模型預測霉菌數量大于 100 的樣品的結果

樣品編號 預測值 實際值 樣品編號 預測值 實際值
31 103 1050 141 90 3550
32 112 1050 142 97 3550
33 105 1050 143 102 3550
34 103 1050 144 90 3550
35 107 1050 145 94 3550
41 149 1400 151 89 600
42 151 1400 152 93 600
43 158 1400 153 90 600
44 149 1400 154 94 600
45 142 1400 155 93 600
51 92 1630 161 89 250
52 85 1630 162 89 250
53 91 1630 163 91 250
54 84 1630 164 84 250
55 90 1630 165 90 250
61 21 170 171 106 4500
62 15 170 172 91 4500
63 12 170 173 108 4500
64 17 170 174 103 4500
樣品編號 預測值 實際值 樣品編號 預測值 實際值
65 13 170 175 101 4500

從表 4 可以看出:霉菌數量小于 100 的樣品所建立的小范圍測試模型預測霉菌數量大 于 100 的樣品的結果與實際值相差很大,這是正常的,因為所測試的樣品范圍不在建模范圍 之內,預測的結果肯定是不準確的。我們可以嘗試用霉菌的數量小于 600 個的所有樣品再建 立一個模型。在掃描的 100 個光譜中,霉菌數量小于 600 個的樣品的光譜個數共為 75 個。 利用這 75 個光譜數據和對應的霉菌個數值,建立 600 個以下霉菌的模型,見圖 7。

從圖 7 可以看出,霉菌 600 個以下的模型也有很好的相關性,相關系數為 0.9823,利用

這個模型對建模用的 75 個光譜進行預測,得到表 5 的結果。

表 5.霉菌 600 個以下的模型預測霉菌數量小于 600 個的樣品的結果

 

樣品編號 預測值 實際值 樣品編號 預測值 實際值
11 69 50 114 32 30
12 50 50 115 56 30
13 44 50 121 -2 10
14 30 50 122 48 10
15 52 50 123 -76 10
21 18 10 124 18 10
22 -92 10 125 -3 10
23 30 10 131 111 100
24 7 10 132 38 100
25 -96 10 133 123 100
61 179 170 134 73 100
樣品編號 預測值 實際值 樣品編號 預測值 實際值
62 189 170 135 112 100
63 173 170 151 607 600
64 147 170 152 589 600
65 165 170 153 597 600
71 190 100 154 606 600
72 101 100 155 589 600
73 97 100 161 231 250
74 97 100 162 246 250
75 147 100 163 226 250
81 124 10 164 272 250
82 17 10 165 247 250
83 31 10 181 217 200
84 28 10 182 131 200
85 -7 10 183 180 200
91 31 10 184 201 200
92 16 10 185 190 200
93 13 10 191 43 50
94 -4 10 192 46 50
95 -23 10 193 36 50
101 50 50 194 38 50
102 101 50 195 -1 50
103 70 50 201 183 100
104 69 50 202 204 100

 

 

105 26 50 203 100 100  
111 15 30 204 95 100
112 58 30 205 108 100
113 10 30      

從表 5 可以看出:霉菌 600 個以下的模型對霉菌數量為 170、200、250、600 個的四個 樣品預測的結果準確度很高;對霉菌數量 100 個以下的樣品預測準確度降低,但每個樣品的 平均值仍然能夠接近于實際值。

 

2.4 綜合解決方案

綜合以上的分析,在如此大的數據梯度范圍內,我們沒有辦法只用一個模型就能夠測 量準確所有的樣品。但是,分析本次實驗我們可以發現建立三個模型就可以準確預測每一個 樣品的霉菌數量(細菌與此類似,不再作詳細分析),這三個模型是:所有樣品參與建立的 寬數據范圍的綜合模型,我們不妨稱其為 model-all;霉菌數量小于 600 個樣品建立的模型 稱為 model-1000;霉菌數量小于 100 個樣品建立的小范圍模型稱為 model-100。

分析表 2,霉菌個數在 1000 個以上的樣品預測的非常準確,個數在 1000 個以下的樣品 預測值沒有超過 1000 的,因此,通過 model-all 的預測,可以有效地將霉菌個數在 1000 個 以上的樣品進行準確檢測。

分析表 5,利用 model-1000 模型,可以準確預測霉菌數量 100 個以上的樣品。霉菌數 量 100 個以下的樣品預測不夠準確。

分析表 3,利用 model-100 模型,對霉菌數量在 100 個以下的樣品預測的準確度非常高。

根據以上分析總結,完全可以利用 AOTF-NIR 技術,實現快速菌檢的工作。步驟如下: 掃描未知樣品的光譜,首先用 model-all 模型進行預測,預測值大于 1000,那么,該樣品 的霉菌數量即為該數值;如果樣品的預測值小于 1000,用 model-1000 模型再對該樣品的光 譜進行預測,如果預測值在 200-1000 范圍之內,那么我們可以肯定該樣品的預測值為該樣

品的真實值,如果預測值在 100-200 范圍內,那么我們需要對該樣品重復掃描 5 次,用 model-1000 模型預測 5 次光譜的平均值,即為該樣品的真實值;如果用 model-1000 模型預 測該樣品光譜的預測值小于 100,那么,再調用 model-100 模型對該樣品進行準確的預測, 得到的結果就是該樣品的實際值。

3.分析菌體數量是否合格

3.1 定性模型的建立

多模型分步快速菌檢法非常適合 AOTF-NIR 技術在實驗室快速對藥品中的微生物進行檢 測,但是,該方法相對復雜,不能夠適應在線的快速微生物檢測,下面我們來探討一下用定 性分析的方法,能否解決在線菌檢的工作。

還是以霉菌為例。定性分析和定量分析是兩個不同的概念,定量分析可以檢測到一個 樣品中含有的霉菌的具體個數;定性分析是判斷是與否的問題,假設規定藥品中含有霉菌的 個數超過 100 個為不合格,少于 100 個為合格品,那么定性分析就是判斷所檢測的藥品是否 合格的問題。

在已有的 20 個樣品中,11 個樣品的霉菌個數不超過 100,9 個樣品的霉菌個數在 100 個以上。利用主成分分析(PCA)對 11 個樣品的一階微分光譜數據進行聚類,作為合格樣品 集;對 9 個樣品的一階微分光譜數據進行聚類,作為不合格樣品集。因為每個樣品我們掃描 了 5 張光譜,我們可以將每個樣品的第一張光譜分出來,作為驗證用,其余的 4 個光譜參與 建立定性分析的模型。這樣,合格樣品集有 11 張驗證光譜,不合格樣品集有 9 張驗證光譜。 44 張合格品光譜建立的定性模型為 yes,36 個不合格品樣品建立的定性模型為 no,見圖 8 和圖 9。


Related posts