利用 AOTF 近紅外光譜儀檢測中藥中微生物的方法
摘?? 要??? 本文采用 AOTF 近紅外光譜技術以漫反射方式對新癀片中的微生物即細菌和霉菌進 行光譜掃描,分別建立了偏最小二乘法(PLS1)回歸模型和主成分分析模型。通過偏最小二 乘法(PLS1),建立了菌體數量的回歸模型,并探討了菌體數量梯度對模型預測結果的影響, 最終確定了以多模型分步快速菌檢法的預測方法。通過主成分分析模型,結果顯示 AOTF 技 術建立的數學模型不僅能夠分辨出樣品中的菌體數量是否合格,還能夠對菌體是否具有活性 進行定性。實驗結果表明,AOTF-NIR Luminar 5030 光譜儀利用使用光譜數據和校準模型, 能夠快速準確地對新癀片中的菌體進行定量分析和定性分析。
主題詞?? 聲光可調濾光器;近紅外光譜;微生物;偏最小二乘法(PLS1)
在中藥制藥行業,對細菌等微生物的的檢測按照國家藥典的規定是必須進行的一項檢測 項目,常規的檢測方法是利用培養基培養計數的方式來進行檢測[1],該方法操作復雜、費時 費力,至少需要 48 小時才能得到最終的檢測結果,不能夠保持一個流暢的生產過程。如何 尋找一種快速的檢測方式,能夠迅速得到檢驗結果,對中藥制藥行業的生產具有重大的意義。 近幾年在中國興起的近紅外檢測技術,作為一門獨立的分析檢測技術具有不需要樣品的預處 理,檢測速度快(秒級速度),不消耗試劑、綠色環保分析等特點,符合菌檢快速檢測的要 求,但是,能否利用近紅外技術對細菌等微生物進行檢測,檢測結果的準確度如何?以往從 未見此方面的論文或報道。鑒于此,我們利用美國 Brimrose 公司的 Luminar 5030 型便攜式 AOTF 技術近紅外光譜儀對廈門中藥廠有限公司提供的 20 個樣品進行光譜采集,建立模型并 預測,以考察 AOTF-NIR 技術能否在菌檢項目中成功應用。聲光可調濾光器(Acousto-optic tunable filter,簡稱 AOTF)是基于各向異性的雙折射晶體的聲光衍射原理,利用超聲波 與特定的晶體作用而產生分光的光電器件[2,3,4]。與傳統的基于機械調諧分光元件的光譜儀器 相比,以 AOTF 作為分光元件的光譜儀具有明顯的優越性:它結構簡單,光學系統無移動性 部件,體積小,集光能力強,最吸引人之處在于它的掃描速度快、信噪比高[5]。
1. 實驗部分
1.1 ?儀器條件和樣品處理
儀器:美國 BRIMROSE 公司產的 Luminar 5030 型便攜式 AOTF 技術近紅外光譜儀,主要 部件包括:光學部分、控制部分、電源適配器、筆記本電腦。儀器波長范圍為 1100nm 到 2300nm, 2nm 的波長增量,掃描次數為 300,采用 InGaAs 檢測器。挪威 CAMO 公司 The Unscrambler 分析軟件。
樣品:新癀片不規則顆粒狀樣品 20 個,編號為 1-20,其中 1 號和 2 號樣品中的微生物 已經殺死,為死菌體;3-20 號樣品中的微生物為活菌體。并提供每個樣品細菌數和霉菌數 的數據,單位為:個/克。見表 1 所示。
表 1: 樣品的編號及微生物個數值
新癀片批號 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
細菌數(個/g) | 10 | 10 | 10 | 10 | 10 | 10 | 500 | 10 | 10 | 10 |
霉菌數(個/g) | 50 | 10 | 1050 | 1400 | 1630 | 170 | 100 | 10 | 10 | 50 |
新癀片批號 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
細菌數(個/g) | 300 | 1000 | 500 | 500 | 1000 | 1700 | 10 | 300 | 500 | 10 |
霉菌數(個/g) | 30 | 10 | 100 | 3550 | 600 | 250 | 4500 | 200 | 50 | 100 |
1.2 實驗方法:?
本次實驗掃描新癀片樣品數量 20 個,樣品狀態為不規則的顆粒狀。使用美國 Brimrose 公司 Luminar 5030 型近紅外光譜儀采集樣品的光譜數據。將樣品放置于樣品盒的槽中,用 盒蓋將樣品刮平,連同盒蓋一起放置于支架上,光譜儀的探頭卡在樣品盒蓋的圓孔中,垂直 卡緊,采用漫反射的測樣方式采集光譜。每一張光譜都是 300 次掃描的平均結果。波長范圍 從 1100nm 到 2300nm,波長增量為 2nm。每個樣品均連續掃描 5 張光譜,共得到 100 張光譜。 將 100 個光譜數據經過一階微分處理(9 點平滑),導入 The Unscrambler 分析軟件,然后 利用 PCA 對光譜數據進行計算創建定性校正模型;將細菌數和霉菌數的數據與樣品一一對 應,采用 PLS1 方式進行計算建立定量校正模型。
1.3 光譜及預處理
?新癀片樣品的原始吸收光譜(見圖 5),從圖中可以看出,所有光譜排列整齊有序,沒 有異常的樣品光譜。新癀片樣品的一階微分光譜(見圖 6),同樣整齊有序,有比較明顯的 吸收峰,光譜排列更加緊密,光譜與光譜之間的相似性較強,采集到的光譜信息量大。
2.建立 PLS1 定量分析模型
2.1 模型的建立
表 1 為所提供樣品的編號及每個樣品所對應的細菌數和霉菌數的數據。在 The Unscrambler 軟件中,將每個樣品的光譜數據與細菌和霉菌個數的數據一一對應,如圖 3 所 示。
采用偏最小二乘法(PLS1),完全交互驗證(Full Cross Validation)的方式建立細 菌和霉菌的回歸定量分析模型。
2.2 結果分析
從圖 4 圖 5 的細菌和霉菌的回歸模型看:兩者都有很好的相關性,相關系數分別為 0.9791 和 0.9895。因此,我們可以初步判斷利用近紅外光譜可以得到微生物有效的信息。 因為建立模型所用的樣品數量比較少,無法進行未知樣品的驗證,因此,我們用所建 立的模型對所有掃描的光譜進行一個內部的驗證,所得到的結果與外部驗證相似,可以說明
相同的問題。表 2 是調用模型對細菌和霉菌的一個驗證結果:
表 2.模型對細菌和霉菌的預測結果
樣品編號 | 細菌預測值 | 細菌實際值 | 霉菌預測值 | 霉菌實際值 |
11 | 23 | 10 | 510 | 50 |
12 | -42 | 10 | 33 | 50 |
13 | 105 | 10 | 66 | 50 |
14 | 17 | 10 | 205 | 50 |
15 | 44 | 10 | 373 | 50 |
21 | -121 | 10 | -192 | 10 |
22 | 8 | 10 | 59 | 10 |
23 | 32 | 10 | -13 | 10 |
24 | 34 | 10 | -85 | 10 |
25 | -187 | 10 | -82 | 10 |
31 | 38 | 10 | 1086 | 1050 |
32 | 214 | 10 | 1117 | 1050 |
33 | 13 | 10 | 1255 | 1050 |
34 | -39 | 10 | 993 | 1050 |
35 | 52 | 10 | 1152 | 1050 |
41 | 41 | 10 | 1666 | 1400 |
42 | -126 | 10 | 1593 | 1400 |
43 | -61 | 10 | 1407 | 1400 |
44 | -256 | 10 | 1409 | 1400 |
45 | -9 | 10 | 1409 | 1400 |
51 | 59 | 10 | 1483 | 1630 |
52 | 32 | 10 | 1645 | 1630 |
53 | 45 | 10 | 1429 | 1630 |
54 | -27 | 10 | 1652 | 1630 |
55 | -17 | 10 | 1378 | 1630 |
61 | 13 | 10 | 84 | 170 |
62 | -29 | 10 | 366 | 170 |
63 | 16 | 10 | 388 | 170 |
64 | 14 | 10 | 182 | 170 |
65 | 263 | 10 | 570 | 170 |
71 | 759 | 500 | 218 | 100 |
72 | 487 | 500 | -709 | 100 |
73 | 704 | 500 | -50 | 100 |
74 | 548 | 500 | 57 | 100 |
75 | 761 | 500 | -311 | 100 |
81 | 211 | 10 | 114 | 10 |
樣品編號 | 細菌預測值 | 細菌實際值 | 霉菌預測值 | 霉菌實際值 |
82 | 38 | 10 | -97 | 10 |
83 | 80 | 10 | 377 | 10 |
84 | -44 | 10 | 394 | 10 |
85 | 18 | 10 | 78 | 10 |
91 | 3 | 10 | 648 | 10 |
92 | -9 | 10 | 108 | 10 |
93 | 129 | 10 | 646 | 10 |
94 | -216 | 10 | 479 | 10 |
95 | 28 | 10 | -56 | 10 |
101 | -9 | 10 | 527 | 50 |
102 | 80 | 10 | 340 | 50 |
103 | 1 | 10 | 102 | 50 |
104 | 5 | 10 | -32 | 50 |
105 | 9 | 10 | 70 | 50 |
111 | 235 | 300 | 77 | 30 |
112 | 257 | 300 | 52 | 30 |
113 | 240 | 300 | -136 | 30 |
114 | 299 | 300 | 59 | 30 |
115 | 286 | 300 | 129 | 30 |
121 | 986 | 1000 | 292 | 10 |
122 | 1147 | 1000 | 324 | 10 |
123 | 712 | 1000 | -47 | 10 |
124 | 975 | 1000 | 86 | 10 |
125 | 1032 | 1000 | 239 | 10 |
131 | 450 | 500 | 527 | 100 |
132 | 245 | 500 | 9 | 100 |
133 | 414 | 500 | 250 | 100 |
134 | 459 | 500 | 171 | 100 |
135 | 530 | 500 | 74 | 100 |
141 | 502 | 500 | 2525 | 3550 |
142 | 502 | 500 | ||
2776 | 3550 | |||
143 | 518 | 500 | ||
2125 | 3550 | |||
144 | ||||
454 | 500 | 2626 | 3550 | |
145 | 500 | 500 | ||
2427 | 3550 | |||
151 | 960 | 1000 | ||
721 | 600 | |||
152 | ||||
718 | 1000 | 690 | 600 | |
153 | 1036 | 1000 | ||
690 | 600 | |||
154 | 1001 | 1000 | ||
586 | 600 | |||
樣品編號 | 細菌預測值 | 細菌實際值 | 霉菌預測值 | 霉菌實際值 |
155 | 1002 | 1000 | 615 | 600 |
161 | 1674 | 1700 | -334 | 250 |
162 | 1729 | 1700 | -163 | 250 |
163 | 1675 | 1700 | -284 | 250 |
164 | 1720 | 1700 | -226 | 250 |
165 | 1518 | 1700 | -381 | 250 |
171 | 85 | 10 | 4231 | 4500 |
172 | -9 | 10 | 4386 | 4500 |
173 | -6 | 10 | 4424 | 4500 |
174 | 34 | 10 | 4499 | 4500 |
175 | -36 | 10 | 4496 | 4500 |
181 | 284 | 300 | 211 | 200 |
182 | 283 | 300 | 7 | 200 |
183 | 292 | 300 | 201 | 200 |
184 | 280 | 300 | 170 | 200 |
185 | 183 | 300 | -147 | 200 |
191 | 471 | 500 | -157 | 50 |
192 | 653 | 500 | -355 | 50 |
193 | 499 | 500 | -70 | 50 |
194 | 496 | 500 | -461 | 50 |
195 | 521 | 500 | 70 | 50 |
201 | 79 | 10 | 886 | 100 |
202 | 298 | 10 | 984 | 100 |
203 | 221 | 10 | 873 | 100 |
204 | 63 | 10 | 714 | 100 |
205 | 237 | 10 | 662 | 100 |
從表 2 可以看出:細菌數量大于 300 個的樣品和霉菌數量大于 600 個的樣品的模型預 測結果都接近于實際值,比較準確。但是對數量比較少的樣品預測的結果差別非常大。這是 因為兩個模型的數據梯度非常大,數據從幾個到幾千,在這么寬的數據范圍內,由于樣品量 有限,沒有很好的梯度間隔,而且,微生物個數少的樣品其信號反應也相對較弱,因此,很 難預測其準確的個數。
2.3 模型的改進
針對細菌而言,如果我們的最終結果只是要求將細菌的個數控制一個數量之下,
比如少于 7000 個為合格,那么以上模型雖然對細菌少的樣品預測不夠準確,但能夠達到控
制的要求。對于霉菌來說,國家標準要求是少于 100 個為合格,那么我們換一個思路,用霉
菌數量少于等于 100 個的樣品建立霉菌的模型,看能夠達到什么樣的預測效果。在掃描的 100 個光譜中,霉菌數量 100 個以下的樣品的光譜個數共為 55 個。利用這 55 個光譜數據和 對應的霉菌個數值,建立 100 個以下霉菌的模型,見圖 6。
從圖 6 可以看出,霉菌小范圍模型有更好的相關性,相關系數達到了 0.9913,利用這個
模型對建模用的 55 個光譜進行預測,得到表 3 的結果。
表 3.霉菌 100 以下小范圍模型預測結果與實際值的比較
樣品
編號 |
預測值 | 實際值 | 絕對
偏差 |
樣品
編號 |
預測值 | 實際值 | 絕對
偏差 |
11 | 50 | 50 | 0 | 104 | 53 | 50 | -3 |
12 | 46 | 50 | 4 | 105 | 51 | 50 | -1 |
13 | 54 | 50 | -4 | 111 | 32 | 30 | -2 |
14 | 48 | 50 | 2 | 112 | 27 | 30 | 3 |
15 | 51 | 50 | -1 | 113 | 31 | 30 | -1 |
21 | 12 | 10 | -2 | 114 | 36 | 30 | -6 |
22 | 11 | 10 | -1 | 115 | 30 | 30 | 0 |
23 | 9 | 10 | 1 | 121 | 9 | 10 | 1 |
24 | 10 | 10 | 0 | 122 | 11 | 10 | -1 |
25 | 7 | 10 | 3 | 123 | 11 | 10 | -1 |
71 | 98 | 100 | 2 | 124 | 11 | 10 | -1 |
72 | 100 | 100 | 0 | 125 | 7 | 10 | 3 |
73 | 101 | 100 | -1 | 131 | 100 | 100 | 0 |
74 | 97 | 100 | 3 | 132 | 101 | 100 | -1 |
75 | 100 | 100 | 0 | 133 | 96 | 100 | 4 |
81 | 11 | 10 | -1 | 134 | 98 | 100 | 2 |
82 | 14 | 10 | -4 | 135 | 97 | 100 | 3 |
樣品
編號 |
預測值 | 實際值 | 絕對
偏差 |
樣品
編號 |
預測值 | 實際值 | 絕對
偏差 |
83 | 9 | 10 | 1 | 191 | 51 | 50 | -1 |
84 | 6 | 10 | 4 | 192 | 53 | 50 | -3 |
85 | 12 | 10 | -2 | 193 | 50 | 50 | 0 |
91 | 8 | 10 | 2 | 194 | 53 | 50 | -3 |
92 | 8 | 10 | 2 | 195 | 51 | 50 | -1 |
93 | 10 | 10 | 0 | 201 | 99 | 100 | 1 |
94 | 8 | 10 | 2 | 202 | 100 | 100 | 0 |
95 | 7 | 10 | 3 | 203 | 105 | 100 | -5 |
101 | 53 | 50 | -3 | 204 | 98 | 100 | 2 |
102 | 48 | 50 | 2 | 205 | 97 | 100 | 3 |
103 | 54 | 50 | -4 |
從表 3 可以看出:霉菌的 100 以下小范圍模型對 100 個以下的樣品預測的結果準確度非 常高,只有正負幾個的絕對偏差。小范圍模型預測霉菌數量少的樣品比較準確,那么預測霉 菌數量大于 100 個的樣品的結果會怎么樣?表 4 是霉菌數量大于 100 的樣品的預測結果。
表 4.小范圍模型預測霉菌數量大于 100 的樣品的結果
樣品編號 | 預測值 | 實際值 | 樣品編號 | 預測值 | 實際值 |
31 | 103 | 1050 | 141 | 90 | 3550 |
32 | 112 | 1050 | 142 | 97 | 3550 |
33 | 105 | 1050 | 143 | 102 | 3550 |
34 | 103 | 1050 | 144 | 90 | 3550 |
35 | 107 | 1050 | 145 | 94 | 3550 |
41 | 149 | 1400 | 151 | 89 | 600 |
42 | 151 | 1400 | 152 | 93 | 600 |
43 | 158 | 1400 | 153 | 90 | 600 |
44 | 149 | 1400 | 154 | 94 | 600 |
45 | 142 | 1400 | 155 | 93 | 600 |
51 | 92 | 1630 | 161 | 89 | 250 |
52 | 85 | 1630 | 162 | 89 | 250 |
53 | 91 | 1630 | 163 | 91 | 250 |
54 | 84 | 1630 | 164 | 84 | 250 |
55 | 90 | 1630 | 165 | 90 | 250 |
61 | 21 | 170 | 171 | 106 | 4500 |
62 | 15 | 170 | 172 | 91 | 4500 |
63 | 12 | 170 | 173 | 108 | 4500 |
64 | 17 | 170 | 174 | 103 | 4500 |
樣品編號 | 預測值 | 實際值 | 樣品編號 | 預測值 | 實際值 |
65 | 13 | 170 | 175 | 101 | 4500 |
從表 4 可以看出:霉菌數量小于 100 的樣品所建立的小范圍測試模型預測霉菌數量大 于 100 的樣品的結果與實際值相差很大,這是正常的,因為所測試的樣品范圍不在建模范圍 之內,預測的結果肯定是不準確的。我們可以嘗試用霉菌的數量小于 600 個的所有樣品再建 立一個模型。在掃描的 100 個光譜中,霉菌數量小于 600 個的樣品的光譜個數共為 75 個。 利用這 75 個光譜數據和對應的霉菌個數值,建立 600 個以下霉菌的模型,見圖 7。
從圖 7 可以看出,霉菌 600 個以下的模型也有很好的相關性,相關系數為 0.9823,利用
這個模型對建模用的 75 個光譜進行預測,得到表 5 的結果。
表 5.霉菌 600 個以下的模型預測霉菌數量小于 600 個的樣品的結果
樣品編號 | 預測值 | 實際值 | 樣品編號 | 預測值 | 實際值 |
11 | 69 | 50 | 114 | 32 | 30 |
12 | 50 | 50 | 115 | 56 | 30 |
13 | 44 | 50 | 121 | -2 | 10 |
14 | 30 | 50 | 122 | 48 | 10 |
15 | 52 | 50 | 123 | -76 | 10 |
21 | 18 | 10 | 124 | 18 | 10 |
22 | -92 | 10 | 125 | -3 | 10 |
23 | 30 | 10 | 131 | 111 | 100 |
24 | 7 | 10 | 132 | 38 | 100 |
25 | -96 | 10 | 133 | 123 | 100 |
61 | 179 | 170 | 134 | 73 | 100 |
樣品編號 | 預測值 | 實際值 | 樣品編號 | 預測值 | 實際值 |
62 | 189 | 170 | 135 | 112 | 100 |
63 | 173 | 170 | 151 | 607 | 600 |
64 | 147 | 170 | 152 | 589 | 600 |
65 | 165 | 170 | 153 | 597 | 600 |
71 | 190 | 100 | 154 | 606 | 600 |
72 | 101 | 100 | 155 | 589 | 600 |
73 | 97 | 100 | 161 | 231 | 250 |
74 | 97 | 100 | 162 | 246 | 250 |
75 | 147 | 100 | 163 | 226 | 250 |
81 | 124 | 10 | 164 | 272 | 250 |
82 | 17 | 10 | 165 | 247 | 250 |
83 | 31 | 10 | 181 | 217 | 200 |
84 | 28 | 10 | 182 | 131 | 200 |
85 | -7 | 10 | 183 | 180 | 200 |
91 | 31 | 10 | 184 | 201 | 200 |
92 | 16 | 10 | 185 | 190 | 200 |
93 | 13 | 10 | 191 | 43 | 50 |
94 | -4 | 10 | 192 | 46 | 50 |
95 | -23 | 10 | 193 | 36 | 50 |
101 | 50 | 50 | 194 | 38 | 50 |
102 | 101 | 50 | 195 | -1 | 50 |
103 | 70 | 50 | 201 | 183 | 100 |
104 | 69 | 50 | 202 | 204 | 100 |
105 | 26 | 50 | 203 | 100 | 100 | |
111 | 15 | 30 | 204 | 95 | 100 | |
112 | 58 | 30 | 205 | 108 | 100 | |
113 | 10 | 30 |
從表 5 可以看出:霉菌 600 個以下的模型對霉菌數量為 170、200、250、600 個的四個 樣品預測的結果準確度很高;對霉菌數量 100 個以下的樣品預測準確度降低,但每個樣品的 平均值仍然能夠接近于實際值。
2.4 綜合解決方案
綜合以上的分析,在如此大的數據梯度范圍內,我們沒有辦法只用一個模型就能夠測 量準確所有的樣品。但是,分析本次實驗我們可以發現建立三個模型就可以準確預測每一個 樣品的霉菌數量(細菌與此類似,不再作詳細分析),這三個模型是:所有樣品參與建立的 寬數據范圍的綜合模型,我們不妨稱其為 model-all;霉菌數量小于 600 個樣品建立的模型 稱為 model-1000;霉菌數量小于 100 個樣品建立的小范圍模型稱為 model-100。
分析表 2,霉菌個數在 1000 個以上的樣品預測的非常準確,個數在 1000 個以下的樣品 預測值沒有超過 1000 的,因此,通過 model-all 的預測,可以有效地將霉菌個數在 1000 個 以上的樣品進行準確檢測。
分析表 5,利用 model-1000 模型,可以準確預測霉菌數量 100 個以上的樣品。霉菌數 量 100 個以下的樣品預測不夠準確。
分析表 3,利用 model-100 模型,對霉菌數量在 100 個以下的樣品預測的準確度非常高。
根據以上分析總結,完全可以利用 AOTF-NIR 技術,實現快速菌檢的工作。步驟如下: 掃描未知樣品的光譜,首先用 model-all 模型進行預測,預測值大于 1000,那么,該樣品 的霉菌數量即為該數值;如果樣品的預測值小于 1000,用 model-1000 模型再對該樣品的光 譜進行預測,如果預測值在 200-1000 范圍之內,那么我們可以肯定該樣品的預測值為該樣
品的真實值,如果預測值在 100-200 范圍內,那么我們需要對該樣品重復掃描 5 次,用 model-1000 模型預測 5 次光譜的平均值,即為該樣品的真實值;如果用 model-1000 模型預 測該樣品光譜的預測值小于 100,那么,再調用 model-100 模型對該樣品進行準確的預測, 得到的結果就是該樣品的實際值。
3.分析菌體數量是否合格
3.1 定性模型的建立
多模型分步快速菌檢法非常適合 AOTF-NIR 技術在實驗室快速對藥品中的微生物進行檢 測,但是,該方法相對復雜,不能夠適應在線的快速微生物檢測,下面我們來探討一下用定 性分析的方法,能否解決在線菌檢的工作。
還是以霉菌為例。定性分析和定量分析是兩個不同的概念,定量分析可以檢測到一個 樣品中含有的霉菌的具體個數;定性分析是判斷是與否的問題,假設規定藥品中含有霉菌的 個數超過 100 個為不合格,少于 100 個為合格品,那么定性分析就是判斷所檢測的藥品是否 合格的問題。
在已有的 20 個樣品中,11 個樣品的霉菌個數不超過 100,9 個樣品的霉菌個數在 100 個以上。利用主成分分析(PCA)對 11 個樣品的一階微分光譜數據進行聚類,作為合格樣品 集;對 9 個樣品的一階微分光譜數據進行聚類,作為不合格樣品集。因為每個樣品我們掃描 了 5 張光譜,我們可以將每個樣品的第一張光譜分出來,作為驗證用,其余的 4 個光譜參與 建立定性分析的模型。這樣,合格樣品集有 11 張驗證光譜,不合格樣品集有 9 張驗證光譜。 44 張合格品光譜建立的定性模型為 yes,36 個不合格品樣品建立的定性模型為 no,見圖 8 和圖 9。