电子鼻技术在区分酸羊奶发酵菌种中的应用

杨春杰,丁 武*,马利杰

(西北农林科技大学食品科学与工程学院,陕西 杨凌 712100)

 

摘 要:利用电子鼻技术快速区分酸羊奶的发酵菌种。通过电子鼻采集不同酸羊奶挥发成分的响应值,然后利用主成分分析(principal component analysis,PCA)、Fisher线性判别分析(fisher linear discriminant analysis,FLDA)以及BP神经网络(back propagation neural network,BP-NN)分析进行判别,建立基于电子鼻技术区分酸羊奶发酵菌种的方法。结果表明,FLDA及PCA都能够区分出不同菌种发酵的酸羊奶,FLDA区分效果优于PCA。利用FLDA和BP-NN分析预测酸羊奶发酵菌种类别的正确率分别为100.0%和98.4%。因此,利用电子鼻快速区分酸羊奶的发酵菌种是可行的。

关键词:电子鼻;酸羊奶;乳酸菌;多元分析

 

Discrimination of Lactic Acid Bacteria in Goat Yogurt Using Electronic Nose

 

YANG Chun-jie, DING Wu*, MA Li-jie

(College of Food Science and Engineering, Northwest A & F University, Yangling 712100, China)

 

Abstract: This study attempted to use an electronic nose (PEN3) to discriminate the strains of lactic acid bacteria in goat yogurt samples. The volatile components emanating from goat yogurt samples were gathered by the electronic nose. Based on the data obtained, a method for discriminating the strains of lactic acid bacteria in goat yogurt was established through principal component analysis (PCA), Fisher linear discriminant analysis (FLDA) and BP neural network. The results showed that although both PCA and FLDA could discriminate different species of lactic acid bacteria, FLDA was more effective than PCA. The correct prediction rates of FLDA and BP neural network were 100.0% and 98.4%, respectively. These results will be helpful for the application of electronic nose to discriminate the strains of lactic acid bacteria in goat yogurt samples.

Key words: electronic nose; goat yogurt; lactic acid bacteria; multivariate analysis

中图分类号:TS252.7 文献标志码:B 文章编号:1002-6630(2014)18-0267-05

doi:10.7506/spkx1002-6630-201418051

酸奶是原料奶经乳酸菌发酵制成的一类酸性奶制品[1]。酸奶发酵菌主要是嗜热链球菌和保加利亚乳杆菌等以乙醛为主要风味物质的醛香型乳酸菌[2]。随着对乳酸菌特性与功能研究的深入,新型益生菌(如双歧杆菌、鼠李糖杆菌等)以及产丁二酮的风味乳酸菌被广泛应用为发酵菌,更加满足了消费者对营养价值和风味的需求。目前,验证酸奶中发酵菌种类的方法从最基础的利用培养基和指示剂、生化试剂等方法发展到应用不依赖纯培养的分子生物学方法[3]。这些分析技术比较成熟,准确度较高,但同时也具有分离鉴定成本较高,操作复杂等缺点。

电子鼻技术是一种操作简单、快速、准确的无损分析技术,它利用气体传感器阵列的响应曲线识别样品挥发成分的整体信息并应用统计学方法进行定性定量分析[4]。目前,电子鼻技术在乳品工业中的应用主要集中在乳制品的产地鉴别[5]、货架期及成熟期判定[6-11]、掺假分辨[12-13]以及有害微生物检测[14]等方面,电子鼻在乳品工业中应用的深度和广度不断扩大[15-16]。一些病原微生物作用于乳制品会产生某些风味物质,因此一些研究已表明电子鼻在检测乳制品中有害微生物,如金黄色葡萄球菌、假单胞腐败菌等的可行性[17-18]。本研究以6 种不同菌种发酵的酸羊奶为研究对象,用电子鼻检测不同酸羊奶的挥发成分,进而利用Fisher线性判别分析(fisher linear discriminant analysis,FLDA)、BP神经网络(back propagation neural network,BP-NN)等分析实现酸羊奶发酵菌种的快速判别,为酸奶发酵菌种的快速区分提供新方法。

1 材料与方法

1.1 材料与试剂

蔗糖(食品级) 市售;羊奶 西北农林科技大学西农萨能奶山羊原种场畜牧基地;保加利亚乳杆菌、嗜热链球菌、双歧杆菌、鼠李糖杆菌、丁二酮乳酸菌 国家乳业工程技术研究中心菌种保藏中心。

1.2 仪器与设备

PEN3电子鼻(含有10 个金属氧化物传感器阵列,各个传感器的名称及性能描述见表1) 德国Airsense公司;PHS-3C pH计 上海日岛科学仪器有限公司;XHF-DY均质机 宁波新芝生物科技有限公司;LMQ.J
灭菌锅 山东新华医疗器械有限公司;ZYJ-LT1无菌操作台 西安富康空气净化设备工程有限公司。

表 1 PEN3电子鼻传感器名称及性能描述

Table 1 Description of the sensors and their performance used in
the electronic nose (PEN3)

阵列序号

传感器名称

性能描述

参照物质

参照物质含量/μL/L

S1

W1C

主要检测芳香族化合物

甲苯

10

S2

W5S

响应物质范围广且灵敏度高,主要检测氮氧化合物

NO2

1

S3

W3C

主要检测氨气以及芳香族化合物

10

S4

W6S

主要检测氢气

H2

100

S5

W5C

主要检测烷烃类化合物、芳香族化合物以及弱极性化合物

丙烷

1

S6

W1S

响应物质范围广,与传感器S8相似;对环境中的甲烷敏感

CH3

100

S7

W1W

对无机硫化物、很多含硫有机物以及萜烯类、吡嗪类化合物敏感

H2S

1

S8

W2S

响应物质范围广,主要检测乙醇以及部分芳香族化合物

CO

100

S9

W2W

主要检测芳香族化合物以及含硫有机化合物

H2S

1

S10

W3S

主要用于较高质量浓度物质(>100 μL/L

检测,对甲烷选择性较强

CH3

100

 

 

1.3 方法

1.3.1 酸羊奶样品制备

将原羊奶过滤后添加质量分数8%蔗糖,混匀均质,巴氏杀菌(65 ℃、30 min)。冷却至发酵温度后分别接种体积分数2%活化好的嗜热链球菌、保加利亚乳杆菌、嗜热链球菌-保加利亚乳杆菌混合发酵菌(11,V/V)、
鼠李糖杆菌、双歧杆菌、丁二酮乳酸菌共6 种发酵菌。接种后的奶样在适宜温度(表2)培养至pH 4.60,冷却奶样,于4 ℃贮藏24 h。

表 2 每组奶样发酵温度

Table 2 Fermentation temperature for each goat yogurt sample

编号

发酵菌种

发酵温度/℃

1

嗜热链球菌

42

2

保加利亚乳杆菌

42

3

混合发酵菌

42

4

双歧杆菌

42

5

鼠李糖杆菌

37

6

丁二酮乳酸菌

37

 

 

1.3.2 电子鼻检测

将制备好的奶样取10 mL移入50 mL洁净玻璃瓶中,每组奶样分装40 瓶,密封置于4 ℃冰箱并尽快分析。电子鼻检测时,将每个密封样品依次置于25 ℃环境平衡30 min后顶空进样测量。

电子鼻实验参数设置:样品准备时间5 s;检测时间60 s;测量计数1 s;自动调零时间10 s;清洗时间240 s;内部流量400 mL/min;进样流量400 mL/min。

1.4 数据分析

采用基于最小协方差(minimum covariance determinant,MCD)估计的稳健马氏距离异常值检测方法[19]剔除异常值后,分别对数据进行主成分分析(principal component analysis,PCA)、FLDA及BP-NN分析。PCA、FLDA及BP-NN分析采用SPSS20处理;异常值检测,训练集及验证集划分采用Matlab R2010a处理。

2 结果与分析

2.1 样品传感器信号分析

760363.jpg 

图 1 电子鼻对原奶样挥发成分的响应图

Fig.1 Response graph of sensors to volatile compositions of raw goats milk

对7 组羊奶的样品进行电子鼻检测,最终获得电子鼻对各样品的响应图。以原奶样品为例(图1),图中每条曲线代表一个传感器对该样品挥发成分的响应强度随时间变化而变化的情况,响应强度的高低也反映了传感器对所测挥发成分的灵敏度大小。进样后,电子鼻10 个传感器的响应值逐渐增大,然后趋于平稳并在55 s后达到稳定状态,因此实验选取55~59 s内的平均响应值作为特征值分析。另外,不同传感器对奶样的响应不同,对照发现S1、S6、S7、S8 号传感器对奶样的响应较大。这几个传感器分别对甲烷、乙醇、芳香物、硫化物等敏感,而奶类主要风味物质是乙醛、双乙酰、挥发性脂肪酸、含硫有机物等,因此电子鼻能较好反映奶样的整体信息。

为了直观比较电子鼻对7 组奶样响应值的差异,将每组奶样的平均特征值用雷达图表示(图2)。由图2可以看出,不同组奶样的响应结果存在差异且S6、S7、S8、S9号传感器的响应值差异较大,所以可以根据电子鼻对不同组奶样的响应差异区分它们。

760763.jpg 

图 2 电子鼻对不同组奶样响应的雷达图

Fig.2 Radar plots of the responses on the sensors for different types of goats milks

2.2 异常值检测

实验共得到280 组数据,异常值会对结果产生很大的影响,甚至会出现错误的分析结果,因此异常值的诊断和处理非常必要。基于MCD估计的稳健马氏距离异常值检测方法采用迭代方式构造了一个稳健的协方差矩阵和稳健的均值向量,由此消除了多个异常值的掩盖作用[19],使得异常值能够被正确识别。对原奶组应用该方法检测异常值,如图3所示,1、2、29、31、33、38、39、40号共8 个样品异常值被检出,将这些异常值剔除。用同样方法分别对7 组奶样数据做MCD估计,剔除异常值后共得到224 组数据用于进一步分析。

760396.jpg 

图 3 原奶组MCD估计检测异常值

Fig.3 Outlier diagnosis plots obtained by MCD method for
raw goats milk samples

2.3 PCA

PCA是一种无监督分类方法,它是利用降维的思想,在损失较少信息的前提下把原来多个变量线性转化为几个新变量(主成分),选取较少数量的新变量就可以解释原有变量的大部分变异[20]。将前2 个或3 个主成分得分值做图,就得到主成分二维或三维散点图。PCA主要用于客观分析样品之间的差异。

在PCA二维图中(图4),PC1的方差贡献率为67.46%,PC2的方差贡献率为17.58%,合计为85.04%。原奶组和各类酸奶组区分明显;双歧杆菌组和丁二酮乳酸菌组、嗜热链球菌组和混合菌种组部分重叠;保加利亚乳杆菌组和鼠李糖杆菌组几乎完全重叠。在PCA三维图中(图5),PC1、PC2、PC3的方差贡献率合计为94.53%。嗜热链球菌组和混合菌种组部分重叠,其余组区分明显。PCA三维图和二维图比较,区分效果明显改善,这主要是由于3 个主成分反映了不同类别奶样的更多信息。另外,嗜热链球菌组和混合菌种组部分重叠可能是由于这2 组奶样的挥发性成分比较接近导致电子鼻对这些奶样响应值的真实差异较小,也可能是由于PCA前3 个主成分未能全部概括奶样的整体差异引起的。

760413.jpg 

图 4 各类奶样主成分析二维分图

Fig.4 PCA plot of goats milk samples with PC1 and PC2

760811.jpg 

图 5 各类奶样主成分分析三维图

Fig.5 PCA plot of goats milk samples with PC1, PC2 and PC3

2.4 FLDA

760793.jpg 

图 6 各类奶样线性分析二维图

Fig.6 LDA plot of goats milk samples with LD1 and LD2

FLDA是一种监督分类方法,侧重对样品在空间中的分布状态以及彼此之间的距离分析,将高维模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离,使得各类样品能够更好的区分,然后再根据样本到每个类中心点的距离远近判定将其归于哪一个类别[21-22]。

760474.jpg 

图 7 各类奶样线性分析三维图

Fig.7 LDA plot of goats milk samples with LD1, LD2 and LD3

在FLDA二维图中(图6),LD1方差贡献率为59.47%,LD2方差贡献率为33.04%,合计为92.51%。双歧杆菌组和丁二酮乳酸菌组、嗜热链球菌组和混合菌种组部分重叠,其余各组区分明显。在FLDA三维图中(图7),LD1、LD2、LD3的方差贡献率合计为96.18%。除嗜热链球菌组和混合菌种组部分重叠外,其余各组区分明显。

2.5 FLDA预测模型建立

2.5.1 训练集与验证集的划分

挑选具有代表性的样本建立模型,即训练集样本的代表性问题,是模型建立的核心问题。训练集样本选取方法可以大致分为两类:常规选择和计算机识别。常规选择在样本量较大时,费时费力,而且选出的样本集代表性不好,模型预测能力差。

DUPLEX方法是一种计算机识别方法[23],实现过程如下:第一步,选取两个彼此距离最远的样本点加入训练集中;第二步,从剩余的样本点中,选取2 个彼此距离最远的样本点加入验证集中。重复上述步骤,直至达到验证集所需的样本数,余下样本则全部归入训练集[24]。该方法的优点是能保证训练集中样本按照空间距离分布均匀。

使用该方法最终得到训练集(含160 个样品)和验证集(含64 个样品),具体见表3。

表 3 分组结果

Table 3 Groupings of goats milk samples

组别

训练集样本数

验证集样本数

原奶组

19

13

嗜热链球菌组

24

8

保加利亚乳杆菌组

26

6

混合菌种组

25

7

鼠李糖杆菌组

22

10

双歧杆菌组

23

9

丁二酮乳酸菌组

21

11

合计

160

64

 

 

2.5.2 模型建立与检验

在SPSS软件中,将训练集作为FLDA的变量输入,数字1、2、3、4、5、6、7分别代表原奶、嗜热链球菌奶样、保加利亚乳杆菌奶样、混合菌种奶样、鼠李糖杆菌奶样、双歧杆菌奶样、丁二酮乳酸菌奶样,并作为判别输出。提取得到6 个维度的判别函数,具体如下:

Y1=549.080 3x1+55.277 5x2-736.492 3x3-21.941 7x4+
194.324 6x5+2.464 8x6+2.282 0x7+6.543 5x8+81.966 3x9+
98.335 3x10

Y2=57.882 7x1+14.469 1x2-35.586 5x3+26.222 3x4-71.610 6x5-3.879 2x6+1.255 8x7-34.881 5x8+71.180 0x9+
22.213 6x10

Y3=-162.548 3x1+214.376 4x2+214.601 6x3-16.261 9x4+158.945 6x5+77.779 5x6-40.161 4x7-71.869 4x8-57.589 3x9-177.051 6x10

Y4=-203.726 7x1+97.688 0x2+218.400 7x3+49.268 4x4+115.447 0x5+25.694 1x6-63.213 8x7-17.533 4x8+14.287 3x9-70.213 2x10

Y5=-402.430 7x1+186.132 7x2+505.558 9x3-29.118 7x4+93.479 3x5+22.358 0x6-161.453 0x7-12.993 2x8+104.987 8x9-67.470 0x10

Y6=252.770 8x1-11.803 3x2-165.462 0x3+4.419 3x4-53.733 7x5+33.883 4x6-5.832 5x7-32.927 0x8+
29.497 5x9-7.589 4x10

上述6 个判别函数式计算的是建模样本在各个维度上的坐标值。用这6 个函数式计算出各样本的空间位置,然后计算各样品到每组奶样中心的距离,进而根据距离远近判别其所属类别。训练集中对不同奶样的回判正确率及交叉验证正确率为100.0%,验证集的预测正确率也达到100.0%,表明该模型的适用性好,见表4。

表 4 酸羊奶发酵菌种的FLDA

Table 4 Discrimination of goats milk samples by FLDA

样本

正确率/%

原奶组

嗜热链

球菌组

保加利亚

乳杆菌组

混合

菌种组

鼠李糖乳

杆菌组

双歧

杆菌组

丁二酮乳

酸菌组

平均

训练集

100.0

100.0

100.0

100.0

100.0

100.0

100.0

100.0

交叉验证

100.0

100.0

100.0

100.0

100.0

100.0

100.0

100.0

验证集

100.0

100.0

100.0

100.0

100.0

100.0

100.0

100.0

 

 

2.6 BP-NN分析

BP-NN是一种按误差逆传播算法训练的多层前馈型网络,输入信号由输入层输入并传递给隐含层,隐含层信息经函数变换处理后,传递给输出层,并将此输出与期望输出进行计算得出误差,若误差在不可接受范围内,则将误差反向传播给神经网络,重新计算各层的阈值和权值,直至得到可接受的结果才会结束训练。BP-NN的建模能力和非线性映射能力强,尤其适用于复杂模型的建立[25-26]。

利用2.5.1节得到的训练集构建3 层BP-NN模型。输入层结点数为10(10 个传感器的响应值),隐藏层结点数为9,输出层结点数为7(7 类奶样);隐藏层和输出层的激活函数分别为双曲正切和恒等函数,学习算法为共轭梯度下降法,学习率为0.001。

训练集中对不同奶样的回判正确率为100%,验证集的判断正确率为98.4%,将一个鼠李糖杆菌发酵奶样误判为保加利亚乳杆菌发酵奶样,见表5。

表 5 酸羊奶发酵菌种的BP-NN判别

Table 5 Discrimination of goats milk samples by BP neural network

样本

正确率/%

原奶组

嗜热链

球菌组

保加利亚

乳杆菌组

混合

菌种组

鼠李糖

乳杆菌组

双歧

杆菌组

丁二酮乳

酸菌组

平均

训练集

100.0

100.0

100.0

100.0

100.0

100.0

100.0

100.0

验证集

100.0

100.0

100.0

100.0

90.0

100.0

100.0

98.4

 

3 讨 论

3.1 异常值的检测及训练集的选取是影响模型性能的重要因素,采用MCD估计法消除了掩盖作用,进而正确识别并剔除了异常值;采用DUPLEX方法划分的训练集样本更具有代表性,因此提高了模型的泛化能力。

3.2 PCA和FLDA都能够大致区分原奶及不同菌种发酵酸羊奶,使用前3 个成分(三维图)概括了原样本更多的信息,所以区分效果比使用前2 个成分(二维图)要好。FLDA区分的效果好于PCA区分的效果,这是因为FLDA主要突出样本的判别(差异)特征,而PCA主要显示样本的描述特征。

3.3 分别建立FLDA和BP-NN判别酸羊奶发酵菌种模型。2种模型的预测正确率分别达100.0%和98.4%,从而验证电子鼻技术应用于酸奶发酵菌种快速区分的可行性。

3.4 建立判别模型时采用的样本比较单一,因此,模型应用于实际时还需要进行深入的研究。实际应用时建模的样本量应该远远大于本实验中的样本量,同时应注意对不同条件样本的选取或根据不同条件(如不同产地、不同厂商等)分别建立相应的判别模型,以降低模型的复杂度和预测风险。

参考文献:

[1] 刁治民, 于学军. 发酵乳的营养价值及保健作用[J]. 中国乳品工业, 1998, 26(5): 11-16.

[2] 华朝丽, 赵征. 瑞士乳杆菌、丁二酮乳链球菌混合培养制作酮香型酸奶的研究[J]. 中国乳品工业, 2004, 32(2): 17-20.

[3] 王友湘, 陈庆森, 阎亚丽. 用于乳酸菌分离鉴定的几种培养基的筛选及应用[J]. 食品科学, 2007, 28(9): 374-378.

[4] BALASUBRAMANIAN S, PANIGRAHI S, LOGUE C M, et al. Independent component analysis-processed electronic nose data for predicting Salmonella typhimurium populations in contaminated beef[J]. Food Control, 2008, 19(3): 236-246.

[5] PILLONEL L, AMPUERO S, TABACCHI R, et al. Analytical methods for the determination of the geographic origin of Emmental cheese: volatile compounds by GC/MS-FID and electronic nose[J]. European Food Research and Technology, 2003, 216(2): 179-183.

[6] 庞旭欣, 郑丽敏, 朱虹, 等. 电子鼻对不同存储时间纯牛奶的检测分析[J]. 传感器与微系统, 2012, 31(9): 67-70.

[7] 郭奇慧, 白雪, 胡新宇, 等. 应用电子鼻区分不同货架期的酸奶[J]. 食品研究与开发, 2008, 29(10): 109-110.

[8] LABRECHE S, BAZZO S, CADE S, et al. Shelf life determination by electronic nose: application to milk[J]. Sensors and Actuators B: Chemical, 2005, 106(1): 199-206.

[9] ORIORDAN P J, DELAHUNTY C M. Characterisation of commercial Cheddar cheese flavor 1: traditional and electronic nose approach to quality assessment and market classification[J]. International Dairy Journal, 2003, 13(5): 355-370.

[10] 伍慧方, 薛璐, 胡志和, 等. 借助电子鼻对中式传统奶酪货架期进行预测[J]. 食品与发酵工业, 2010, 36(2): 150-154.

[11] 张虹艳, 丁武. 电子鼻对不同温度下生鲜羊奶贮藏时间的判定[J]. 食品科学, 2011, 32(16): 257-260.

[12] 徐亚丹, 王俊, 赵国军, 等. 基于电子鼻的对掺假的伊利牛奶的检测[J]. 中国食品学报, 2006, 6(5): 111-118.

[13] 李照, 邢黎明, 云战友, 等. 电子鼻测定牛奶中掺入外来脂肪[J]. 乳业科学与技术, 2008(1): 39-41.

[14] ALI Z, OHARE W T, THEAKER B J. Detection of bacterial contaminated milk by means of a quartz crystal microbalance based electronic nose[J]. Journal of Thermal Analysis and Calorimetry, 2003, 71(1): 155-161.

[15] 刘志东, 郭本恒, 王荫愉, 等. 电子鼻在乳品工业中的应用[J]. 食品与发酵工业, 2007, 33(2): 102-107.

[16] 兰会会, 胡志和. 电子鼻技术在乳品生产与质量控制中的应用[J]. 食品科学, 2010, 31(17): 467-472.

[17] GARDNER J W, CRAVEN M, DOW C, et al. The prediction of bacteria type and culture growth phase by an electronic nose with a multi-layer perceptron network[J]. Measurement Science and Technology, 1998, 9(1): 120-127.

[18] KOREL F, BALABAN M O. Microbial and sensory assessment of milk with an electronic nose[J]. Food Microbiology and Safety, 2002, 67(2): 758-764.

[19] VERBOVEN S, HUBERT M. Libra: a Matlab library for robust analysis[J]. Chemometrics and Intelligent Laboratory Systems, 2005, 75(2): 127-136.

[20] PERIS M, ESCUDER-GILABERT L. A 21st century technique for food control: electronic noses[J]. Analytica Chimica Acta, 2009, 638(1): 1-15.

[21] 袁志发, 周静芋. 多元统计分析[M]. 北京: 科学出版社, 2002: 220-230.

[22] SNEER D. Validation of regression models: methods and examples[J]. Technometrics, 1977, 19(4): 415-428.

[23] HE Q P, WANG Jin, QIN S J. A new fault diagnosis method using fault directions in fisher discriminant analysis[J]. American Institute of Chemical Engineers, 2005, 51(2): 555-571.

[24] XU Lu, YAN Simin, CAI Chenbo, et al. Untargeted detection and quantitative analysis of poplar balata (PB) in Chinese propolis by FT-NIR spectroscopy and chemometrics[J]. Food Chemistry, 2013, 141(4): 4132-4137.

[25] GOH A T C. Back-propagation neural networks for modeling complex systems[J]. Artificial Intelligence in Engineering, 1995, 9(3): 143-151.

[26] 周政. BP神经网络的发展现状综述[J]. 山西电子技术, 2008(2): 90-92.

 

收稿日期:2013-11-27

基金项目:公益性行业(农业)科研专项(3-45)

作者简介:杨春杰(1985—),男,硕士研究生,研究方向为畜产品加工和食品安全。E-mail:18710423044@163.com

*通信作者:丁武(1971—),男,教授,博士,研究方向为畜产品加工和食品安全。E-mail:dingwu10142000@hotmail.com