基于中波近红外光谱定量分析生鲜牛肉胆固醇

王 辉,田寒友,张顺亮,刘 飞,李文采,邹 昊,李家鹏,陈文华,乔晓玲*

(中国肉类食品综 合研究中心,肉类加工技术北京市重点实验室,北京食品科学研究院,北京 100068)

摘 要::胆固醇是人体必需的一种具有重要生理功能的动物源性甾醇类物质,摄入不均衡会引发严重的心脑血管疾病。利用近红外光谱技术,在中波波段建立一种对动物源性胆固醇含量进行快速无损定量分析的新方法并验证其可行性。采集市售生鲜牛肉原始光谱,结合马氏距离、学生残差及二审剔除判别法甄别并剔除疑似异常样本,经光谱预处理和模型优化后,建立最佳牛肉胆固醇偏最小二乘法定量分析模型。结果表明,基于近红外光谱中波波段所构建的胆固醇定量分析模型对独立检验集的预测效果较好(P>0.05),整体预测准确率满足国标要求(精密度≤10%)。

关键词:近红外光谱;中波波段;生鲜牛肉;胆固醇含量;定量分析

我国现行国家标准主要采用高效液相色谱法和气相色谱法检测肉及肉制品中的胆固醇含量,但其在效率、费用、人员及样本损耗方面上已无法满足对大批量产品进行在线实时快速无损检测的需求。近红外光谱技术是一种利用待测样本中不同含氢基团在不同波长范围内的吸收特征来分析其待测性质的检测分析技术,它因具有高效快捷、分析准确、操作简单、成本低廉、无需破坏样本等特点而被广泛应用于食品 [3-4]、制药 [5]、饲料 [6-7]、农业 [8]、石油 [9]、化工 [10]等领域的定性与定量分析中 [11-12]。肉与肉制品中胆固醇含氢基团的二、三倍频集中于1 100~1 820 nm波段 [13],可利用这一特点在近红外光谱中波波段建立预测胆固醇含量的定量分析模型。国内外已发表诸多关于近红外光谱检测分析肉与肉制品理化指标和感官指标的文献 [14-21],但鲜见关于采用近红外光谱对牛肉及其肉制品中的胆固醇含量进行检测和分析的报道。

本研究以生鲜牛肉为实验原料,采用便携式近红外光谱仪基于中波波段对胆固醇含量建立定量分析模型,探讨其作为动物源性胆固醇快速无损检测方法的技术和理论依据。

1 材料与方法

1.1 材料与试剂

原料为排酸24 h的生鲜牛上脑部位,分别购买于北京牛街、新发地及周边集贸市场。购置当天,按照垂直于肌肉纤维方向切成厚4~5 cm的块状,于4 ℃条件下备检。

1.2 仪器与设备

SupNIR-1520型便携式近红外光谱仪 聚光科技(杭州)股份有限公司;TRACE 1310型气相色谱仪美国Thermo Scientifi c公司。

1.3 方法

1.3.1 胆固醇含量检测

依据GB/T 9695.24—2008《肉与肉制品:胆固醇含量测定》对样本胆固醇含量进行检测。

1.3.2 光谱采集

采集光谱期间,样本温度控制在(4±1)℃,室温为20~25 ℃,湿度为50%~60%。采集光谱时,清除样本横截面的水并将其紧贴于检测探头上,避开含有明显肌间脂肪和筋膜的区域。参数设置:波长范围为1 000~1 799 nm,分辨率为10 nm,准确性为0.2 nm,重复性为±0.05 nm,噪声小于50 μA,采集间隔5 s,循环扫描10 次,样本光谱连续采集2 次,取平均值作为该样本的原始光谱。

1.3.3 剔除异常样本及划分样本集

采用光谱仪自带的RIMP软件对疑似异常样本进行分析,其原则为:马氏距离(Mahalanobis distance,MD)不小于0.3,学生化残差(studentized residual,SR)不小于2.5。剔除异常样本后,将样本集按照Kennard Stone法 [22]以3∶1∶1划分为校正集、验证集及检验集。

1.3.4 模型建立与评价

采用均值中心化(mean centering,MC)、标准化(autoscaling,AS)、SG一阶导数(Savitzky-Golay 1 stderivative,SG 1 stD)、差分求导(difference derivation,DD)、SG平滑(Savitzky-Golay smoothing,SGS)、标准正态变量变换(standard normalized variate,SNV)、多元散射校正(multiplicative scatter correction,MSC)、净分析信号(net signal analysis,NAS)、正交信号校正(orthogonal signal correction,OSC)、去趋势校正(de-trending,DT)及基线校正(baseline correction,BC)11 种算法分别对牛肉光谱进行预处理,并建立偏最小二乘(partial least squares,PLS)法模型。最优模型根据以下参数进行评估:校正集相关系数(R c)和检验集相关系数(R p)接近1、校正标准差(standard error of calibration,SEC)及预测标准差(standard error of prediction,SEP)趋向于0且差异不明显、范围误差比(ration of performance to standard derivation,RPD)不小于2.5、相对预测标准差(relative standard error of prediction,RSEP)不大于10% [23]、SEP/SEC小于1.2、主因子数(principal factor,PF)较小等 [24]

1.4 数据分析与模型预测

采用SPSS软件中的T-检验分析预测值(prediction value,PV)与参比值(reference value,RV)间的差异性。模型对未知样本的预测准确性以该样本的预测误差率(prediction error rate,PER)表示,按下式计算:

2 结果与分析

2.1 光谱分析

图1a为1 份牛肉样本在波长1 000~1 799 nm处分别扫描2 次所得光谱曲线,差异性较小,光谱重复性良好,谱型相似且基本重合。图1b为225 份牛肉样本的近红外光谱图,从其中可看出,牛肉样本集响应较好,在吸光度0.4~0.7间光谱较为集中,不同胆固醇含量样本的光谱波形相似但不完全重合,体现出群体样本之间的差异性和连续性。

图1 单一样品(a)与样本集(b)的中波近红外光谱图
Fig. 1 NIR spectra of single sample (a) and sample set (b) within medium wavelength range

2.2 异常样本的剔除

样本RV和光谱值(spectrum value,SV)异常会影响模型的容变性及预测准确度,需在建模前对疑似异常样本进行甄别和剔除。使用SR及MD来判断参试样本的RV和SV是否异常,根据1.3.3节剔除异常样本的原则,SR大于阈值,则认为RV异常;MD大于阈值,则认为SV异常,但对于异常样本的剔除须慎重处理。

图2 异常样本在MD(a)和SR(b)检验中的分布
Fig. 2 Distribution of outlier samples in MD (a) and SR (b)

由图2a、b可看出,校正集中有3 个SV异常样本和4 个RV异常样本,验证集中有2 个SV异常样本和3 个RV异常样本,其中校正集中3号样本和验证集中2号样本的MD和SR均超过了阈值,判断为异常样本,予以剔除。校正集中1号和2号样本及验证集中1号样本的MD异常,但SR正常;校正集中42、53、73号样本和验证集中11、17号样本的SR异常,但MD正常。对MD和SR其中一方出现异常的样本,为避免剔除非异常样本,需对其进行二审剔除判别 [25],每次将其中一个放回原属样品集并进行一次PLS运算,如果仍被判断为异常样本,则将其永远剔除,反之则保留。根据此方法将校正集中1、2、42号和73号及验证集中1、11号和17号样本剔除,保留校正集的53号样本。

2.3 样本参比值分析

图3 牛肉样本胆固醇含量RV分布图
Fig. 3 Distribution of cholesterol reference values of beef samples

通过剔除异常样本,获得建模样本集,如图3所示,其分布区间为45~70 mg/100 g,牛肉样本主要集中于50~65 mg/100 g区间。样本集的胆固醇含量分布区间为45.8~69.8 mg/100 g,含量差异为24 mg/100 g,根据1.3.3节中Kennard Stone法划分的校正集、验证集及检验集的RV均在样本集的范围内,见表1。

表1 胆固醇参比值统计
Table 1 Statistics of cholesterol reference values

样品集数量最大值/(mg/100 g)最小值/(mg/100 g)均值/(mg/100 g)标准偏差/(mg/100 g)样本集21669.845.857.75.5校正集13069.845.857.75.5验证集4369.849.857.75.3检验集4369.245.857.45.4

2.4 模型建立、优化与评价

表2 单一预处理方法的比较
Table 2 Comparison of models built using single preprocessing methods

?

采用11 种预处理方法处理参试样本光谱,以降低噪声、减少误差、提高待测信息的有效信息率。由表2可看出,经MC、DD、SGS、SNV、NAS、OSC、DT及BC预处理后所建模型的R c均大于0.85,而经AS、SG 1 stD、MSC处理的R c则均在0.75以下,由此可看出前者的容变范围较后者大,同时由RPD也可看出除1、5、8、9、10号外的其他模型分辨能力较弱。1~11号模型的R p均大于0.5,其中1、3、4、6、7、8号模型的R p略高于对照组,其他模型R p略低于对照组,二者的R p和SEP差异并不明显,各模型的预测能力一般。除2、3、7号外的其他模型的PF均在10~19之间,很大程度上会出现模型过度拟合的情况并导致模型的预测和分析效果不佳。虽然所有模型的RSEP均满足小于10%的要求,但整体上还是接近上限,模型预测准确性较差。从SEP/SEC来看,除3、7号外的其他模型SEP/SEC均高于1.2,导致模型的稳健性变差,其中8号和9号模型SEP/SEC达到3以上,说明该模型不适宜应用于牛肉胆固醇的定量分析。

通过对表2中各模型参数的分析,可以看出经单一预处理方法处理后所构建的模型并没有达到预期的效果,因此需采用不同组合预处理方法优化模型,如表3所示。通过对参数的分析,可看出优化后各模型R c虽略低于对照组,但总体仍在0.9以上,SEC较之单一预处理方法的SEC有所改善。各模型R p和SEP改善明显,分别达到0.7以上和4以下,均优于单一预处理方法和对照组,预测范围和准确性明显提升。从RPD的比较可看出,除3号模型外,其他模型的RPD均大于2.5,分辨能力得到增强。优化后的模型PF明显降低,只需少量主因子即可包容样本待测性质信息。

表3 预处理组合方法的比较
Table 3 Comparison of models built using preprocessing method combinations

?

综合1.3.4节中的模型评价标准和对表2、3的评价,可看出表3中1号模型的性能优于单一和其他组合预处理方法所构建的优化模型,其预处理方法为SG 1 stD+MSC,SEC=1.971、R c=0.937、SEP=3.708、R p=0.730、RPD=2.791、RSEP=6.43%、PF=5、SEP/SEC=1.882,上述数据表明该模型校正集R c呈极强的线性相关性且SEC相对较小(图4a),验证集R p和SEP得到明显改善(图4b),模型PF明显降低(图4c),模型预测准确率和分辨能力得到相应改善,但SEP/SEC则较单一预处理方法时有所上升,这可能是由于2种预处理方法对光谱进行处

图4 最优牛肉胆固醇定量分析模型中校正集(a)和验证集(b)的PV与RV的散点图及PFF图(cc)
Fig. 4 Scatter diagram of PVs and RVs of calibration set (a) and validation set (b), and PF number (c) of the optimum model

2.5 模型预测

采用独立检验集,将其分为5 个区段,导入最优牛肉胆固醇定量分析模型,通过分析结果来评估该模型的预测准确性。由表4可以看出,在45~50 mg/100 g区段中样本的精密度和PER大于10%,不满足国标和预测误差率要求,在50~70 mg/100 g区段中PER小于10%,预测15 份样本中的12 份精确度在国标范围内,预测准确率达到80%。从检验集总体来看,牛肉胆固醇定量分析模型的精密度满足国标要求,同时PER也低于模型的RSEP。图4中样本分布情况可以说明不同区段PER存在较大差别的原因,主要是由于各区段样本数量分布不均匀,导致各子区段对于检验集的适配范围和背景应变能力不同,出现了“均值化”现象 [22],在45~50 mg/100 g区段尤为明显。但随着样本数量的增加,检验集的RV与PV间的差值逐渐降低,可见不同胆固醇含量样本的均匀分布是理时产生的误差叠加、有效信息丢失或部分校正集区间的样品量较少及代表性较差而导致的,可通过再次剔除校正集和验证集中的异常样本、向部分校正集区间增加有代表性的样本数量或使用新的预处理方法来进行修正和优化。提高模型预测性能的重要前提。对于样本数量较少的区段,可通过增加具有代表性的样本来扩充模型的适配范围以提高模型对未知样本的容变性,由此改善模型整体的稳健性和预测准确率。

表4 最优模型对未知样品的预测效果
Table 4 Prediction performance of the optimal model for unknown samples

?

3 结 论

本研究就近年来国人对高胆固醇食物摄入不均衡而引发的饮食健康问题,采用近红外光谱技术在中波波段对市售生鲜牛肉中的胆固醇含量进行初步的定量分析并建立预测模型,分析结果证明胆固醇参比值与预测值间呈现较好的线性关系,整体分析准确度较高,预测值的精确度满足国家标准,定标模型对于独立检验集样本具有一定的预测能力。在对未知样本的预测过程中,由于胆固醇含量较低的样本数量较少,使得对45~50 mg/100 g区段的未知样品预测准确度较低,而在50~70 mg/100 g区段中生鲜牛肉胆固醇的预测准确度较高,可应用于企业在生产功能性低胆固醇产品过程中的在线原料分级、过程控制、品质监测及对市售牛肉胆固醇的实时无损定量分析,后续工作将向该区段中添加一定数量的代表性样本以改善模型整体稳健性和预测性能。

参考文献:

[1] 左玉, 冯丽霞, 魏世芳. 胆固醇的研究及应用[J]. 太原师范学院学报(自然科学版), 2010, 9(4): 104-107. DOI:10.3969/ j.issn.1672-2027.2010.04.029.

[2] 杜志澎. 高胆固醇与心血管危险因素相关性研究[J]. 中国当代医药, 2013, 20(2): 7-8. DOI:10.3969/j.issn.1674-4721.2013.02.003.

[3] 刘发龙, 马新刚, 程福银, 等. 近红外光谱分析技术在快速分析上的应用[J]. 分析测试技术与仪器, 2008, 14(4): 241-247. DOI:10.3969/ j.issn.1006-3757.2008.04.013.

[4] SÁNCHEZ T, CEBALLOS H, DUFOUR D, et al. Prediction of carotenoids, cyanide and dry matter contents in fresh cassava root using NIRS and Hunter color techniques[J]. Food Chemistry, 2014, 151(20): 444-451. DOI:10.1016/j.foodchem.2013.11.081.

[5] SIMIN H T, FAHMY R, BENSLEY D, et al. Quality by design, part Ⅱ: application of NIR spectroscopy to monitor the coating process for a pharmaceutical sustained release product[J]. Journal of Pharmaceutical Sciences, 2008, 97(9): 4052-4066. DOI:10.1002/jps.21307.

[6] DECRUYENAEREA V, LECOMTEB P, DEMARQUILLYC C, et al. Evaluation of green forage intake and digestibility in ruminants using near infrared reflectance spectroscopy (NIRS): developing a global calibration[J]. Animal Feed Science and Technology, 2009, 148(2): 138-156. DOI:10.1016/j.anifeedsci.2008.03.007.

[7] 牛智有, 韩鲁佳. 饲料中肉骨粉含量的近红外反射光谱检测方法[J]. 农业工程学报, 2008, 24(4): 271-274. DOI:10.3321/ j.issn:1002-6819.2008.04.053.

[8] VOGEL K P, DIEN B S, JUNG H G, et al. Quantifying actual and theoretical ethanol yields for switch grass strains using NIRS analyses[J]. Bioenergy Research, 2011, 4(2): 96-110. DOI:10.1007/ s12155-010-9104-4.

[9] BALABIN R M, LOMAKINA E I, SAFIEVA R Z. Neural network (ANN) approach to biodiesel analysis: analysis of biodiesel density, kinematic viscosity, methanol and water contents using near infrared (NIR) spectroscopy[J]. Fuel, 2011, 90(5): 2007-2015. DOI:10.1016/ j.fuel.2010.11.038.

[10] SANTOS A F, SILVA F M, PINTO M K L J C. Monitoring and control of polymerization reactors using NIR spectroscopy[J]. Polymer-Plastics Technology and Engineering, 2005, 44(1): 1-61. DOI:10.1080/ PTE-200046030.

[11] RAO Y, XIANG B, ZHOU X, et al. Quantitative and qualitative determination of acid value of peanut oil using near-infrared spectrometry[J]. Journal of Food Engineering, 2009, 93(2): 249-252. DOI:10.1016/j.jfoodeng.2009.01.023.

[12] ROGGO Y, DUPONCHEL L, RUCKEBUSCH C, et al. Statistical tests for comparison of quantitative and qualitative models developed with near infrared spectral data[J]. Journal of Molecular Structure, 2003, 654(1): 253-262. DOI:10.1016/S0022-2860(03)00248-5.

[13] 杨皓旻, 卢启鹏. 血清中胆固醇的近红外光谱测量及模型适用性研究[J]. 光谱学与光谱分析, 2011, 31(2): 375-378. DOI:10.3964/j.is sn.1000-0593(2011)02-0375-04.

[14] PRIETO N , ROSS D W, NAVAJAS E A, et al. On-line application of visible and near infrared refl ectance spectroscopy to predict chemicalphysical and sensory characteristics of beef quality[J]. Meat Science, 2009, 83(1): 96-103. DOI:10.1016/j.meatsci.2009.04.005.

[15] MITSUMOTO M, MAEDA S, MITSUHASHI T, et al. Near-infrared spectroscopy determination of physical and chemical characteristics in beef cuts[J]. Journal of Food Science, 1991, 56(6): 1493-1496. DOI:10.1111/j.1365-2621.1991.tb08623.x.

[16] RIPOLL G, ALBERTÍ P, PANEA B, et al. Near-infrared reflectance spectroscopy for predicting chemical, instrumental and sensory quality of beef[J]. Meat Science, 2008, 80(3): 697-702. DOI:10.1016/ j.meatsci.2008.03.009.

[17] YONGLIANG L, LYON B G, WINDHAM W R, et al. Prediction of color, texture, and sensory characteristics of beef steaks by visible and near infrared reflectance spectroscopy. A feasibility study[J]. Meat Science, 2003, 65(3): 1107-1115. DOI:10.1016/S0309-1740(02)00328-5.

[18] 徐霞, 成芳, 应义斌. 近红外光谱技术在肉品检测中的应用和研究进展[J]. 光谱学与光谱分析, 2009, 29(7): 1876-1880. DOI:10.3964/j. issn.1000-0593(2009)07-1876-05.

[19] 吴习宇, 赵国华, 祝诗平. 近红外光谱分析技术在肉类产品检测中的应用研究进展[J]. 食品工业科技, 2014, 35(1): 371-374.

[20] 刘媛媛, 彭彦昆, 王文秀, 等. 基于偏最小二乘投影的可见/近红外光谱猪肉综合品质分类[J]. 农业工程学报, 2014, 30(23): 306-313. DOI:10.3969/j.issn.1002-6819.2014.23.039.

[21] 汤修映, 牛力钊, 徐杨, 等. 基于可见/近红外光谱技术的牛肉含水率无损检测[J]. 农业工程学报, 2013, 29(11): 248-254. DOI:10.3969/ j.issn.1002-6819.2013.11.032.

[22] 刘伟, 赵众, 袁洪福, 等. 光谱多元分析校正集和验证集样本分布优选方法研究[J]. 光谱学与光谱分析, 2014, 34(4): 947-951. DOI:10.3964/j.issn.1000-0593(2014)04-0947-05.

[23] 金叶, 丁海樱, 吴永江, 等. 近红外光谱技术用于血必净注射液提取过程的在线检测研究[J]. 药物分析杂志, 2012, 32(7): 1214-1221.

[24] 严衍禄. 近红外光谱分析的原理、技术与应用[M]. 北京: 中国轻工业出版社, 2013: 162-177.

[25] 祝诗平. 近红外光谱品质检测方法研究[D]. 北京: 中国农业大学, 2003.

Quantitative Analysis of Cholesterol in Fresh Beef Based on Medium-Wavelength NIR Spectroscopy

WANG Hui, TIAN Hanyou, ZHANG Shunliang, LIU Fei, LI Wencai, ZOU Hao, LI Jiapeng, CHEN Wenhua, QIAO Xiaoling*
(Beijing Key Laboratory of Meat Processing Technology, China Meat Research Center, Beijing Academy of Food Sciences, Beijing 100068, China)

Abstract:Cholesterol, a sterol derived from animal fat, is essential for and possesses important physiological functions in human body. However, unbalanced intake of cholesterol will induce serious cardiovascular and cerebrovascular diseases. A new, rapid and noninvasive method to quantitatively analyze cholesterol in foods of animal origin was developed by near-infrared refl ectance spectroscopy (NIRS) within medium wavelength range, and its feasibility was examined. Original spectra of commercially available fresh beef high ribs were collected. The suspicious samples were analyzed and discriminated with Mahalanobis distance and studentized residual, and the outlier samples were determined by twice-detection diagnosis method and removed based on fi nal judgment after secondary partial least squares (PLS) regression analysis. The optimal model for quantitative analysis of cholesterol in fresh beef was established after spectral pretreatment and model optimization. The experiment results indicated that the difference between the predicted values and reference values of the independent test set was not signifi cant (P > 0.05). The overall prediction accuracy could meet the requirements of the Chinese national standard (≤ 10%).

Key words:near infrared refl ectance spectroscopy (NIRS); medium wavelength range; fresh beef; cholesterol concentration; quantitative analysis既是细胞膜的关键组分,也是体内合成胆汁酸、甾醇类激素及VD等的重要前体物质,同时还是能量的来源。人体内的胆固醇约有80%通过内源性生物合成方式获取,另外20%是由小肠从动物源性食物中获取的外源性胆固醇 [1]。随着国人对于动物源性食物的摄取日益增加,胆固醇过多积累而导致的高血压、动脉粥样硬化、冠心病等心脑血管疾病成为我国现阶段的常见病 [2]

DOI:10.7506/spkx1002-6630-201624029

中图分类号:O629.21;O433.4

文献标志码:A

文章编号:1002-6630(2016)24-0185-05

引文格式:

王辉, 田寒友, 张顺亮, 等. 基于中波近红外光谱定量分析生鲜牛肉胆固醇[J]. 食品科学, 2016, 37(24): 185-189.

DOI:10.7506/spkx1002-6630-201624029. http://www.spkx.net.cn

WANG Hui, TIAN Hanyou, ZHANG Shunliang, et al. Quantitative analysis of cholesterol in fresh beef based on medium

wavelength NIR spectroscopy[J]. Food Science, 2016, 37(24): 185-189. (in Chinese with English abstract) DOI:10.7506/

spkx1002-6630-201624029. http://www.spkx.net.cn

胆固醇,一种广泛分布于动物组织中的环戊烷多氢菲衍生物,是人体中具有重要生理功能的类脂和甾醇物质,它

收稿日期:2016-06-02

基金项目:“十二五”国家科技支撑计划项目(2014BAD04B05)

作者简介:王辉(1979—),男,工程师,硕士,研究方向为肉品快速无损检测技术。E-mail:sstrike@126.com

*通信作者:乔晓玲(1964—),女,教授级高级工程师,学士,研究方向为肉制品加工技术。E-mail:cmrcsen@126.com