白酒基酒中典型醇的近红外预测模型构建

刘建学1,2,杨国迪1,韩四海1,2,李 璇1,2,李佩艳1,2,徐宝成1,2

(1.河南科技大学食品与生物工程学院,河南 洛阳 471023;2.河南省食品原料工程技术研究中心,河南 洛阳 471023)

摘 要:采用气相色谱法测定白酒基酒中的正丙醇、正丁醇、正戊醇和异戊醇的含量作为建立近红外预测模型的化学值,将近红外光谱图结合偏最小二乘法和内部交互验证法建立基酒中典型醇的快速检测模型,并进一步优化模型。确定了最优光谱预处理方法和最佳谱区,正丙醇、正丁醇、正戊醇和异戊醇的校正集样品的真实值与近红外预测值的决定系数(R2)分别为0.952、0.981、0.963和0.981,内部交互验证均方根误差分别为0.27、0.49、0.101 mg/100 mL和0.67 mg/100 mL;验证集的决定系数(R2)分别为0.947、0.980、0.928和0.952,预测均方根误差分别为0.40、0.81、0.49 mg/100 mL和1.35 mg/100 mL。结果表明建立的典型醇近红外快速检测模型的准确度、稳定性及预测性能均呈现良好,为白酒基酒的醇类物质品质分析方法研究提供了新的思路。

关键词:近红外光谱;白酒基酒;典型醇;偏最小二乘法

白酒作为中国特有的从谷物发酵的一种蒸馏酒,主要以高粱、小麦、大米等为原料,经过蒸馏、陈酿、勾兑等工艺制成。根据白酒产品感官特征的不同白酒可以分为五大类:浓香型、酱香型、清香型、米香型以及其他香型[1-4]。我国白酒中的风味物质十分复杂,有成千上百种香气成分,包括酯类、醇类、醛类、酮类、酸类、芳香族化合物、酚类、呋喃类化合物等[5]

醇类是白酒中的重要呈味物质,其含量对酒的风味有很重要的影响。白酒中的典型醇类物质包括正丙醇、正丁醇、异丁醇、仲丁醇、戊醇、异戊醇、辛醇、苯乙醇等[6],除了正己醇、庚醇和苯乙醇呈微甜之外,其余的均呈现出苦味或涩味,含量过高不但会使酒的感官呈辣、苦、涩味,影响酒的口感,而且对人体会有一定的毒害作用,会引起头痛,神经系统充血等症状[7-9]。因此,其含量必须控制在一定范围内,国家蒸馏酒卫生标准(GB 2757—2012《蒸馏酒及其配制酒》)规定,白酒中杂醇油(以异丁醇与异戊醇计)的含量为不大于200 g/100 mL(按60度计)[10-11]

近红外光谱分析技术具有无需制样,无损测量,效率高,适合在线检测,无污染、分析结果重现性高等优点,是一种能够满足检测和监测的独立分析技术[12-15],广泛应用在食品及农产品检验、石油化工行业、药物分析、生态环境污染等研究领域[16-18]。目前近红外光谱技术在酒类中应用主要是测定白酒中酒精度[19]、检测白酒中总酸、总酯等关键指标的含量[20]、对酒体的等级划分等[21]。对于白酒中的其他香味物质成分、品质检测等分析较少。本实验结合近红外光谱数据的预处理方法、主成分分析法、偏最小二乘(partial least squares,PLS)法和内部交互验证法等建立定量分析模型并评价,以达到实时快速测定白酒基酒中4 种典型醇类含量的目的。

1 材料与方法

1.1 材料与试剂

81 个白酒基酒样品 杜康控股有限公司;正丙醇、正丁醇、正戊醇和异戊醇标准品(纯度99.8%以上)天津市科密欧化学试剂开发中心;其他均为分析级或色谱级国产试剂。

1.2 仪器与设备

7890A气相色谱仪附氢火焰离子检测器 美国Aglient公司;AT.LZP-930型色谱柱(25 m×0.32 mm,0.1 μm) 中国科学院兰州化学物理研究所;VECTOR33傅里叶变换近红外光谱仪(检测器为InGaAs) 德国Bruker公司。采用配套软件OPUS6.5对近红外光谱基础数据采集,用The Unscrambler X 10.4分析软件(挪威CAMO公司)的功能区对光谱进行预处理。

1.3 方法

1.3.1 气相色谱条件

AT.LZP-930型色谱柱(25 m×0.32 mm,0.1 μm);升温程序:初始温度75 ℃,保持3 min,以3.5 ℃/min升至89 ℃,再以10 ℃/min升至100 ℃,再以3.5 ℃/min升至130 ℃,再以11 ℃/min升至162 ℃,最后以3 ℃/min升至170 ℃;载气(氮气,纯度99.999%),流速30 mL/min;进样量0.5 µL;分流比10∶1。

1.3.2 近红外光谱测定条件

为保证仪器的稳定性,首先打开近红外光谱仪预热40 min;设置仪器参数:扫描时的仪器分辨率为8 cm-1,扫描次数为32 次,光谱范围为波数12 000~4 000 cm-1,采样点为2 075;以空的比色皿作为参比样品进行光谱采集,比色皿厚度为1 mm;测试环境温度控制在(20±5)℃。为减小实验误差对每个基酒样品重复测定3 次,取平均值作为该样品的最终光谱数据。

1.3.3 样本集的选择

选择具有代表性的样本不但可以减少建模的工作量,同时也可以提高模型的稳定性和可靠性。其中,Kennard-stone(KS)法[22]是一种常用、有效的样本集划分方法。通过计算样品含量之间的距离,首先计算剩余样本与距离最大的2 个样品之间的距离,选择最短距离的样品,并继续选择与最短距离相对最长距离对应的样品,依次进行选择。根据以上方法本实验从81 个白酒基酒样品中选取61 个作为校正集,20 个作为验证集建立模型。

1.3.4 模型的质量判断

为了检验所建模型的可靠性和有效性,在优化校正模型时,需要对该模型进行分析检验。首先用内部交互验证法检验模型的稳健性,通过校正集的相关系数(R2)和交互验证均方根误差(root mean square error of cross validation,RMSECV)来判断模型的质量[23]。为了检验模型的预测能力,即模型的精确性和可行性,需要用验证集的相关系数(R2)和预测均方根误差(root mean square error of prediction,RMSEP)作为判断依据,相关系数越大,RMSEP越小,模型预测性能越好[24-27]。采用验证集的RMSEP指标,对最终的模型进行评价和比较。按下式计算RMSEP:

式中:n为样本个数;yTi为样本的实测值/(mg/100 mL);yPi为样本的预测值/(mg/100 mL)。

2 结果与分析

2.1 白酒基酒中典型醇的气相测定结果

为了保证所建模型的应用范围更广,样本的选择应该满足校正集和验证集样本选择的要求。实验样品是按照所有样品测定值大小排序后,根据“隔3取1”的方式选取,其质量浓度可以代表所有样品的范围。白酒基酒样品中正丙醇、正丁醇、正戊醇和异戊醇的化学值见表1。

表1 白酒基酒中典型醇的化学值分析
Table 1 Statistics of chemical values of typical alcohols in base liquor

由表1可得典型醇的校正集和验证集的质量浓度、平均值和标准差,符合建立模型样品选择的原则,即校正集样品范围应包含验证集所有样品的组成范围。比如正戊醇的校正集质量浓度范围为28.54~50.14 mg/100 mL,验证集的质量浓度范围为29.95~47.23 mg/100 mL,包含了正戊醇的全部范围。

2.2 光谱预处理

近红外光谱会包含一些与待测样本性质无关的因素引起的干扰,比如光散射、杂射光、仪器响应的影响、样品不均匀等,导致近红外光谱基线漂移、倾斜等现象,因此选用多元散射校正(multiplication scattering correction,MSC)、标准正态变量变换以及二阶导数等预处理方法对光谱进行预处理,以提高模型准确性和可靠性[25,28]。白酒中的主要成分是水和乙醇,本实验在利用近红外分析图谱信息时,要避开水和乙醇的干扰。水分子在6 896 cm-1左右有明显的一级倍频吸收,二级倍频约在10 416 cm-1,合频位于5 128 cm-1附近,因此水的特征吸收区域为6 896 cm-1和5 128 cm-1附近;乙醇分子的特征吸收区域在4 347 cm-1附近[29-30]。从图1a可以看出,白酒基酒样品在整个光谱范围的近红外图谱都很相似,光谱短波段区域吸收峰重叠现象严重,不能直接反映样品相关成分的浓度信息。为了得到稳定性和精密度较高的模型,在选择波段区间时应避免这些强吸收噪声的干扰,在选择最优波长时尽量避开此段谱区,采用预处理方法后所得白酒基酒的近红外图谱如图1b~d所示。

图1 白酒基酒近红外光谱图
Fig. 1 NIR spectra of base liquor samples

2.3 最优波段和光谱最佳预处理方法

本实验应用近红外光谱图结合PLS法对校正集样品进行建模前的分析,利用OPUS 6.5分析软件中的自主优化检验模型的建模谱区。对采集到的图谱进行预处理后,选出最优波段和最佳预处理方法,如表2所示。

表2 典型醇最优波段的选择和最佳预处理方法
Table 2 Optimal band and optimal pretreatment method for each typical alcohol

由表2可得,4 种典型醇正丙醇、正丁醇、正戊醇和异戊醇的最优波段有部分重合,最佳预处理方法分别为一阶导数+减去一条谱线、MSC、一阶导数+减去一条谱线和二阶导数。

2.4 主成分数的选择

主成分分析是一种线性降维方法,该方法能最大限度地表征被测样品的性质以及组成成分。本实验白酒基酒中前10 个主成分的累计贡献率如图2所示。

理论上讲,累计贡献率达到100%是最佳的状态,但是此时的模型性能不一定最好[18]。不同主成分方差贡献率第1个最大,接着依次降低,不同主成分数对定量分析模型的预测结果有明显的影响:主成分数过少,就不能全面反应光谱特征;若主成分数过多,则会引入过多噪声干扰,降低信噪比,使模型性能降低[19]。从图2可以看出,前4个主成分的累计贡献率已经比较接近100%,再继续累计则增幅很小,已经基本趋于稳定。前10 个主成分的累计贡献率已经可以表征大部分的光谱信息,因此主成分分析法对基酒样品的近红外光谱进行降维是可行的。

图2 白酒基酒前10 个主成分累计贡献率趋势图
Fig. 2 Cumulative contribution rates of the first 10 principal components in base liquor

图3 醇类的RMSECV随最佳主成分数的变化图
Fig. 3 Section of the number of principal components based on RMSECV

采用内部交互验证法,选择RMSECV值最小时对应的主成分数最佳,由图3可以看出正丙醇、正丁醇、正戊醇和异戊醇主成分维数分别为6、1、10、4。

2.5 白酒中典型醇近红外定量模型的建立

根据以上结果,建立最佳定量模型的条件为:正丙醇、正丁醇、正戊醇和异戊醇的最优波段分别为5 446~6 105.5 cm-1和11 998.9~7 497.91 cm-1、5 453.7~4 597.5 cm-1和11 998.9~6 094 cm-1、6 101.7~5 775.8cm-1和11 998.9~7 501.7 cm-1、7 501.7~5 446 cm-1,最佳预处理方法分别为一阶导数+减去一条谱线、MSC、一阶导数+减去一条谱线和二阶导数。在此条件下所建立的醇类的校正模型相关系数最大,RMSECV最小,主成分维数分别为6、1、10、4。利用以上建模条件,根据气相色谱测定白酒基酒中正丙醇、正丁醇、正戊醇和异戊醇含量的结果,如图4所示。

表3 模型预测样品的精密度和稳定性检验(n=10)
Table 3 Precision and stability of the predictive model (n= 10)

注:差异显著(P<0.05)。

图4 校正集、验证集化学测量值与模型预测值的相关性
Fig. 4 Correlation between chemical measurements and predictions for calibration and validation sets

由图4可知,正丙醇、正丁醇、正戊醇和异戊醇校正集样品均匀地分布在回归线的两侧,说明4 种醇类的近红外光谱和它们的基础数据具有显著的线性相关性。正丙醇、正丁醇、正戊醇和异戊醇校正模型的决定系数(R2)分别为0.952、0.981、0.963和0.981,RMSECV分别为0.27、0.49、0.101 mg/100 mL和0.67 mg/100 mL;验证集的决定系数(R2)分别为0.947、0.980、0.928和0.952,RMSEP分别为0.40、0.81、0.49 mg/100 mL和1.35 mg/100 mL。上述结果表明:所建模型的各项数理统计指标都达到理想的期望值,即决定系数(R2)接近1、从RMSECV和RMSEP来看,所有样品的近红外光谱测定结果和标准方法之间的相关性以及误差都在要求的再现性范围以内,近红外光谱所建4 种醇类模型预测样品的预测值与国标方法测得的化学值基本一致,说明所建醇类模型的预测效果很好,可以在白酒工业生产中对正丙醇、正丁醇、正戊醇和异戊醇进行快速检测。

2.6 校正模型预测能力的检验

另取3 个白酒基酒样品作为验证模型准确度和精密度的样本,利用所建4 种醇类模型对样品中正丙醇、正丁醇、正戊醇和异戊醇的含量分别进行10 次重复预测实验,结果见表3。

由表3可知,对正丙醇、正丁醇、正戊醇和异戊醇的预测值和真实值做了比较,每个样品的10 次预测结果平均差异都小于0.58 mg/100 mL,相差范围在0.004~0.49 mg/100 mL之间,并且对每个样品的10 次预测值做了显著性分析,均无显著性差异,可见所建模型精密度和稳定性良好,也符合国标方法规定的在重复性条件下获得的2 次独立测定结果的绝对差值不应超过平均值的5%[26],同时也克服了国标方法的耗时长、需要对样品进行前处理等缺点。

3 结 论

本实验用气相色谱法对白酒基酒中正丙醇、正丁醇、正戊醇和异戊醇的含量进行了测定,结合主成分分析法,通过对建模波段、光谱预处理方法和主成分维数等进行合理筛选,结合PLS法、内部交互验证等方法分别建立4 种典型风味物质的校正模型和预测模型,并对模型预测结果的准确性进行了评价。经过上述处理得到正丙醇、正丁醇、正戊醇和异戊醇校正集样品的化学值与近红外预测值的模型评价指标校正集决定系数分别为0.952、0.981、0.963和0.981(校正集),RMSECV分别为0.27、0.49、0.101 mg/100 mL和0.67 mg/100 mL;验证集的决定系数(R2)分别为0.947、0.980、0.928和0.952,RMSEP分别为0.40、0.81、0.49 mg/100 mL和1.35 mg/100 mL。决定系数均大于0.928,RMSECV和RMSEP数值较小且二者的值相差不大。对模型的预测能力进行验证,结果表明所建模型的精密度和稳定性良好,说明近红外光谱技术可以用来分析白酒基酒中的香味物质,实现快速在线检测。

参考文献:

[1] FAN W, QIAN M C. Characterization of aroma compounds of Chinese “Wuliangye” and “Jiannanchun” liquors by aroma extract dilution analysis[J]. Journal of Agricultural & Food Chemistry, 2006,54(7): 2695-2704. DOI:10.1021/jf052635t.

[2] ZHU S, LU X, JI K, et al. Characterization of flavor compounds in Chinese liquor Moutai by comprehensive two-dimensional gas chromatography/time-of-flight mass spectrometry[J]. Analytica Chimica Acta, 2007, 597(2): 340-348. DOI:10.1016/j.aca.2007.07.007.

[3] FAN W, XU Y, QIAN M C. Identification of aroma compounds in Chinese “Moutai” and “Langjiu” liquors by normal phase liquid chromatography fractionation followed by gas chromatography/olfactometry[J]. Flavor Chemistry of Wine and Other Alcoholic Beverages, 2012, 1104: 303-308. DOI:10.1021/bk-2012-1104.ch017.

[4] 刘明, 刘传贺, 吕志远, 等. 白酒产品关键感官特征与质量性价比研究[J]. 食品安全质量检测学报, 2016, 7(3): 1102-1108.

[5] 范文来, 徐岩. 白酒风味物质研究方法的回顾与展望[J]. 食品安全质量检测学报, 2014, 5(10): 3073-3078.

[6] 罗杰, 敖宗华, 王松涛, 等. 浓香型白酒不同类别基酒中杂醇油相关性研究[J]. 酿酒科技, 2015(1): 43-44.

[7] 陆婉珍, 袁洪福, 徐广通. 现代近红外光谱分析技术[M]. 北京: 中国石化出版社, 2000.

[8] 余丽娟, 郑建明, 朱文雷. 傅里叶变换红外光谱法测定白酒中乙醇含量[J]. 广州化工, 2011, 39(4): 112-113. DOI:10.3969/j.issn.1001-9677.2011.04.041.

[9] VERSARI A, LAGHI L, THORNGATE J H, et al. Prediction of colloidal stability in white wines using infrared spectroscopy[J].Journal of Food Engineering, 2011, 104(2): 239-245. DOI:10.1016/j.jfoodeng.2010.12.015.

[10] 苟静瑜, 贾智勇, 闫宗科, 等. 降低白酒中高级醇含量的研究进展[J].酿酒, 2016, 43(4): 25-29. DOI:10.3969/j.issn.1002-8110.2016.04.006.

[11] GAO W, FAN W, XU Y. Characterization of the key odorants in light aroma type Chinese liquor by gas chromatography-olfactometry,quantitative measurements, aroma recombination, and omission studies[J]. Journal of Agricultural & Food Chemistry, 2014, 62(25):5796-5804. DOI:10.1021/jf501214c.

[12] 姚晶, 王海瑞, 姚丽萍. 毛细管柱气相色谱外标法测定白酒中的醇类和己酸乙酯[J]. 西南农业学报, 2013, 26(4): 1674-1676.

[13] ZHONG J, QIN X. Rapid quantitative analysis of corn starch adulteration in konjac glucomannan by chemometrics-assisted FTNIR spectroscopy[J]. Food Analytical Methods, 2016, 9(1): 61-67.DOI:10.1007/s12161-015-0176-9.

[14] JIANG H, LIU G, XIAO X, et al. Classification of Chinese soybean paste by Fourier transform near-infrared (FT-NIR) spectroscopy and different supervised pattern recognition[J]. Food Analytical Methods,2012, 5(4): 928-934. DOI:10.1007/s12161-011-9331-0.

[15] 邓波, 沈才洪, 敖宗华, 等. 基于主成分分析与近红外光谱技术的窖泥聚类研究[J]. 酿酒科技, 2011(8): 36-38.

[16] 熊雅婷, 李宗朋, 王健, 等. 近红外光谱波段优化在白酒酒醅成分分析中的应用[J]. 光谱学与光谱分析, 2016, 36(1): 84-90.

[17] SMYTH H E, COZZOLINO D, CYNKAR W U, et al. Near infrared spectroscopy as a rapid tool to measure volatile aroma compounds in riesling wine: possibilities and limits[J]. Analytical and Bioanalytical Chemistry, 2008, 390(7): 1911-1916. DOI:10.1007/s00216-008-1940-0.

[18] 许家胜, 张杰. 近红外光谱法测定柴油硫含量方法研究[J].化学研究与应用, 2013, 25(3): 355-358. DOI:10.3969/j.issn.1004-1656.2013.03.017.

[19] 丁美珍, 宋岑, 胡志明. 近红外光谱技术在酒类产品分析中的应用[J]. 酿酒科技, 2013(4): 68-70. DOI:10.3969/j.issn.1001-9286.2005.08.020.

[20] 吴同, 谭超. 近红外光谱同时测定白酒中总酯和杂醇油[J]. 化学研究与应用, 2016(10): 1460-1463. DOI:10.3969/j.issn.1004-1656.2016.10.017.

[21] 周杨, 刘杰, 王纪元. 中国酿酒行业中近红外光谱技术的应用进展[J].食品安全质量检测学报, 2014, 5(4): 1100-1104.

[22] CAI J J. Computer note: PGETooIbox: a Matlab toolbox for population genetics and evolution[J]. Journal of Heredity, 2008, 99(4): 438-440.DOI:10.1093/jhered/esm127.

[23] 王豪, 邬蓓蕾, 林振兴, 等. 傅立叶变换近红外光谱法快速测定葡萄酒中的酒精度[J]. 中国酿造, 2008, 27(7): 72-74. DOI:10.3969/j.issn.0254-5071.2008.04.024.

[24] 李军会. 现代近红外光谱分析的信息处理技术[J]. 光谱学与光谱分析, 2000, 20(6): 777-780. DOI:10.3964/j.is sn.1000-0593(2009)10-2646-05.

[25] 李水芳, 单杨, 朱向荣, 等. 近红外光谱结合化学计量学方法检测蜂蜜产地[J]. 农业工程学报, 2011, 27(8): 350-354. DOI:10.3969/j.issn.1002-6819.2011.08.061.

[26] FAN W, SHEN H, XU Y. Quantification of volatile compounds in Chinese soy sauce aroma type liquor by stir bar sorptive extraction and gas chromatography-mass spectrometry[J]. Journal of the Science of Food and Agriculture, 2011, 91(7): 1187-1198.

[27] 彭帮柱, 龙明华, 岳田利, 等. 傅立叶变换近红外光谱法检测白酒总酸和总酯[J]. 农业工程学报, 2006, 22(12): 216-219. DOI:10.3321/j.issn:1002-6819.2006.12.045.

[28] 王动民, 纪俊敏, 高洪智. 多元散射校正预处理波段对近红外光谱定标模型的影响[J]. 光谱学与光谱分析, 2014, 34(9): 2387-2390.DOI:10.3964/j.issn.1000-0593(2014)09-2387-04.

[29] ZHANG C, XU N, LUO L, et al. Detection of aspartic acid in fermented cordyceps powder using near infrared spectroscopy based on variable selection algorithms and multivariate calibration methods[J]. Food and Bioprocess Technology, 2014, 7(2): 598-604.DOI:10.1007/s11947-013-1149-x.

[30] SHEN F, YANG D, YING Y, et al. Discrimination between shaoxing wines and other Chinese rice wines by near-infrared spectroscopy and chemometrics[J]. Food and Bioprocess Technology, 2012, 5(2): 786-795.DOI:10.1007/s11947-010-0347-z.

Prediction Model for Typical Alcohols in Base Liquor Based on Near Infrared Spectroscopy

LIU Jianxue1,2, YANG Guodi1, HAN Sihai1,2, LI Xuan1,2, LI Peiyan1,2, XU Baocheng1,2
(1. College of Food and Bioengineering, Henan University of Science and Technology, Luoyang 471023, China;2. Henan Engineering Research Center of Food Material, Luoyang 471023, China)

Abstract:In this paper, the contents of n-propanol, n-butanol, amyl alcohol and isoamyl alcohol in base liquor were determined by gas chromatography and used as chemical values for the establishment of calibration and validation sets for a rapid predictive model based on near infrared spectroscopy (NIR) to measure typical alcohols in base liquor. The model was developed using partial least squares (PLS) regression with internal cross validation and optimized. The optimal spectral pretreatment method and the optimal spectral region were determined. The coefficients of determination (R2) between the actual and the NIR predicted values of n-propanol, n-butanol, amyl alcohol and isoamyl alcohol for the calibration set were 0.952, 0.981, 0.963 and 0.981, and the root mean square error of cross-validation (RMSECV) were 0.27, 0.49, 0.101 and 0.67 mg/100 mL, respectively; the R2values for the validation set were 0.947, 0.980, 0.928 and 0.952, and RMSEPs were 0.40, 0.81, 0.49 and 1.35 mg/100 mL, respectively. Results showed that the predictive model exhibited good accuracy,stability and prediction performance and could provide a new approach for the analysis of alcohols in base liquor.

Keywords:near infrared spectroscopy; base liquor; typical alcohols; partial least squares

DOI:10.7506/spkx1002-6630-201802044

中图分类号:TS262.3

文献标志码:A

文章编号:1002-6630(2018)02-0281-06

引文格式:刘建学, 杨国迪, 韩四海, 等. 白酒基酒中典型醇的近红外预测模型构建[J]. 食品科学, 2018, 39(2): 281-286.

DOI:10.7506/spkx1002-6630-201802044. http://www.spkx.net.cn

LIU Jianxue, YANG Guodi, HAN Sihai, et al. Prediction model for typical alcohols in base liquor based on near infrared spectroscopy[J]. Food Science, 2018, 39(2): 281-286. (in Chinese with English abstract)

DOI:10.7506/spkx1002-6630-201802044. http://www.spkx.net.cn

收稿日期:2017-03-24

基金项目:国家自然科学基金面上项目(31471658);河南省重点科技攻关项目(152102110025)

第一作者简介:刘建学(1964—),男,教授,博士,研究方向为食品品质快速检测与安全控制技术。E-mail:jx_liu@163.com