茶叶品质智能评价中统计分析技术的应用现状与展望

戴悦雯1,支瑞聪2,*,赵 镭2,高海燕1,史波林2,汪厚银2

(1.上海大学生命科学学院,上海 200444;2.中国标准化研究院食品与农业标准化研究所,北京 100088)

摘 要:智能感官分析技术是茶叶品质检测领域中的一项新兴技术,它通过模拟人的感官实现对于茶叶品质的快速检测和判别。数据统计分析作为智能评价中的核心部分,决定着评判结果的高效性和准确性。本文重点剖析统计分析方法(数据降维、模式分类、信息融合)在茶叶品质智能评价中的应用现状,并对统计分析技术的发展和进一步研究进行展望。

关键词:茶叶品质;数据统计分析;数据降维;模式分类;信息融合

中国是茶的故乡,茶在中国已经有四五千年的历史。近年来,国内外市场对茶需求量的不断增加为我国整个茶市场的发展提供了广阔的舞台。然而,目前市场上茶叶级别混乱,以次充好的现象时常发生,这给茶叶贸易和消费者权益都带来了不良的影响。如何让如今的茶市场走上健康有序的道路,对茶叶质量检测技术提出了巨大的挑战。

长期以来,人工评审作为评判茶叶品质的一种传统方式,通过综合外形、香气、汤色、滋味和叶底五方面的信息对茶叶品质做出整体的评判[1]。但该方法对审评人员具有较高的专业要求且易受外界因素干扰。理化检测作为后发展起来的一项技术,依靠仪器设备对茶叶物质成分进行检测。该方法能有效解析茶叶的香气及滋味成分,但难以根据物质成分对茶叶整体香气及滋味品质进行评判[2]。智能感官分析技术是茶叶品质检测中的一项新兴技术,它通过模拟人的感官得到有关茶叶香气和滋味的指纹信息,经数据统计分析给出评判结果。该技术因操作简便、客观准确、检测时间短、重复性好等特点,成为目前茶叶品质检测领域中的研究热点。

1 智能感官分析技术

智能感官分析技术是对人感官感知过程的模仿。在茶叶品质检测过程中,智能感官分析设备对茶叶色、香、味、形等感官属性进行检测,通过对所得信息进行处理,实现对于茶叶品质的检测[2]。目前,可用于茶叶品质检测的智能感官分析设备主要有电子鼻、电子舌和机器视觉。与机器视觉的图像信息不同,电子鼻和电子舌通过传感器采集有关香气及滋味的响应信号。因电子鼻和电子舌传感器采集到的信号形式相似,所以其数据处理方式相同,主要包括传感器信号参数提取、样品特征信息提取(数据降维)及模式分类(图1)。其中,数据统计分析作为智能评价的核心,统计分析方法的选择和应用决定了智能感官分析技术在茶叶品质检测中的效果。本文将重点对电子鼻和电子舌传感器信号解析中数据统计分析方法的应用现状进行介绍。

图1 智能感官分析流程
Fig.1 Diagram of intelligent sensory analysis

2 统计分析技术在茶叶品质智能评价中的应用

2.1 传感器信号参数提取

电子鼻、电子舌传感器响应信号是随时间变化的时序信号。时序信号与时间相关联,因而其数据量是非常庞大的,所以直接以原始信号为对象进行分析在时间和空间上都是不可行的[3]。信号参数提取的目的在于从数据量庞大的时序信号中提取出特征性较强的数据点,从而更加快速有效地实现对于传感器信号的分析。

目前,在茶叶智能感官分析领域,传感器信号参数以时域参数为主。时域参数是以时间轴为基准对信号提取的特征参数,能形象且直观地反映原始信号的特征[4]。信号分析领域常用的时域参数有最大值、均值、稳值、方差、标准偏差等。在茶叶智能感官分析领域,电子鼻、电子舌传感器信号分别以最大值和均值作为主要时域参数进行数据分析。Qin Zihan[5]、Chen Quansheng[6]、Banerjee[7]等在利用电子鼻对不同等级红茶、龙井茶、炒青绿茶的识别中,以传感器信号最大值作为后续茶叶等级识别模型建立的特征点。王新宇[8]、陈全胜[9]等在利用电子舌对不同等级炒青绿茶的识别中,以时序信号最后20 s测量值的平均值作为传感器响应值进行后续实验分析。电子鼻、电子舌信号参数提取是决定茶叶品质判定效果的关键步骤,在现有特征参数的基础上,提取出更具特征性和代表性的参数将会进一步提升对于茶叶品质的判定效果。

2.2 特征信息提取(数据降维)

目前,通过传感器获得的信息哪些真正有助于茶叶品质的检测还不得而知。所以,人们总是提取尽可能多的信息用于茶叶品质的检测。但是,信息量与检测效果之间并非呈绝对的正比关系。因为在大量的信息中往往包含着与茶叶品质特征相关性差,甚至不相关且冗余的信息。这些信息的存在不但不会提升对于茶叶品质的检测效果,反而会起到负面作用。为了减少“垃圾”信息的影响,从大量的信息中提取出具有代表性的特征信息,除了可以对原始高维数据进行降维,减少运算时间和计算复杂度,更重要的是能够提高智能感官分析结果的准确性和有效性。特征信息提取(数据降维)方法主要分为线性和非线性两大类。非线性方法虽然能解决实际问题中线性方法所无法解决的问题,但非线性映射比线性映射的处理过程复杂,且智能感官分析技术在茶叶品质检测领域的研究尚不深入,所以目前主要是以线性方法实现对于茶叶特征信息的提取。

线性降维是指通过线性的特征组合对原始数据进行降维,本质上就是把原始的高维数据从输入空间通过线性变换映射到低维空间,从而获得关于原数据集的低维表示。假设X=(x1, x2……xi)是高维空间中的一个向量,通过降维得到低维空间中的向量Y=(y1, y2……yi)Y=(y1, y2……yiT。如果F的每个分量Fi都是X的线性函数,则称F为线性降维[10-11]。在茶叶智能感官分析领域,经典且广泛使用的线性降维方法主要有主成分分析法(principal components analysis,PCA)和线性判别分析法(linear discriminant analysis,LDA)。PCA通过对原始变量的相关矩阵或协方差矩阵内部结构的研究,将多个变量转换为少数几个综合变量即主成分。通过转换所得到的主成分能够反映原始变量的大部分信息,实现对于原始数据降维的目的。相对于非监督的PCA,LDA是一种有监督的降维方法。它以样本的可区分性为目标,通过寻找一组线性变换以达到类内散度最小且类间散度最大[11-12]

在利用PCA和LDA对茶叶数据进行降维的应用中,Qin Zihan[5]和He Wei[13]等通过PCA分别对3 个不同等级龙井茶的电子鼻和电子舌数据进行了分析。3 个不同等级龙井茶的电子鼻、电子舌数据经PCA(电子鼻:PC1 65%,PC2 20%;电子舌:PC1 67.85%,PC2 28.95%)进行特征提取后,分别位于得分图的不同区域,不同等级之间得以明显区分且相互之间无交叉重叠。Yu Huichun等[14]在利用电子鼻对不同等级绿茶品质的判别研究中,将PCA提取到的不同等级绿茶的特征信息作为神经网络输入,使训练集和测试集对于茶叶等级的正确识别率分别达到了100%和88%。Chen Quansheng[15]和Mirasoli[16]等在利用电子鼻分别对不同种茶叶和不同贮藏时间绿茶的分类识别中,通过LDA分别实现了对于不同茶叶100%的正确识别。PCA和LDA在茶叶智能感官分析中的应用,帮助实现了对于茶叶数据的压缩及特征的提取,并且进一步提升了对于茶叶品质的检测效果。在对PCA和LDA这两种方法的比较中,Yu Huichun等[17-18]同时利用这两种方法对不同等级和不同贮藏时间龙井茶的电子鼻数据进行了分析。实验结果表明,LDA对于不同等级和不同贮藏时间龙井茶的区分效果优于PCA,经LDA进行特征提取后能达到对于不同等级龙井茶100%的正确识别,并且能对不同贮藏天数(0、60、120、180、240 d)下的龙井茶进行有效区分。张红梅等[19]在基于气敏传感器阵列的茶叶等级检测方法研究中,以电子鼻采集到的3 个等级信阳毛尖茶为分析对象,同样对PCA和LDA这两种方法在特征提取中的效果进行了比较。实验结果显示,LDA的特征提取效果优于PCA,两种方法对于不同等级信阳毛尖茶的正确识别率分别为100%(LDA)和96.6%(PCA)。根据上述研究可以看出,PCA和LDA这两种降维方法在茶叶智能感官分析领域已得到广泛应用。其中,多数实验研究结果显示,相对于无监督的PCA,LDA通过已知类别信息的训练数据集学习并建立模型,能够更好地对测试集样本进行识别。

2.3 模式分类

模式分类是在特征提取的基础上,利用分类方法将样品特征信息判断为某一模式类别的过程。基于不同的分类原理,模式分类方法主要包括:K-最近邻分类(K-nearest neighbor,KNN)、神经网络、支持向量机等。KNN是相对简单的一种信息分类算法。在分类过程中,对于新给定样本,KNN通过寻找训练样本集中与测试样本距离最近的K 个样本,根据这K 个样本所属的类别判定测试样本的类别[20]。神经网络是从结构上模仿生物神经网络的一种分类算法。在神经网络模型中,分类知识被隐式地存储在连接的权值上,使用迭代算法确定权值向量。当网络输出判别正确时,权值向量保持不变,否则进行增加或降低的调整[21-22]。支持向量机最初来自两类线性可分的数据,设X为输入空间,Y表示输出域,通常模式集合X={xi}∈Rn由两类点组成,即Y={-1, 1}。对n 个样本组成的训练集 S=((x1, x2),……,(xn, xn))∈(X×Y)n,根据结构风险最小原理,构造一个目标函数,寻找一个满足要求的分割超平面,并使训练集中的点距离分割超平面尽可能的远[23-24]

在茶叶模式分类研究中,神经网络以其大规模并行、分布式存储、自组织、自适应和自学习能力强等特点得到广泛应用。Dutta等[25]在利用电子鼻对5 种不同加工工艺茶叶的识别研究中,比较分析了4 种神经网络分类器对于茶叶的识别效果。其中,以径向基函数(radical basis function,RBF)神经网络为分类器时,实现了对不同加工工艺茶叶100%的正确识别。于慧春等[26]在利用电子鼻对同类不同等级的茶叶、茶水和茶底的识别研究中,通过误差逆传播(back propagation,BP)神经网络分别实现了97%、100%和93%的正确识别。与此同时,KNN和支持向量机作为另外两种分类器,在茶叶模式分类中也得到了应用。陈哲等[27]在基于电子鼻技术的碧螺春茶叶品质等级检测研究中,利用KNN实现了对3种等级碧螺春茶83.33%的正确识别。在基于电子舌技术对茶叶质量等级评判的研究中,陈全胜等[9]利用KNN建立了茶叶等级判定模型。通过交互验证的方法优化模型参数K和主成分因子数后,使模型交互验证的识别率达到97.5%,对预测集中40 个样本的预测识别率达到100%。同时,在利用电子鼻对不同等级炒青绿茶的品质判别中,Chen Quansheng等[6]比较分析了KNN、神经网络和支持向量机3 种分类器对于炒青绿茶等级的分类效果。实验结果表明,支持向量机的模式分类效果优于KNN和神经网络,在对训练集和测试集的判别中分别能达到100%和95%的正确识别率。由于支持向量机在茶叶智能感官分析中的研究还未普遍,所以目前还无法对其在茶叶分类中的性能做出准确的评价。但是,根据已有文献可知,基于统计学习理论的支持向量机在茶叶模式分类中展现出了巨大潜力。

2.4 信息融合技术在茶叶品质智能评价中的应用

茶叶品质是由色、香、味、形等多方面感官特性共同决定,通过单一来源数据难以准确、全面地表征茶叶的整体品质。信息融合作为一种多源信息处理技术,通过对多源信息进行综合分析,能够进一步提高数据处理结果的准确性和可靠性[28]

针对信息融合技术在茶叶领域中的应用,陈全胜等[29]提出了利用近红外光谱和机器视觉的多传感信息融合技术来评判茶叶的品质。通过利用BP神经网络方法建立茶叶综合品质评判模型,最后实现了99%的训练回判率和89%的预测识别率,评判结果的准确性和稳定性都较单一信息模型有所提高。Banerjee等[7]通过融合电子鼻和电子舌数据对不同质量的茶叶进行了识别。实验结果显示,与仅利用单一来源数据相比,将电子鼻和电子舌数据融合后,对于不同质量茶叶的正确识别率由电子鼻的83.1%和电子舌的85.7%提升到93.3%。信息融合技术除了已应用于茶叶品质检测外,在食品智能感官分析领域的其他方面如果蔬、橄榄油、肉产品等的质量检测中也得到了应用[30-32]。信息融合技术正以其覆盖面广、容错性好、可靠性高等优势在食品检测领域发挥越来越重要的作用。但是,由于信息融合技术在我国的发展起步较晚,到目前为止在食品智能感官分析领域的研究尚不深入。所以,如何充分发挥信息融合技术的优势更好地应用于食品质量检测,将会成为整个食品智能感官分析领域的研究重点。

3 结 语

统计分析方法的应用为智能感官分析技术在茶叶品质检测领域的快速发展奠定了基础。除茶叶外,统计分析方法在酒类[33-34]、乳制品[35-36]、橄榄油[32-37]、饮料[38-39]等其他方面的成功应用,进一步推进了智能感官分析技术在食品领域的发展。但是,目前用于智能感官分析的统计分析方法较为局限,很大程度上影响了对于食品检测效果的进一步提升以及整个智能感官分析技术的发展。因此,在现有统计分析方法的基础上引入并结合其他统计分析方法,将会成为食品智能感官分析领域下一步的研究方向:1)信号时域、频域参数的结合:频域参数是描述信号频率特性的一种参数,它能反映信号内部的频率结构及频率与频率信号幅度的关系。作为信号分析的两个不同角度,时域和频域参数各有优缺点。时域参数能形象且直观地反映原始信号的特征,频域参数能揭示原始信号内部的结构特性,并能从频率结构对时域参数相同的信号进行进一步解析。但它们共同的缺点是都只能反映原始信号的单方面特征信息。为了能从不同角度更加全面地代表信号的特征信息,将时域和频域参数结合,充分发挥各参数优势,将会成为食品智能感官分析领域一个新的研究方向。2)非线性降维方法的应用:线性数据是相对简单的一类数据,现实世界中的数据往往是以非线性的结构存在,此时通过线性方法就很难挖掘出高维数据中的集合结构和相关性。针对具有非线性结构的高维数据,非线性降维方法不但能保持原始数据的拓扑结构不变,而且能较好地对非线性高维数据进行降维。将非线性方法引入到食品智能评价中,利用非线性方法的优势对数据降维将会成为该领域又一个新的研究方向。3)多通道信息融合技术的应用:通过单一来源的信息已无法满足产品多感官特性的表征及识别。信息融合技术通过对产品的多来源信息进行综合考察,取精华去冗余,能够增加表征产品品质的信息量,提高产品品质模型的有效性和稳定性。

参考文献:

[1]中华人民共和国国家质量监督检验检疫总局, 中国国家标准化管理委员会. GB/T 23776—2009 茶叶感官审评方法[S]. 北京: 中国标准出版社, 2009.

[2]史波林, 赵镭, 汪厚银, 等. 智能感官分析技术在茶叶品质检测中的应用[J]. 食品科学, 20 09, 30(19): 351-355.

[3]贾素玲, 陈当阳, 姜浩. 时序数据挖掘中的数据表示算法[J]. 计算机工程与应用, 2006(29): 184-186.

[4]余顺园. 信号与系统中时域频 域的对称性[J]. 科技视界, 2012(25): 192-193.

[5]QIN Zihan, PANG Xueli, CHEN Dong, et al. Evaluation of Ch inese tea by the electronic nose and gas chromatography massspectrometry: c orrelation with sensory properties and classification according to grade level[J]. Food Research International, 2013, 53(2): 864-874.

[6]CHEN Quansheng, ZHAO Jiewen, CHEN Zhe, et al. Discrimination of green tea quality using the electronic nose technique and the human pan el test, comparison of linear and nonlinear classification tools[J]. Sensors and Actuators B: Chemical, 2011, 159(1): 294-300.

[7]BANERJEE R, TUDU B, SHAW L, et al. Instrumental testing of tea by combining the responses of electronic nose and tongue[J]. Journal of Food Engineering, 2012, 110(3): 356-363.

[8]王新宇, 陈全胜. 利用电子舌识别炒青绿茶的等级[J]. 安徽农业科学, 2007, 35(28): 8872-8873.

[9]陈全胜, 江水泉, 王新宇. 基于电子舌技术和模式识别方法的茶叶质量等级评判[J]. 食品与机械, 2008, 24(1): 124- 126.

[10]邹艳. 高维数据降维方法的研究[D]. 成都: 西南交通大学, 2009: 9-15.

[11]安亚静. 智能降维技术的研究与应用[D]. 无锡: 江南大学, 2 012: 9-12.

[12]陆捷荣. 基于流形学习与D-S证据理论的语音情感识别研究[D]. 镇江: 江苏大学, 2010: 16-17.

[13]HE Wei, HU Xiaosong, ZHAO Lei. Eval uation of Chinese tea by the electronic tongue: correlation with senso ry p roperties and classification according to geographical origin and grade level[J]. Food Research International, 2009, 42(10): 1462-1467.

[14]YU Huichun, WANG Jun, YAO Cong, et al. Quality grade identification of green tea using E-nose by CA and ANN[J]. LWTFood Science and Technology, 2008, 41(7): 1268-1273.

[15]CHEN Quansheng, LIU Aiping, ZHAO Jiewen. Classification of tea category using a portable electronic nose based on an odor imaging sensor array[J]. Journal of Pharmaceutical and Biomedical Analysis, 2013, 84: 77-83.

[16]MIRASOLI M, GOTTI R, di FUSCO M. Electronic no se and chiralcapillary electrophoresis in evaluation of the quality changes in commercial green tea leaves during a long-term storage[J]. Talanta, 2014, 129: 32-38.

[17]YU Huichun, WANG Jun, ZHANG Hongmei, et al. Iden tifi cation of green tea grade using different feature of response signal from E-nose sensors[J]. Sensors and Actuators B: Chemical, 2008, 128(2): 455-461.

[18]YU Huichun, WANG Yongwei, WANG Jun. Identification of tea sto rage times by linear discrimination analysis and back-propagation neural network techniques based on the eigenvalues of principal components analysis of e-nose sensor signals[J/OL]. Sensors, 2009, 9(10): 8073-8082. doi: 10.3390/s91008073.

[19]张红梅, 高献坤, 徐国强, 等. 基于气敏传感器阵列的茶叶等级检测方法研究[J]. 河南农业大学学报, 2010, 44(2): 177-179.

[20]SAINI I, SINGH D, KHOSLA A. QRS detection using K-Nearest Neighbor algorithm (KNN) and evaluation on standard ECG databases[J]. Journal of Advanced Research, 2013, 4(4): 331-344.

[21]S UN J ianye. Learning algorithm and hidden node selection scheme for local coupled feedforward neural network classifier[J]. Neurocomputing, 2012, 79: 158-163.

[22]BORAH S, HINES E L, LEESON M S, et al. Neural network based electronic nose for classification of tea aroma[J]. Sensing and Instrumentation for Food Quality and Safety, 2008, 2(1): 7-14.

[23]ALKAN A, GÜNAY M. Identification of EMG signals using discriminant analysis and SVM classifier[J]. Expert Systems w ith Applications, 2012, 39(1): 44-47.

[24]李小娟, 张艳珠, 李媛. LDA及支持向量机的人脸识别算法研究[J].沈阳理工大学学报, 2012, 31(5): 52-55.

[25]DUTTA R, MINES E L, GARDNER J W, et al. Tea quality prediction using a tin oxide-based electronic nose: an artificial intelligence approach[J]. Sensors and Actuators B: Chemical, 2003, 94(2): 228-237.

[26]于慧春, 王俊. 电子鼻技术在茶叶品质检测中的应用研 究[J]. 传感技术学报, 2008, 21(5): 748-752.

[27]陈哲, 赵杰文. 基于电子鼻技术的碧螺春茶叶品质等级检测研究[J].农机化研究, 2012, 34(11): 133-137.

[28]黄漫国, 樊尚春, 郑德智, 等. 多传感器数据融合技术研究进展[J].传感器与微系统, 2010, 29(3): 5-8.

[29]陈全胜, 赵杰文, 蔡健荣, 等. 基于近红外光谱和机器视觉的多信息融合技术评判茶叶品质[J]. 农业工程学报, 2008, 24(3): 5-10.

[30]刘鹏, 屠康, 苏子鹏, 等. 基于多传感器融合技术的苹果成熟度检测研究[J]. 江苏农业学报, 2010, 26(3): 670-672.

[31]张永超, 吴才章. 基于多传感器信息融合技术的粮食水分测定仪[J].仪器仪表与检测技术, 2010, 29(4): 66-69.

[32]HADDI Z, ALAMI H, EI BARI N, et al. Electronic nose and tongue combination for improved classifi cat ion of Moroccan virgin olive oil profi les[J]. Food Research International, 2013, 54(2): 1488-1498.

[ 33]de las NIEVES LÓPEZ de LERMA M, BELLINCONTRO A, GARCÍA-MARTÍNEZ T, et al. Feasibility of an electronic nose to differen tiate commercial Spanish wines elaborated from the same grape variety[J]. Food Research International, 2013, 5 1(2): 790-796.

[34]PRIETO N, RODRIGUEZ-M NDEZ M L, LEARDI R, et al. Application of multi-way analysis to UV-visible spectroscopy, gas chromatography and electronic nose data for wine ageing evaluation[J]. Analytica Chimica Acta, 2012, 719: 43-51.

[35]WEI Zhenbo, WANG Jun, ZHANG Xi. Monitoring of quality an d storage time of unsealed pasteurized milk by voltammetric electronic tongue[J]. Electrochimica Acta, 2013, 88: 231-239.

[36]BRUDZEWSKI K, OSOWSKI S, MARKIEWICZ T. Classification of milk by means of an electronic nose and SVM neural network[J]. Sens ors and Actuators B: Chemical, 2004, 98(2/3): 291-298.

[37]COSIO M S, BALLABIO D, BENEDETTI S, et al. Geographical origin and authentication of extra virgin olive oils by an electronic nose in combination with artificial neural netw orks[ J]. Analytica Chimica Acta, 2006, 567(2): 202-210.

[38]HARTYANI P, DALMADI I, KNORR D. Electronic nose investigation of Alicyclobacillus acidoterrestris inoculated apple and orange juice treated by high hydrostatic pressure[J]. Food Control, 2013, 32(1): 262-269.

[39]HONG Xuezhen, WANG Jun. Detection of adulteration in cherry tomato juices based on electronic nose and tongue: comparison of different data fusion approaches[J]. Journal of Food Engineering, 2014, 126: 89-97.

Application of Statistical Analysis Techniques in Intelligent Evaluation of Tea Quality: Current Situation and Future Prospect

DAI Yuewen1, ZHI Ruicong2,*, ZHAO Lei2, GAO Haiyan1, SHI Bolin2, WANG Houyin2

(1. College of Life Science, Shanghai University, Shanghai 200444, China; 2. Institute of Foods and Agriculture Standardization, China National Institute of Standardization, Beijing 100088, China)

Abstract: Intelligent sensory analysis is an emerging technology in tea quality evaluation. It can achieve rapid detection and classifi cation of tea quality by simulating human senses. Statistical data analysis, as the core of intelligent evaluation, determines the effi ciency and accuracy of evaluation results. This paper is focused on reviewing the application of statistical analysis techniques (data dimensionality reduction, pattern classifi cation, and information fusion) in intelligent evaluation of tea quality and future prospects and further research directions of statistical analysis technique are also proposed.

Key words: tea quality; statistical data analysis; data dimensionality reduction; pattern classifi cation; information fusion

doi:10.7506/spkx1002-6630-201507041

中图分类号:TS272.7

文献标志码:A

文章编号:1002-6630(2015)07-0223-05

*通信作者:支瑞聪(1983—),女,副研究员,博士,研究方向为智能感官分析。E-mail:zhirc@cnis.gov.cn

作者简介:戴悦雯(1989—),女,硕士研究生,研究方向为智能感官分析。E-mail:DAIDAIDD11@163.com

基金项目:国家高技术研究发展计划(863计划)项目(2011AA1008047);国家自然科学基金青年科学基金项目(31201358)

收稿日期:2014-06-11