不同产地芸豆中矿物元素的因子分析与聚类分析

钱丽丽,李平惠,杨义杰,张东杰 *

(黑龙江八一农垦大学食品学院,黑龙江 大庆 163319)

摘 要:目的:探讨矿物元素指纹分析技术对芸豆产地溯源的可行性。方法:利用电感耦合等离子体质谱法测定不同产地芸豆中20 种矿物元素的含量,并对数据进行因子分析和聚类分析。结果:因子分析结果表明,总方差的50%以上的贡献来自前2 个因子,所对应Mg、Al、V、Cr、Mn、Fe、As、Sr、Y、Sb、Ba、La、Ce、Pr、Nd、Sm、Gd和Ca是芸豆的特征矿物元素。聚类分析结果表明,依安芸豆和拜泉芸豆各属一类。结论:矿物元素指纹图谱技术可用于判别芸豆产地来源。

关键词:芸豆;电感耦合等离子体质谱;矿物元素;因子分析;聚类分析

芸豆是我国传统的药食同源食品,具有提高人体自身免疫力、增强抗病能力等功能,尤其适宜心脏病、动脉硬化、高血脂、低血钾和忌盐患者适用,具有很高的食用和药用价值。黑龙江省是我国芸豆的主要产区之一 [1],在长期的特定地域和气候环境中形成许多地理标志性芸豆如:拜泉芸豆、依安芸豆。2000年拜泉芸豆被绿色食品发展中心授予A级绿色食品。芸豆的品质与其生长的地域和环境密切相关,而矿物元素的含量差异又能反映芸豆生长环境特征。因此,研究不同产地芸豆中矿物元素的含量,结合数据统计学方法对其进行分析比较,对芸豆产地判别具有重要意义。电感耦合等离子体质谱(inductively coupled plasma-mass spectrometry,ICP-MS)法以检测线性范围宽、检出限极低和多元素同时测定等特点在元素含量分析中得到广泛的应用 [2-3]。近年来,国际上应用矿物元素分析技术在奶酪 [4]、葡萄酒 [5]、牛肉 [6]、果汁 [7]、橄榄油 [8]、茶叶 [9]、蜂蜜 [10]产地溯源方面取得了较好的成果。化学计量学在处理来自光谱、质谱分析等现代化分析方法所获得的庞大的数据中发挥着重要作用 [11]。其中因子分析和聚类分析更是数据处理的强有力工具 [12]。因子分析和聚类分析在不同产地绿茶 [13]、枸杞 [14]和各种中草药 [15-16]产地判别中已有报道。本研究主要是采用ICPMS法测定了不同产地芸豆中Mg、Al、Ca、V、Cr、Mn、Fe、As、Se、Sr、Y、Cd、Sb、Ba、La、Ce、Pr、Nd、Sm和Gd的含量,并结合因子分析和聚类分析对测定结果进行分析比较。

1 材料与方法

1.1 材料与试剂

采集黑龙江省齐齐哈尔市依安县、拜泉县2013年度芸豆样品54 份。其中依安县29 份,拜泉县25 份。具体采样情况见表1。

表1 芸豆样本地域来源
Table1 The geographical origins of kidney bean samples

样本数县乡镇村样本数依龙镇民主村、东风村、公平村、德发村、丰收村、德成村、巨龙村、农民村、自新村、永直村10 29依安县新兴镇爱民村、新义村、东太平村、西太平村、治家村、创造村6三兴镇三兴村、保国村、保卫村、全新村、东安村、裕民村6双阳镇东北村、联发村、双信村、德信村、双福村、双星村、长发村7 25拜泉县新生乡青山村三屯、青山村、新生村、自建村4兴国乡兴国村、自立村、自合村、保胜村4富强镇文明村、公平村、成义村、保富村4华光乡华光村、战斗村、自由村3爱农乡国安村、国乐村2三道镇三道村、民心村2建国乡星火村1兴农镇远见村1丰产乡礼让村1上开乡上开村1大众乡自主村1永勤乡永勤村1

浓硝酸(优级纯)、双氧水(优级纯) 北京化学试剂研究所;超纯水(18.2 MΩ·cm) 中国农业科学院农产品加工研究所;浓硫酸(优级纯) 中国计量科学研究所;内标物 美国Agilent公司。

1.2 仪器与设备

Milli-Q超纯水机 美国Millipore公司;Mars 240/50微波消解仪 美国CEM公司;DV4000精确控温电热消解仪 北京安南科技有限公司;7700 ICP-MS仪美国Agilent公司;TB-4002电子天平 北京赛多利斯科学仪器有限公司;1093旋风磨 丹麦Foss Tecator公司。

1.3 方法

参考赵海燕等 [17]方法,称取0.20 g左右芸豆全粉,置于消化管中,加入6 mL浓硝酸和3 mL盐酸,放入微波消解仪中,采用程序升温法进行微波消解。消解后得到澄清透明的溶液,溶液经排酸后用超纯水洗出样品,定容到100 mL,用ICP-MS仪测定样品中Mg、Al、Ca、V、Cr、Mn、Fe、As、Se、Sr、Y、Cd、Sb、Ba、La、Ce、Pr、Nd、Sm和Gd共20 种矿物元素含量。用外标法进行定量分析,以环境标样Part#5183-4680为标准样品,用内标元素Li、Ge、Y、In、Tb和Bi保证仪器的稳定性,当内标元素的相对标准偏差大于5%时,重新测定样品。测试过程中每个样品重复测定3 次。

2 结果与分析

2.1 不同产地芸豆的因子分析

因子分析是多元统计分析降维技术之一,其目的是要用尽可能少的因子来解释原有变量之间的相关性,因此,因子分析要求各变量之间存在较强线性相关性,以从中综合出具有共同特征的公共因子变量来。本实验通过对原有20 个变量进行标准化处理,得出各变量之间的相关系数矩阵 [18]见表2。72%的相关系数大于0.3,20 个原始变量之间直接的相关性比较强,存在信息上的重叠,因而可以用适当的因子模型解释变量之间的关系 [19]

表2 相关系数矩阵
Table2 Correlation matrix

元素MgAlCaVCrMnFeAsSeSrYCdSbBaLaCePrNdSmGd Mg1.0000.5660.4790.5680.2760.5130.6240.6910.5340.3690.5440.4310.3220.4210.3520.4090.3880.2020.3230.374 Al0.5661.0000.3500.5510.4670.2230.5100.6470.3020.4110.4590.2250.2100.3040.4840.4550.3530.2840.1780.353 Ca0.4790.3501.0000.4980.1610.5900.6690.6190.2250.8230.2810.3180.3940.5390.1910.2130.2170.0730.1590.315 V0.5680.5510.4981.0000.7080.4160.5850.8480.2450.4260.7510.2710.3670.3460.7350.8090.7810.5580.4290.674 Cr0.2760.4670.1610.7081.0000.2130.3900.5050.0760.1880.6040.0030.0540.1960.7820.8250.7500.5610.4390.562 Mn0.5130.2230.5900.4160.2131.0000.7070.5070.4350.6330.4810.3060.3140.7850.2810.3210.3600.1860.3300.422 Fe0.6240.5100.6690.5850.3900.7071.0000.7230.4840.6510.4870.3460.4150.6010.3780.3540.4090.1740.3130.453 As0.6910.6470.6190.8480.5050.5070.7231.0000.3650.5530.6970.4330.4490.4730.5960.6390.6250.4510.3810.629 Se0.5340.3020.2250.2450.0760.4350.4840.3651.0000.1840.2140.3720.0880.2240.0130.1310.1730.0480.2250.311 Sr0.3690.4110.8230.4260.1880.6330.6510.5530.1841.0000.3590.2700.2950.7870.2810.2600.2380.2390.2200.300 Y0.5440.4590.2810.7510.6040.4810.4870.6970.2140.3591.0000.4700.1850.4470.7480.7740.7840.5580.5880.649 Cd0.4310.2250.3180.2710.0030.3060.3460.4330.3720.2700.4701.0000.2100.2150.0640.0820.1280.2000.1420.121 Sb0.3220.2100.3940.3670.0540.3140.4150.4490.0880.2950.1850.2101.0000.3710.1540.1860.3300.1520.1070.250 Ba0.4210.3040.5390.3460.1960.7850.6010.4730.2240.7870.4470.2150.3711.0000.3140.3310.3150.2160.3230.367 La0.3520.4840.1910.7350.7820.2810.3780.5960.0130.2810.7480.0640.1540.3141.0000.9440.8360.6420.5440.667 Ce0.4090.4550.2130.8090.8250.3210.3540.6390.1310.2600.7740.0820.1860.3310.9441.0000.8940.6580.5910.732 Pr0.3880.3530.2170.7810.7500.3600.4090.6250.1730.2380.7840.1280.3300.3150.8360.8941.0000.6800.6570.781 Nd0.2020.2840.0730.5580.5610.1860.1740.4510.0480.2390.5580.2000.1520.2160.6420.6580.6801.0000.4830.460 Sm0.3230.1780.1590.4290.4390.3300.3130.3810.2250.2200.5880.1420.1070.3230.5440.5910.6570.4831.0000.684 Gd0.3740.3530.3150.6740.5620.4220.4530.6290.3110.3000.6490.1210.2500.3670.6670.7320.7810.4600.6841.000

从表2的相关矩阵出发,用因子分析解释总方差对原有变量的总体描述,得到特征值和方差分析结果见表3。总方差74.937%的贡献率来自前4 个因子。表4为因子 [20]在方差极大法对因子载荷矩阵旋转后的结果。

从表4可看出,第1个因子和Mg、Al、V、Cr、Mn、Fe、As、Sr、Y、Sb、Ba、La、Ce、Pr、Nd、Sm、Gd的高度正相关;第2个因子表现出和Ca的高度正相关;第3个因子表现出和Se、Cd的高度正相关,总方差50%以上的贡献来自第1个和第2个因子,因此所对应Mg、Al、V、Cr、Mn、Fe、As、Sr、Y、Sb、Ba、La、Ce、Pr、Nd、Sm、Gd和Ca是芸豆的特征微量元素。

表3 因子分析初始解对原有变量总体描述
Table3 Overall statistics of original variables by initial solution from factor analysis

指标总方差方差贡献率/%方差累计贡献率/% 1 9.40447.02047.020 2 3.08515.42662.445 3 1.3586.79069.235 4 1.1405.70274.937 5 0.9314.65779.594 6 0.8484.23983.833 7 0.5592.79786.630 8 0.5072.53789.167 9 0.4902.45091.617 100.3561.77993.396 110.3231.61695.012 120.2241.12296.134 130.1700.84996.983 140.1630.81797.800 150.1470.73498.534 160.1180.59299.126 170.0760.38099.506 180.0500.25199.757 190.0320.15999.916 200.0170.084100.000

表4 方差极大法对因子载荷矩阵旋转后的结果
Table4 Rotated component load matrix by using maximum variance method

元素指标初始因子1初始因子2初始因子3初始因子4 Mg0.6780.3270.406-0.062 Al0.6180.0870.246-0.488 Ca0.5750.591-0.251-0.182 V 0.882-0.1440.054-0.240 Cr0.693-0.487-0.046-0.174 Mn0.6440.487-0.1900.358 Fe0.7420.4640.010-0.039 As0.8790.1560.138-0.239 Se0.3790.3680.5860.327 Sr0.6050.536-0.423-0.060 Y 0.843-0.1950.1300.118 Cd0.3730.3600.4950.096 Sb0.4060.298-0.153-0.217 Ba0.6140.455-0.4210.229 La0.788-0.487-0.119-0.100 Ce0.830-0.487-0.056-0.031 Pr0.829-0.441-0.0480.095 Nd0.601-0.436-0.0510.042 Sm0.616-0.287-0.0220.524 Gd0.773-0.243-0.0260.248

2.2 不同产地芸豆的聚类分析

聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。本实验采用系统聚类分析 [21](欧氏距离结合类间平均链锁法)对不同产地芸豆样品进行聚类分析,以20 种矿物元素含量为变量,应用多元统计学软件SPSS 20.0对样品进行Q型聚类分析(数据标准化采用Z-scores法,即表示计算变量的Z分数标准化后变量的平均值为0,标准差为1)。

聚类分析方法分别采用离差平方和法和欧式距离平方;类内平均连锁法和相关系数距离;类间平均连锁法和欧式距离平方(系统默认方式),聚类结果分别如图1~3所示。

从聚类分析图(图1)可以看出,在不同的聚类标准(距离)下,聚类结果不同。当聚类距离为0 时,每个样本各自聚为1 类。当距离标准逐渐放大时,54 个区域单元被依次聚类。最终,当距离扩大到25时,54 个区域单元被聚为1 类。

图1 离差平方和法和欧式距离平方
Fig.1 Wards method and squared Euclidean distance

从图1可看出,当距离为10时,54 个区域单元被聚为2 大类,1 类为依安芸豆,其中包括2 个拜泉样品归类错误(30、49);2 类为拜泉样品,其中包括4 个依安样品归类错误(2、10、13、24)。

图2 类内平均连锁法和相关系数距离
Fig.2 Within-groups linkage and Pearson correlation

从图2可以看出,当距离为4时,54 个区域单元被聚为5 大类,1 类为拜泉芸豆;2、3 类为依安样品;4 类为拜泉,其中包括2 个依安样品归类错误(6、18);5 类没有将依安、拜泉样品区分开来。

从图3可以看出,当距离为4时,则54个区域单元被聚为3 大类,1、2 类为拜泉样品,其中包括4 个依安样品归类错误(10、24、2、13),虽然10、24号依安样品分类错误,但与其他拜泉相比,两者相关性较大;3 类为依安样品,其中包括2 个拜泉样品归类错误(30、49)。

由以上聚类分析结果可以看出:运用离差平方和法和欧式距离平方;类间平均连锁法和欧式距离平方(系统默认方式)这2 种聚类方法很好地区分依安芸豆和拜泉芸豆。虽然聚类过程中个别样品出现归类错误,但大多数芸豆产地的区分取得了较好的效果。类内平均连锁法和相关系数距离聚类方法对芸豆产地的区分效果不理想。聚类分析作为一种探索性的分类方法,可以将一组数据按照本身的内在规律较合理的分为几类,这就大大缩小了以往全凭主观判断所造成的误差,使数据分析结果更具客观性 [22]

图3 类间平均连锁法和欧式距离平方(系统默认方式)
Fig.3 Between-groups linkage and squared Euclidean distance(The system default mode)

3 结 论

利用ICP-MS法测定了依安和拜泉两地芸豆中矿物元素Mg、Al、Ca、V、Cr、Mn、Fe、As、Se、Sr、Y、Cd、Sb、Ba、La、Ce、Pr、Nd、Sm和Gd的含量,并运用SPSS 20.0中的因子分析和聚类分析对其进行分析研究。因子分析结果表明Mg、Al、V、Cr、Mn、Fe、As、Sr、Y、Sb、Ba、La、Ce、Pr、Nd、Sm、Gd和Ca是芸豆的特征矿物元素。不同产地芸豆中矿物元素含量有各自的地域性特征,这种地域特征源于植物体所处的生长环境,不同种植区域内栽种方式、大气环境、人类活动不同导致不同产地芸豆所含矿物元素含量存在明显地域性差别。系统聚类分析结果表明:依安芸豆和拜泉芸豆各属一类。离差平方和法和欧式距离平方,类间平均连锁法和欧式距离平方(系统默认方式)对芸豆产地的区分效果优于类内平均连锁法和相关系数距离。因此,通过对芸豆中矿物元素含量的测定,运用因子分析和系统聚类分析可以区分芸豆产地来源,此方法为芸豆产地判别研究提供了一种快速、准确、可靠的检验方法。

参考文献:

[1] 王强, 张亚芝, 魏淑红, 等. 黑龙江省芸豆生产现状与产业化发展[J]. 中国种业, 2008(4): 11-12.

[2] 李磊, 谢明勇, 吴熙鸿, 等. 用MAP-ICP-MS测定保健食品青钱柳及其浸提物中多种矿质营养素的研究[J]. 食品科学, 2000,21(2): 53-57.

[3] ILIA R, THOMAS R, ASA H. Comparison of two digestion methods for elemental determinations in plant material by ICP techniques[J]. Analytica Chimica Acta, 1999, 378: 191-200.

[4] KORENOVSKA M, SUHA J M. Identification of Slovakian, Polish,and Romanian bryndza cheeses origin by factor analysis of some elemental data[J]. European Food Research and Technology, 2007,225(5/6): 707-713.

[5] GONZALVEZ A, LLORENS A, CERVERA M L, et al. Elemental fingerprint of wines from the protected designation of origin Valencia[J]. Food Chemistry, 2009, 112(1): 26-34.

[6] FRANKE B M, HALDIMANN M, GREMAUD G. Element signature analysis: its validation as a tool for geographic authentication of the origin of dried beef and poultry meat[J]. European Food Research and Technology, 2008, 227(3): 701-708.

[7] GARCIA-RUIZ S, MOLDOVAN M, FORTUNATO G, et al. Evaluation of strontium isotope abundance ratios in combination with multi-elemental analysis as a possible tool to study the geographical origin of ciders[J]. Analytica Chimica Acta, 2007, 590(1): 55-66.

[8] BENINCASA C, LEWIS J, PERRI E, et al. Determination of trace element in Italian virgin olive oils and their characterization according to geographical origin by statistical analysis[J]. Analytica Chimica Acta, 2007, 585(2): 366-370.

[9] PILGRIM T S, WATLING R J, GRICE K. Application of trace element and stable isotope signatures to determine the provenance of tea (Camellia sinensis) samples[J]. Food Chemistry, 2010, 118(4):921-926.

[10] CHUDZINSKA M, BARALKEWICZ D. Estimation of honey authenticity by multielements characteristics using inductively coupled plasma-mass spectrometry (ICP-MS) combined with chemometrics[J]. Food and Chemical Toxicology, 2009, 48(1): 284-290.

[11] 黎先春, 王小如. 中药材GAP实施过程中的关键分析技术[M]. 厦门:厦门大学出版社, 2002: 296.

[12] FARNHAM I M, JOHANNESSON K H, SINGH A K, et al. Factor analytical approaches for evaluating groundwater trace element chemistry data[J]. Analytica Chimica Acta, 2003, 490: 123-138.

[13] 王建程. 浙江和福建绿茶中微量元素的聚类分析研究[J]. 中国测试技术, 2007(3): 126-130.

[14] 史秀红, 常璇, 袁毅, 等. 不同产地枸杞微量元素的因子分析与聚类分析[J]. 安徽农业科学, 2010(4): 1839-1841.

[15] 赵旭升. 7 种安神类中草药中微量元素的因子分析和聚类分析[J].微量元素与健康研究, 2008, 25(4): 24-26.

[16] 徐敏, 万德光. 川黄柏中微量元素的主成分分析和聚类分析[J]. 时珍国医国药, 2008, 19(1): 151-153.

[17] 赵海燕, 郭波莉, 张波, 等. 小麦产地矿物元素指纹溯源技术研究[J].中国农业科学, 2010, 43(18): 3817-3823.

[18] 中国科学院植物研究所. 中国高等植物图鉴: 1-5册, 补编1-2册[M].北京: 科学出版社, 2002: 163-167.

[19] 中国植物志编委会. 中国植物志[M]. 北京: 科学出版社, 2011:1961-2004.

[20] 林海明, 张文霖. 主成分分析与因子分析的异同和SPSS软件: 兼与刘玉玫, 卢纹岱等同志商榷[J]. 统计研究, 2005, 22(3): 65-69.

[21] 赵瑞蕊, 何结望, 王海明, 等. 基于主成分和聚类分析的湖北烤烟物理质量指标综合评价[J]. 中国烟草科学, 2012, 33(4): 90-94.

[22] 李永健, 方肇勤. 聚类分析在中医药研究中的应用与思考[J]. 南京中医药大学学报: 自然科学版, 2001, 17(3): 182-184.

Factor Analysis and Clustering Analysis of Trace Elements in Kidney Beans from Different Producing Areas

QIAN Lili, LI Pinghui, YANG Yijie, ZHANG Dongjie *
(College of Food Science, Heilongjiang Bayi Agricultural University, Daqing 163319, China)

Abstract:Objective: To examine the feasibility of multi-element analysis in identifying the geographical origin of kidney bean. Method: The concentrations of 20 chemical elements were determined using inductively coupled plasma-mass spectrometry (ICP-MS) in kidney bean from different producing areas, and factor analysis and clustering analysis were applied to analyze the obtained data. Results: The factor analysis results showed that the first and second factors accounted for more than 50% of the total variance, indicating that Mg, Al, V, Cr, Mn, Fe, As, Sr, Y, Sb, Ba, La, Ce, Pr, Nd, Sm,Gd and Ca are the characteristic multi-elements in kidney bean. The results of clustering analysis showed that Yi'an and Baiquan kidney bean belonged to two different categories. Conclusion: Mineral elements fingerprinttechnique can be used for discrimination of the origin of kidney bean.

Key words:kidney bean; inductively coupled plasma-mass spectrometry (ICP-MS); mineral element; factor analysis;clustering analysis

中图分类号:TS21

文献标志码:A

文章编号:1002-6630(2015)14-0102-05

doi:10.7506/spkx1002-6630-201514020

收稿日期:2014-11-14

基金项目:国家杂粮工程技术开发项目(2011FU125X07);黑龙江省高等学校科技创新团队建设计划项目(2014TD006)

作者简介:钱丽丽(1979—),女,副教授,博士,研究方向为农产品质量安全。E-mail:qianlili286@163.com

*通信作者:张东杰(1966—),男,教授,博士,研究方向为农产品质量安全与控制。E-mail:byndzdj@126.com