鸡胴体表面稀释污染物的连续投影-多元线性回归-受试者特性分析检测

吴 威,吴明清,陈桂云,于镇伟,陈坤杰*

(南京农业大学工学院,江苏 南京 210031)

摘 要:建立基于连续投影算法(successive projections algorithm,SPA)-多元线性回归(multiple linear regression,MLR)-受试者特性(receiver operating characteristic,ROC)分析鸡胴体表面稀释污染物识别方法。首先采用高光谱成像系统获取了20 个涂有稀释污染物的鸡胴体图像,再利用SPA从1 232 个波长中提取出10 个特征波长,然后通过MLR方法构建识别函数和特征波长光谱值之间的回归模型,最后通过ROC分析方法,确定出能够获得高真阳性率(true positive rate,TPR)和低假阳性率(false positive rate,FPR)的最佳分类阈值,并据此对鸡胴体表面稀释后的污染物进行检测。结果显示,利用SPA-MLR-ROC分类器检测20 个污染鸡胴体样本,检出污染区域的TPR达到98.08%,FPR仅为0.39%,高于波段比算法以及双波段算法检测相同样本的准确率,可见,SPA-MLRROC分类器方法检测鸡胴体表面稀释污染物获得了较好的效果,但由于样本数量有限,还需要具有较大样本量的研究来进一步验证此方法检测结果的稳定性。

关键词:连续投影-多元线性回归-受试者特性分析;分类器;污染物;高光谱图像;鸡胴体

在我国,鸡肉是仅次于猪肉的第二大肉类消费品。近20年来,鸡肉产量以每年平均5%~6%的速度持续增长[1],在这些规模化生产加工过程中,鸡胴体极易受到血液、胆汁、以及十二指肠、盲肠中的粪便等污染[2-6]。研究发现从商业屠宰厂提取的肉鸡样品中,95%~99%的鸡胃中弯曲杆菌的检测结果为阳性[7],肉鸡胃中的大肠杆菌含量为4.4(lg(CFU/g))[8],这些含有致病菌的消化道内容物在肉鸡屠宰过程中可能会残留在鸡胴体表面。研究表明即使少量的盲肠粪便(5 mg)也会引起鸡胴体表面弯曲杆菌数量上的显著增加[9]。因此将受到污染的鸡胴体检测出来,并进行适当的处理是十分必要的。

人工及生化检测无法实现污染物的在线自动检测。高光谱图像同时具有光谱和图像信息,并且光谱分辨率很高,可以提供识别物质特征的丰富信息,因此被广泛地应用于鸡肉检测领域,如利用高光谱图像技术可以检测鸡胸肉菌落总数[10]、预测新鲜鸡肉弹性[11]、定量检测鸡肉中挥发性盐基氮含量[12]、快速检测鸡肉表面脯氨酸含量[13]以及检测鸡胚胎性别[14]等。

国内外的研究表明高光谱图像技术可以成功地检测出鸡胴体表面的污染物,这些研究通常选取2~3 个特征波长,利用特征波长之间的波段比图像进行图像处理[2-3,15-20],从而实现污染物的识别,如文献[2,15-19]均采用565/517 nm的波长比图像进行污染物的识别,文献[3,20]在565/517 nm的波长比图像处理的基础上增加了802 nm波长处的图像去除假阳性点。

既有研究的对象大多是从鸡肠道中直接提取的粪便污染物[2-3,15-20],但在实际的肉鸡屠宰加工过程中,鸡胴体表面的水分会将残留在胴体表面的污染物稀释,可见度很差,很难被人眼及普通的机器视觉识别。为了识别稀释后的低可见污染物,陈坤杰等[21]提出一种双波段的鸡胴体表面稀释污染物检测方法,对鸡胸腹局部区域残留稀释污染物的检测真阳性率(true positive rate,TPR)可以达到81.6%。但这种方法检测范围过小,真阳性率也还有待提高。

本实验试图构建一种光谱学方法,通过光谱建模而不是图像处理的方法精确提取低可见检测目标的特征,以实现鸡胴体表面稀释污染物的精确识别。首先通过连续投影算法(successive projections algorithm,SPA)选择相关性最小的特征波长,然后利用多元线性回归(multiple linear regression,MLR)构建特征波长图像中的反射率与识别函数之间的对应关系,再通过受试者特性(receiver operating characteristic,ROC)分析方法选择分类阈值,最后将识别效果与既有研究中普遍采用的波段比算法[2-3,15-20],以及文献[21]提出的双波段检测方法进行对比。

1 材料与方法

1.1 材料

2015年12月从雨润肉鸡加工厂购买20 只45 d的白羽鸡鸡胴体,鸡胴体为随机挑选。在实验室人工将内脏取出,并将肠道分离出来。每个鸡胴体表面的污染物都是取自该胴体本身。

使用移液管从每个鸡胴体分别抽取十二指肠和盲肠粪便各1 mL,从腹腔中抽取血液1 mL,从胆囊中抽取胆汁1 mL,放入不同的玻璃培养皿中。再分别抽取与污染物等体积的清水与污染物混合,分别制成稀释的污染样本,随机涂布在鸡胴体表面。

每个鸡胴体表面涂布的污染区域数量最少6 个,最多16 个,20 个鸡胴体表面共计有208 个污染区域。由于稀释后的污染物流动性强,无法使得所有污染区域面积保持一致,污染区域的面积在232 个像素和4 200 个像素之间。4 种污染区域(十二指肠粪便、盲肠粪便、胆汁和血液)的平均面积分别为1 501、1 354、1 630、1 421 个像素。

1.2 方法

1.2.1 高光谱图像系统

实验采用的高光谱成像系统由图像采集单元、照明单元和电动平移台构成,如图1所示。图像采集单元包括一台Raptor EM285CL高感度EMCCD相机、光谱范围为358~1 021 nm的Imspector V10E线扫描成像光谱仪。照明单元为配有Ocean Optics HL-2000线性光导管组以及光纤和聚光镜的卤素光源,位于电动平移台上方220 mm处,垂直于电动平移台的轨道。电动平移台由一台计算机控制,计算机中安装高光谱系统自带软件Spectral Image(台湾五铃光学股份有限公司),用于控制曝光时间、电动平移台的速度、光源亮度等。

将鸡胴体胸腹部向上,放在一个蒙着黑布的托盘上,再将托盘放在高光谱图像系统电动平移台上,进行高光谱图像采集。设定电动平移台速率为1.3 mm/s,相机曝光时间为380 ms,进行逐行扫描,采集得到20 个鸡胴体图像样本,以raw格式存储于计算机。每个高光谱图像都包含空间信息(x,y)和光谱信息(z)。x方向像素为1 632;由于鸡胴体大小不同,扫描时间不同,因此y方向的像素在600~1 000之间;z方向为358~1 021 nm,共有1 232 个波长。图像和数据的分析处理运用了ENVI4.8可视化图像处理平台(美国Exelis VIS公司)和MATLAB R2009a矩阵实验室(美国MathWorks公司)软件。

图1 高光谱图像系统的实景图
Fig. 1 Picture of the hyperspectral imaging system

1.2.2 训练集和验证集的选取

将获取的高光谱图像进行黑白校正,校正方程[22]如公式(1)所示:

式中:I为校正后图像;I0为从高光谱图像系统中获取的原始图像;W为在与获取样本图像相同拍摄条件下,拍摄标准白板获得了白色参考图像;为了去除相机传感器暗电流的影响,在相机镜头关闭状态下拍摄了暗参考图像B。黑白校正后的图像用于模型训练以及算法验证。

采用ENVI软件中的感兴趣区(region of interesting,ROI)工具手工选取训练集像素。任选10 个鸡胴体高光谱图像,随机选取60 个污染区域(其中包括12 个盲肠粪便污染区域、17 个十二指肠粪便污染区域、18个血液污染区域、以及13 个胆汁污染区域)和57 个洁净皮肤区域。污染区域和洁净皮肤区域的平均面积分别为1 354 个像素和2 200 个像素。统计每一个区域中所有像素的平均光谱,将此117 个平均光谱作为训练集。训练集像素的光谱保存在一个矩阵中,矩阵中的前1 232 列代表样本在1 232 个波长下的相对反射率,最后一列定义为识别函数值y。污染区域像素的y值指定为1,而非污染区域像素的y值指定为0;然后再利用ENVI的ROI工具,手工选取所有20 个高光谱图像中的208 个污染区域,和胴体表面所有非污染区域作为验证集像素。提取每个验证集像素特征波长下的光谱作为验证集数据,检验分类器的分类性能。

1.2.3 SPA-MLR-ROC分类器算法

1.2.3.1 SPA-MLR-ROC分类器算法流程

图2 构建及评估SPA-MLR- ROC分类器的流程图
Fig. 2 Flow chart of successive projections algorithm (SPA)-multivariable linear regression (MLR)-receiver operating characteristic curve (ROC) classifier algorithm and model evaluation

构建及评估SPA-MLR-ROC分类器的整体流程如图2所示。SPA选出特征波长,特征波长光谱与识别函数之间的对应关系由MLR构建,通过ROC方法选择分类的最优阈值,最后将SPA-MLR-ROC分类器识别效果与既有研究中的方法进行比较。

1.2.3.2 SPA选择特征波长

SPA是一种十分有效的变量选择方法,可以从众多的高光谱波长图像中选取具有最小线性关系的波长,以此去除全波长模型的共线性[23]

SPA包括两个阶段[24],第1个阶段是从任选的1 个波长开始,通过向剩余波长光谱矩阵连续投影,每次投影选出来的波长都与前面选出的波长的反射率之间具有最小的共线性。训练集中一共有117 个样本光谱,因此选出的特征波长数量的最大值不能大于116。投影前任意选取的波长有1 232 种可能,因此会产生116×1 232 个备选波长链。

SPA的第2个过程是从所有的备选波长链中选出最优集合。Galvao等[24]研究发现F快速检测可以用来移除那些对预测结果作用不大的变量,以此增加模型的简约性。计算包含不同数量波长的每种组合的均方根误差(rootmean-square error,RMSE),如式(2)所示:

式中:xi为第i次投影选出的特征波长的光谱信息;x表示该组合所有波长下的平均光谱;n为此波长链的波长数量。选出比RMSE的最小值稍大的RMSE作为决定值,其对应组合的波长数量的最小值即为通过SPA选出的特征波长的数量。

将训练集中污染区域的60 个平均光谱和非污染区域的57 个平均光谱输入到SPA算法中,按照F检验法进行显著性检验,选择显著性水平α为0.25[24],获得通过SPA选出的特征波长。

1.2.3.3 MLR回归建模

利用多元线性回归模型构建特征光谱与识别函数之间的回归关系,如(3)式所示,

y=β0+β1x1+β1x2+…βpxp(3)

式中:y为识别函数;xp为SPA选出的第p个特征波长下的相对反射率;βp为回归系数;p为SPA选出的特征波长的数量。

1.2.3.4 ROC阈值选择

将117 个训练集区域中所有像素的特征波长光谱值代入MLR模型后,实际获得的识别函数预测值是处于某一区间范围内的离散量,但可能取值的数量远远大于待分类数量,需要设置一个阈值T进行归类处理。识别函数预测值如果大于阈值T,则相应的分类结果被指定为y=1,即被检测的像素被判断处于污染区域。反之,如果识别函数预测值小于阈值T,则分类器给出的分类结果为y = 0,则该像素被认为出自非污染区域。

检测结果的TPR[25]定义为所有检测出的污染区域数量与实际污染区域数量的比值。TPR是按区域定义的,因为检测目标是稀释污染物,污染区域有很多稀释污染物和皮肤的混合像元,不可能将一个区域中的所有像素都检测出来,因此如果一个区域中有大于50 个像素被检出,这个区域就被标记为污染区域;如果一个像素实际为非污染区域像素,但却被分类器判定为污染区域像素,这样的像素称为假阳性点。假阳性点的数量与实际非污染区域总的像素的比值定义为假阳性率(false positive rate,FPR)。FPR定义在像素级,是由于非污染区域是一个整体区域,无法将FPR定义在区域级。

性能优越的分类器或分类模型应具有高的TPR以及低的FPR。通常一个阈值的选择需要在高TPR与低FPR之间找到一个平衡点。ROC图像可以综合反映敏感性和特异性的双重属性[26]。ROC图像以TPR为纵坐标,以FPR为横坐标,通过设定多个不同的阈值绘制成曲线或分立点,以此直观、形象地揭示TPR和FPR的相互关系。在ROC图像上,最靠近左上角的点(TPR=1,FPR=0)对应的阈值即为最优阈值。

1.2.3.5 检测结果可视化

为了直观地了解分类器的性能,将分类器检测出的阳性点标记出来,而非污染区不加以标记,这样检测结果的可视化图中就可以直观地观察到检测出的污染区域的数量和位置。可视化的具体做法如下[27]:根据验证集中所有像素的特征光谱信息,应用SPA-MLR-ROC分类器进行分类,将检测出的阳性像素的位置坐标信息输入到MATLAB的plot函数,并将其标记出来。检测结果图中会有一些由于皮肤褶皱或者组织连接处的阴影所造成的假阳性点,这些假阳性点通常面积较小。在MATLAB中,通过区域标记的方法[28],标记出检测结果图中所有的连通区域,保留所有面积大于50 个像素的连通区域,这样便可以去除那些面积较小的假阳性点[29]

1.2.4 用于对比的检测算法

1.2.4.1 波段比算法

既有研究中多采用主成分分析选择特征波长,按照主成分载荷最大的原则选出两个特征波长λ1为517 nm和λ2为565 nm[2-3,5-6,16,18-20,30],在565/517 nm的波段比图像中采用图像处理识别污染物。然后利用单线性回归确定第3个特征波长λ3为803 nm,其中B为辨别函数(对于污染区域B为1,非污染区域B为0),通过517 nm和802 nm波段比图像消除假阳性点[3,16,19]

1.2.4.2 双波段算法

前期研究[21]提出的基于高光谱成像技术的双波段检测算法也是用来检测鸡胴体表面低可见污染物的方法。双波段检测算法利用一个特征波长下的图像进行区域生长,生长后的区域即为鸡胴体的胸腹部,将其作为掩膜。掩膜与污染物可分辨度最大的特征波长图像进行“与”操作,提取出最大面积的鸡胴体待检ROI,最后利用标记法识别出ROI内有污染物存在的鸡胴体,可以检测出鸡胴体表面81.6%的污染区域。

2 结果与分析

2.1 构建的SPA-MLR-ROC模型

连续投影过程中,各个波长链的RMSE中最小值为0.256 99,比其稍大的RMSE的波长链中波长的数量为10,波长链中的波长为369、371、376、393、413、451、579、596、937、1 021 nm,即为通过SPA选出的特征波长。

通过多元线性回归模型构建的识别函数y与特征波长光谱之间的线性回归关系如公式(4)所示:

式中:x为各个特征波长下的相对反射率。

图3 不同阈值产生的ROC图
Fig. 3 ROC plot created with different thresholds.

将选出的117 个区域中所有像素的特征光谱值代入回归方程,获得的识别函数值范围在-1.5~1.5之间。采用ROC分析方法,在-1.5~1.5之间每隔0.1选择一个阈值,计算每一个阈值对应的TPR 和 FPR,绘制ROC图(图3),可见,最优阈值出现在T为1.3时,此时分类器获得最优性能(TPR=100%和FPR=0.43%)。

2.2 SPA-MLR-ROC分类器检测结果

任选一个涂有污染物的鸡胴体(图4a),利用SPAMLR-ROC分类器检测此胴体高光谱图像中所有像素点,其检测结果见图4b。可见,所有污染区域均被检测出来,图像右下角的皮肤淤血也被检测出来。

图4 涂有污染物的鸡胴体的彩色图像(a)和通过SPA-MLR-ROC分类器获得的检测结果可视化图(b)
Fig. 4 Original image of contaminated carcass and visual results obtained by SPA-MLR-ROC classifier

SPA-MLR-ROC分类器检测所有20 个鸡胴体表面的208 个污染区域,结果显示204 个污染区域被检出,污染区域的TPR为98.08%,在像素级别FPR为0.385%。

2.3 既有算法的检测结果

2.3.1 波段比算法的检测结果

对训练集数据进行主成分分析,分析结果显示前3 个主成分占总体光谱变量的97.41%,提取出载荷最大的3 个波长:400、452 nm和679 nm。3 个特征波长相互组合,构成波段比图像,其中污染区域识别度最高的是679/452 nm。单线性回归选取出去除噪声的特征波长为516 nm。利用波段比算法检测图4a中鸡胴体的检测结果如图5a所示。

图5 两个既有算法的检测结果图
Fig. 5 Results obtained by two existing algorithms

利用波段比算法检测所有20 个鸡胴体,污染区域检测的TPR为80.15%,像素级别FPR为0.042%。2.3.2 双波段算法的检测结果

按文献[21]提出的可识别度定义,计算所有波长下图像的可识别度,得到可识别度最大的波长为400 nm;掩膜选择参数最大值出现在675 nm。利用双波段算法检测图4a中鸡胴体的检测结果如图5b所示。

对于20 个验证集中的鸡胴体,双波段算法检测污染区域的TPR为82.37%,像素级别FPR为0.895%。

3 讨 论

性能优越的检测算法应该具有高的TPR,以及低的FPR。因此用3 种算法(SPA-MLR-ROC分类器、波段比算法以及双波段检测算法)分别检测验证集中所有的鸡胴体样本,比较三者的检测性能。

统计3 种检测方法对每只鸡检测的TPR和FPR,20 个鸡胴体检测结果的统计分析如表1所示。由表可见:1)SPA-MLR-ROC分类器的区域TPR远高于波段比算法和双波段检测算法,原因是SPA选取的10 个特征波长保留了更多的污染区域特征光谱信息,使得污染区域TPR大大提高;并且特征光谱信息能最大程度地区分污染区域和皮肤区域,使得SPA-MLR-ROC分类器可以将整个鸡胴体作为检测范围,将胸腹部以外(如鸡腿部)的污染区域也检测出来,而不必担心鸡胸腹部与翅膀以及鸡腿连接处的阴影造成的假阳性点。对比图4和图5b,可见,SPAMLR-ROC分类器检出了双波段检测算法没有检出的鸡腿部的十二指肠粪便和盲肠粪便污染,以及鸡身上的淤血(图5b黑色背景区域中用虚线椭圆标出的3 个区域);SPA-MLR-ROC分类器也检出了波段比算法没有检出的鸡腿部的十二指肠粪便,以及胴体胸腹部的胆汁污染区以及淤血区域(图5a中虚线椭圆标出的5 个区域)。2)SPA-MLR-ROC分类器的像素级FPR仅有0.385%,不到双波段算法FPR的一半。虽然SPA-MLR-ROC分类器的FPR稍大于波段比算法,但是SPA-MLR-ROC分类器的TPR也远大于波段比算法,而作为一种识别算法,高的TPR尤为重要。3)SPA-MLR-ROC分类器的检测结果中,TPR和FPR的标准偏差都小于波段比算法以及双波段算法,证明了SPA-MLR-ROC分类器检测性能更加稳定。

综上所述,SPA-MLR-ROC分类器算法与双波段检测算法以及波段比算法相比,不仅具有高TPR同时具有低FPR,因此是一个性能稳定、检测效果好的分类器。

表1 SPA-MLR-ROC分类器与波段比算法以及双波段检测算法在TPR和FPR方面的检测结果对比
Table 1 Comparison in detection results of the SPA-MLR-ROC classifier and the band ratio algorithm as well as the dual-band algorithm in terms of true positive rate (TPR) and false positive rate (FPR)

4 结 论

本实验提出了一种用于精确提取鸡胴体表面污染物特征的SPA-MLR-ROC分类器方法,研究了SPAMLR-ROC分类器检测鸡胴体表面稀释污染物的可行性。研究发现SPA从1 232 个高光谱波长中选取的10 个(369、371、376、393、413、451、579、596、937、1 021 nm)最优的特征波长,能够精确提取污染物的特征。SPA-MLR-ROC分类器能够根据高光谱图像中的每一个像素的10 个特征光谱信息,给出每一个像素的识别结果。SPA-MLR-ROC分类器对20 个鸡胴体表面的污染区域的TPR可以达到98.08%,而检出的FPR仅有0.385%。相比波段比算法大大提高了检测TPR;相比双波段检测算法,扩大了检测范围、提高了检测精度。由此可见,采用SPA-MLR-ROC分类器可以更好地实现对鸡胴体表面低可见污染物的精确检测。本实验注重方法研究,其检测结果的稳定性还需要更多的鸡胴体样本加以验证,同时还需要继续研究在实际生产线上利用多光谱相机代替高光谱相机后的检测速度与检测效果。

参考文献:

[1] 夏芳. 白羽肉鸡行业迎来复苏[J]. 农产品市场周刊, 2016(3)∶ 15-17.DOI∶10.3969/j.issn.1009-8070.2016.03.009.

[2] PARK B, LAWRENCE K C, WINDHAM W R, et al. Hyperspectral imaging for detecting fecal and ingesta contaminants on poultry carcasses[J]. Transactions of the Asae, 2002, 45(6)∶ 2017-2026.DOI∶10.13031/2013.11413.

[3] HEITSCHMIDT G, PARK B, LAWRENCE K, et al. Improved hyperspectral imaging system for fecal detection on poultry carcasses[J]. Transactions of the Asabe, 2007, 50(4)∶ 1427-1432.DOI∶10.13031/2013.23615.

[4] WINDHAM W R, HEITSCHMIDT G W, LAWRENCE K C, et al.Effect of spectrally mixed hyperspectral image pixels on detection of cecal contaminated broiler carcasses[J]. International Journal of Poultry Science, 2007, 6(12)∶ 955-959. DOI∶10.3923/ijps.2007.955.959.

[5] 赵进辉, 涂冬成, 欧阳静怡, 等. 利用高光谱图像技术检测鸡胴体内部粪便污染物[J]. 江西农业大学学报, 2011, 33(3)∶ 573-577.DOI∶10.3969/J.ISSN.1000-2286.2011.03.030.

[6] 赵进辉, 吁芳, 吴瑞梅, 等. 基于分段主成分分析与波段比的鸡胴体表面粪便污染物检测[J]. 激光与光电子学进展, 2011(7)∶ 163-167.DOI∶10.3788/lop48.073001.

[7] MUSGROVE M T, BERRANG M E, BYRD J A, et al. Detection of Campylobacter spp. in ceca and crops with and without enrichment[J].Poultry Science, 2001, 80(6)∶ 825-828. DOI∶10.1093/PS/80.6.825.

[8] BERRANG M E, BUHR R J, CASON J A. Campylobacter recovery from external and internal organs of commercial broiler carcass prior to scalding[J]. Poultry Science, 2000, 79(2)∶ 286-290. DOI∶10.1093/PS/79.2.286.

[9] BERRANG M E, SMITH D P, WINDHAM W R, et al. Effect of intestinal content contamination on broiler carcass campylobacter counts[J]. Journal of Food Protection, 2004, 67(2)∶ 235-238.DOI∶10.4315/0362-028X-67.2.235.

[10] JIANG F C, LONG Y, TANG X Y, et al. Detection of the total viable counts in chicken based on visible/near-infrared spectroscopy[C]//Proceedings of spie-the international society for optical engineering.International society for optics and photonics, 2014, 9108∶ 91080S.DOI∶10.1117/12.2053201.

[11] XIONG Z J, SUN D W, DAI Q, et al. Application of visible hyperspectral imaging for prediction of springiness of fresh chicken meat[J]. Food Analytical Methods, 2015, 8(2)∶ 380-391. DOI∶10.1007/S12161-014-9853-3.

[12] 赵杰文, 惠喆, 黄林, 等. 高光谱成像技术检测鸡肉中挥发性盐基氮含量[J]. 激光与光电子学进展, 2013(7)∶ 158-164. DOI∶10.3788/LOP50.073003.

[13] XIONG Z J, SUN D W, XIE A G, et al. Potential of hyperspectral imaging for rapid prediction of hydroxyproline content in chicken meat[J]. Food Chemistry, 2015, 175∶ 417-422. DOI∶10.1016/j.foodchem.2014.11.161.

[14] GÖHLER D, FISCHER B, MEISSNER S. In-ovo sexing of 14-day-old chicken embryos by pattern analysis in hyperspectral images (vis/Nir spectra)∶a non-destructive method for layer lines with gender-specific down feather color[J]. Poultry Science, 2017, 96(1)∶ 1-4. DOI∶10.3382/ps/pew282.

[15] PARK B, LAWRENCE K C, WINDHAM W R, et al. Multispectral imaging system for fecal and ingesta detection on poultry carcasses[J].Journal of Food Process Engineering, 2004, 27(5)∶ 311-327.DOI∶10.1111/j.1745-4530.2004.00464.x.

[16] WINDHAM W R, SMITH D P, BERRANG M E, et al. Effectiveness of hyperspectral imaging system for detecting cecal contaminated broiler carcasses[J]. International Journal of Poultry Science, 2005,4(9)∶ 657-662. DOI∶10.3923/ijps.2005.657.662.

[17] YOON S C, LAWRENCE K C, PARK B, et al. Optimization of fecal detection using hyperspectral imaging and kernel density estimation[J]. Transactions of the ASABE, 2007, 50(3)∶ 1063-1071.DOI∶10.13031/2013.23120.

[18] PARK B, YOON S-C, WINDHAM W R, et al. Line-scan hyperspectral imaging for real-time in-line poultry fecal detection[J].Sensing and Instrumentation for Food Quality and Safety, 2011, 5(1)∶25-32. DOI∶10.1007/s11694-011-9107-7.

[19] YOON S C, PARK B, LAWRENCE K C, et al. Line-scan hyperspectral imaging system for real-time inspection of poultry carcasses with fecal material and ingesta[J]. Computers and Electronics in Agriculture, 2011, 79(2)∶ 159-168. DOI∶10.1016/j.compag.2011.09.008.

[20] WINDHAM W R, HEITSCHMIDT G W, SMITH D P, et al. Detection of ingesta on pre-chilled broiler carcasses by hyperspectral imaging[J].International Journal of Poultry Science, 2005, 43(12)∶ 10157-10163.DOI∶10.3923/ijps.2005.959.964.

[21] 吴威, 陈桂云, 夏建春, 等. 鸡胴体表面低可见污染物的双波段检测方法研究[J]. 光谱学与光谱分析, 2014, 34(12)∶ 3363-3367.DOI∶10.3964/j.issn.1000-0593(2014)12-3363-05.

[22] 邹小波, 李志华, 石吉勇, 等. 高光谱成像技术检测肴肉新鲜度[J]. 食品科学, 2014, 35(8)∶ 89-93. DOI∶10.7506/spkx1002-6630-201408017.

[23] ARAÚJO M C U, SALDANHA T C B, GALVÃO R K H, et al. The successive projections algorithm for variable selection in spectroscopic multicomponent analysis[J]. Chemometrics & Intelligent Laboratory Systems, 2001, 57(2)∶ 65-73. DOI∶10.1016/S0169-7439(01)00119-8.

[24] GALVÃO R K H, ARAÚJO M C U, FRAGOSO W D, et al. A variable elimination method to improve the parsimony of MLR models using the successive projections algorithm[J]. Chemometrics and Intelligent Laboratory Systems, 2008, 92(1)∶ 83-91. DOI∶10.1016/j.chemolab.2007.12.004.

[25] YUAN Y, FANG J W, WANG Q. Online anomaly detection in crowd scenes via structure analysis[J]. IEEE Transactions on Cybernetics,2015, 45(3)∶ 548-561. DOI∶10.1109/TCYB.2014.2330853.

[26] METZ C E. Basic principles of roc analysis[J]. Seminars in Nuclear Medicine, 1978, 8(4)∶ 283-298. DOI∶10.1016/S0001-2998(78)80014-2.

[27] WU D, SHI H, WANG S J, et al. Rapid prediction of moisture content of dehydrated prawns using online hyperspectral imaging system[J].Analytica Chimica Acta, 2012, 726(9)∶ 57-66. DOI∶10.1016/j.aca.2012.03.038.

[28] STEFANO L D, BULGARELLI A. A simple and efficient connected components labeling algorithm[C]//Image analysis and processing,1999∶ 322-327. DOI∶10.1109/ICIAP.1999.797615.

[29] WU W, CHEN G Y, WU M Q, et al. Detection of diluted contaminants on chicken carcasses using a two-dimensional scatter plot based on a two-dimensional hyperspectral correlation spectrum[J]. Applied Optics, 2017, 56(9)∶ 72-78. DOI∶10.1364/AO.56.000D72.

[30] PARK B, LAWRENCE K C, WINDHAM W R, et al. Assessment of hyperspectral imaging system for poultry safety inspection[J].Proceedings of Spie, 2003, 4879∶ 269-279. DOI∶10.1117/12.462394.

Successive Projections Algorithm-Multiple Linear Regression-Receiver Operating Characteristic Analysis for Diluted Contaminant Identification on Chicken Carcasses

WU Wei, WU Mingqing, CHEN Guiyun, YU Zhenwei, CHEN Kunjie*
(College of Engineering, Nanjing Agricultural University, Nanjing 210031, China)

Abstract:This paper presents a method for the identification of diluted contaminants on the surface of chicken carcasses based on successive projections algorithm (SPA)-multiple linear regression (MLR)-receiver operating characteristic (ROC)classifier. Firstly, a total of 20 images of carcasses with diluted contaminants were acquired by hyperspectral imaging system, and 10 characteristic bands were extracted from the 1 232 bands by SPA. Then the MLR method was used to construct a regression model between the discriminant function and the characteristic spectral bands. Finally, the optimal classification threshold with high true positive rate (TPR) and low false positive rate (FPR) was determined by ROC analysis. Thus, the SPA-MLR-ROC classifier allowed the identification of the diluted contaminants. The results showed that the TPR of the SPA-MLR-ROC classifier was 98.08% and the FPR was only 0.39%. The detection accuracy was higher than that of the band ratio algorithm and the dual-band algorithm. Hence, the SPA-MLR-ROC classifier exhibited good performance for the detection of diluted contaminants on the surface of chicken carcass. However,because of the limited number of samples, further study using more samples is needed to verify the stability and feasibility of this method.

Key words:successive projections algorithm-multiple linear regression-receiver operating characteristic analysis; classifier;contaminants; hyperspectral imaging; chicken carcass

DOI∶10.7506/spkx1002-6630-201724040

中图分类号:S123;TP391.4

文献标志码:A

文章编号:1002-6630(2017)24-0247-06

引文格式:

吴威, 吴明清, 陈桂云, 等. 鸡胴体表面稀释污染物的连续投影-多元线性回归-受试者特性分析检测[J]. 食品科学, 2017,38(24)∶ 247-252. DOI∶10.7506/spkx1002-6630-201724040. http∶//www.spkx.net.cn

收稿日期:2017-04-26

基金项目:江苏省科技支撑计划项目(BE2014708);中央高校基本科研业务费专项(KYZ201665)

作者简介:吴威(1978—),女,讲师,博士,研究方向为农产品无损检测。E-mail:wuwei@njau.edu.cn

*通信作者:陈坤杰(1963—),男,教授,博士,研究方向为农产品检测与加工技术。E-mail:kunjiechen@njau.edu.cn

WU Wei, WU Mingqing, CHEN Guiyun, et al. Successive projections algorithm-multiple linear regression-receiver operating characteristic analysis for diluted contaminant identification on chicken carcasses[J]. Food Science, 2017, 38(24)∶247-252. (in Chinese with English abstract) DOI∶10.7506/spkx1002-6630-201724040. http∶//www.spkx.net.cn