我国食品安全与数据科学交叉研究的科学计量学分析

邵 航1,2,3,宋英华1,2,3,*,李墨潇1,2,3,*,邵 伟4,雷生姣4,库任俊1,2,3,夏亚琼1,2,3

(1.武汉理工大学中国应急管理研究中心,湖北 武汉 430070;2.安全预警与应急联动技术湖北省协同创新中心,湖北 武汉 430070;3.武汉理工大学安全科学与应急管理学院,湖北 武汉 430070;4.三峡大学生物与制药学院,湖北 宜昌 443001)

摘 要:《“十三五”国家食品安全规划》提出要提升食品安全技术支撑能力,而各类食品安全数据的采集、储存与挖掘等技术是食品安全技术的重要组成部分。因此,分析我国食品安全与数据科学交叉研究已取得的学术成果,探寻其发展趋势,对数据驱动的食品安全技术的应用具有重要的实际参考意义。以中国知网为数据库,以“主题 = 食品安全 AND 数据”为检索式,以搜集到的1996—2019年共3 375 条文献数据作为数据集,主要使用科学计量学方法及软件Citespace对数据集进行科技文本挖掘,并以关键词聚类图谱、时间线图谱和突现度图谱等进行数据可视化。研究发现,在这23 年中,该领域文献数量呈指数式增长;研究主题形成了3大类11小类的主题聚类,发展历程被时间线聚类划分为1996—2006年、2007—2014年和2015—2019年3 个阶段。结果表明,我国食品安全与数据科学的交叉研究从产出、合作到研究主题都已初具规模,经过积累与发展,交叉研究正在新的学科增长点的引领下快速发展。

关键词:食品安全;数据科学;科学计量学;Citespace;数据可视化;聚类分析;研究热点

食品安全关系人民群众身体健康和生命安全,关系中华民族未来[1]。以食品安全突发事件为研究对象,深入开展演化机理、检测技术和预警方法等方面的研究,能够帮助政府及时采取有利的措施,预防食品安全问题的再次发生,已经得到党和国家的高度重视[2]

数据科学是基于传统的数学、统计学的理论和方法,运用计算机技术进行大规模数据计算、分析和应用的一门学科[3]。它是一门既古老又年轻的科学,其渊源可以追溯至1749年起源于瑞典的统计学[4];随着计算机技术的发展与大数据概念的兴起,数据科学又逐渐成为大数据技术的代名词。大数据时代的到来使得数据科学逐步演变成了一门“立足现代、面向未来”的显学;而公共安全领域对大数据挖掘与利用的迫切需求加剧了全社会对数据科学人才的需要;同时,这种社会需求导向又反向显著地提升了数据科学在公共安全各个子领域中的学科地位。

随着社会信息化程度的提升与信息储存方式的变革,食品生产与消费的各个环节已经积累了海量异构的食品安全历史数据,且仍在源源不断地产生着新的食品安全大数据。在大数据时代的背景下,大数据技术方法相比起传统的研究方法,在处理海量的食品安全数据时显得更加对口和有效。

已发表的科技论文是经过同行评议,且其主题被认为是隶属于该领域的论文[5]。因此,从已发表的学术论文中识别并探测某一特定研究主题是被实践证明的可靠方法[5]。基于此种假设,本文选取中国知网(China National Knowledge Infrastructure,CNKI)数据库中食品安全研究与数据科学存在交集的科技文献作为我国食品安全与数据科学交叉研究的样本数据集,运用科学计量学理论,主要使用科技文本挖掘软件Citespace对文献数据进行深度挖掘。

本文将从所收集的文献数据的特征出发,开展本交叉研究的研究主体分析与研究主题分析,以期从文献数据空间中发现本领域重要的研究机构、期刊和作者,并进一步地发现本领域当前的研究热点与未来的发展趋势。

1 数据与方法

1.1 数据采集与预处理

本文所收集的数据全部来源于CNKI。考虑到文献题录数据的更新会有迟滞,本研究以2019年5月20日0时为截止时间,以“主题 = 食品安全 AND 数据”为检索条件,收集了1996年1月至2019年5月跨度约23 年的3 375 条文献数据,文献类型包括期刊论文、学位论文、会议论文和报纸图书等。文献数据以Refworks格式(包含文献类型、作者、作者单位、标题等主要科学计量字段)存储为UTF-8编码的.txt文件到本地路径备用。同时,使用Python爬取检索页面分年数据的完整信息,并写入Excel文件。

1.2 科学计量学方法与科技文本挖掘软件

科学计量学是运用数学等定量方法对科学的整体及其各个方面进行定量化研究,以解释科学发展规律的一门新兴学科[6]。传统的科学计量学研究方法主要有出版物统计、著者统计、引文分析、词频分析等[7]

Citespace是由美国德雷塞尔大学信息科学与技术学院的Chen Chaomei教授应用Java语言开发的一款信息可视化软件[8],本研究使用的是该软件的5.1.R8.SE.版本。它主要基于共引分析理论和寻径网络算法等,对特定领域文献(集合)进行计量,以探寻出科学领域演化的关键路径及知识转折点,并通过一系列可视化图谱的绘制,来形成对科学演化潜在动力机制的分析和学科发展前沿的探测[9]

2 结果与分析

2.1 交叉研究的研究主体分析

2.1.1 文献年代分布

对数据集进行分类检索可知:其中期刊论文记录1 604 条,博、硕士学位论文记录1 599 条,会议论文记录71 条,这3 类文献体例占总体文献的97.01%。进一步地对期刊和博、硕士学位论文的年累计量进行多项式回归预测,发现当多项式阶数由2阶增加到4阶时,预测精度不再随着方程阶数的增加而增加,故采用4阶多项式预测。

文献累计量的分年统计及回归预测见图1,期刊论文、学位论文累计数量预测曲线的R2均达到99%以上,证明回归模型的拟合优度很高。曲线数值的增长具备某种指数型趋势,而此处依据泰勒公式原理,以多项式函数来近似计算指数函数值,通过设置预测点,可以推测:本领域期刊论文总量有望在2019年达到1 940 篇左右,在2020年达到2 340 篇左右;本领域学位论文总量有望在2019年达到1 810 篇左右,在2020年达到1 950 篇左右。在2007年以前,期刊论文的累计量高于学位论文的累计量,这表明1996—2007年交叉研究还处于讨论与积累的萌芽阶段,尚未形成较完备的学科形态;2007—2019年学位论文的累计量高于期刊论文的累计量,这表明从事交叉研究的人越来越多,交叉研究的热度在不断提高,社会的重视程度也在不断提高;预计2019年会成为期刊论文数量第二次超过学位论文数量的转折点,这将标志着交叉研究会逐步形成新的学科增长点,推动新一阶段的交叉研究发展。

图1 我国食品安全与数据科学交叉研究的文献累计量分年统计与预测
Fig. 1 Accumulated annual statistics and prediction of literature on cross-disciplinary studies on food safety and data science in China

2.1.2 重要机构分布

使用CNKI数据库的“分组浏览-机构”功能,可以查询到当前学科领域中重要机构的信息(以发文量统计,列表机构最低发文量为14 篇)。由表1可知,发表论文30 篇及以上的机构有18 家,所发表的论文占全部3 375篇文献的26.93%,属于引领本领域研究的核心机构群体。

表1 1996—2019年我国食品安全与数据科学交叉研究领域文献产出量前18的机构
Table 1 Top 18 most prolific research institutions in terms of crossdisciplinary studies on food safety and data science in China (1996-2019)

序号 机构名称 所在地 文献数量 本项比例/% 累计比例/%

在本领域发表论文的数量与该机构研究人员的数量、获得相关科研项目的数量密切相关。例如:在南京农业大学所发表的论文中,李太平教授团队的研究成果最多,共有6 篇论文,主要受到国家自然科学基金面上项目“生鲜农产品质量安全的监管机制研究”(71173114)的资助;在浙江大学所发表的论文中,杜树新副研究员及其团队的论文数量最多,共有5 篇,主要受到国家科技攻关计划资助项目(2001BA804A34)的资金支持。

2.1.3 重要期刊与学位授予单位分布

使用Excel 2016软件的数据透视表功能,对所收集的3 375 条题录数据的“期刊名称”或“学位授予单位”字段进行数据透视,可以得到期刊论文文献的来源期刊或学位论文的学位授予单位的统计信息。共有1 611 篇与本主题相关的期刊论文被刊载在684 种学术期刊上,平均载文量为2.36 篇/刊。由表2可知,集中刊载本领域论文10 篇及以上的期刊有18 种,载文数量达438 篇,占全部期刊论文的27.19%,在期刊分类[10]上分属于4大类,其中“食品科学技术”和“农业综合”分类占大多数。

共有1 598 篇与本主题相关的学位论文来自248 个不同的学位授予单位,平均载文量为6.44 篇/机构。由表3可知,学位论文数量在20 篇及以上的机构有17 家,论文数量达到650 篇,占本领域学位论文总量的40.68%。其中,农林类与综合类高校涉足食品安全与数据科学交叉研究领域的数量相较于其他类别更多。

表2 交叉研究期刊论文的来源期刊分布
Table 2 Journal distribution of published papers on cross-disciplinary studies on food safety and data science

注:*.中文核心期刊;**.中文核心期刊和中国科学引文数据库(CSCD)(或中文社会科学引文索引(CSSCI))期刊;—.未查询到。

序号 期刊名称 期刊分类 文献数量1食品安全导刊 食品科学技术 89 2 中国食品卫生杂志* 卫生管理学 66 3 食品安全质量检测学报 食品科学技术 36 4世界标准信息 — 23 5食品工业* 食品科学技术 22 6食品科学** 食品科学技术 19 7现代食品 食品科学技术 18 8食品与机械** 食品科学技术 17 9 中国食品药品监管 — 17 10 农产品质量与安全 农业综合 16 11 安徽农业科学 农业综合 15 12 食品工业科技** 食品科学技术 15 13 食品研究与开发* 食品科学技术 15 14 条码与信息系统 — 14 15 中国食物与营养 食品科学技术 12 16 电脑知识与技术 计算机科学技术 11 17 中国自动识别技术 计算机科学技术 11 18 世界农业** 农业综合 10

表3 交叉研究学位论文的学位授予单位分布
Table 3 Degree conferring institution distribution of dissertations on cross-disciplinary studies on food safety and data science

注:*.211工程院校;**. 211和985工程院校。

序号 学位授予单位 类别 文献数量1南京农业大学* 农林 80 2吉林大学** 综合 63 3浙江大学** 综合 62 4中国农业科学院 农林 48 5电子科技大学** 理工 46华中农业大学* 农林 43 7江南大学* 综合 39 8山东大学** 综合 37 9中国农业大学** 农林 34 10 西北农林科技大学** 农林 31 11 华南理工大学** 理工 29 12 天津大学** 综合 26 13 中国海洋大学** 综合 25 14 上海海洋大学 综合 24 15 湖南农业大学 农林 22 16 东北农业大学 农林 21 17 中国疾病预防控制中心 医药 20 6

本文通过文献[11]的方法,统计载文数量、载文数量的出现频数、出现概率和累计概率,得到了期刊论文和学位论文的频数与概率分布表。使用Origin Pro 9.1软件对上述数据进行概率分布模型的拟合检验,得到图2。

图2A、B分别表示本领域期刊论文载文数量和学位论文载文数量的概率分布拟合曲线,决定系数分别为0.999 9、0.999 6,具有很高的拟合优度。所以两种文献的载文数量的概率分布都服从异速生长指数(Allometric)分布。这表明我国食品安全与数据科学交叉研究领域经过萌芽与积累,研究规模正在高速增长。根据异速生长尺度规律[12]的特点,我国食品安全与数据科学交叉研究所形成的这个特定的食品安全子领域,可以看作是一种广义的生态系统,而本主题新科技论文的产生则是这个生态系统中最重要的信息流之一。自身的主题与偏好适合这个子领域的优质文献被刊载的期刊,或者重视这个新兴子领域发展的研究机构,会在这个新兴子领域里快速生长,显得愈发重要。

图2 期刊论文(A)和学位论文(B)载文数量的概率分布拟合
Fig. 2 Fitted probability distribution of the number of papers published in journals (A) and degree papers (B)

所拟合的概率分布模型为“Allometric模型”,公式为yaxb

2.1.4 重要作者分布

关于论文合著情况,共有3 619 人次的作者参与撰写了这1 611 篇期刊论文,平均作者为2.24 位/篇,即作者合作度[6]为2.24。使用CNKI数据库的“分组浏览-作者”功能,可以查询到当前学科领域中高产作者的信息,本文将所述高产作者中发文数量大于5 篇的作者信息进行整理。同时,为了客观地评价各位高产作者在论文合著中对其论文的贡献度,本文引入了Du Yongping等2015年提出的基于作者顺序的影响力计算方法,该方法适用于大数据环境下具备统计意义的计算[13]。该方法的算理实质是:先计算除第一作者以外其他作者的分配得分(以百分数计),再反向用总贡献值倒减出第一作者的得分,其计算见下式。

式中:paij表示论文署名次序为i(即Order(i))的作者对其论文j的规范化贡献值;M表示该论文的作者总数。

本文使用pa链来记录作者的署名和排位情况,如:5(2)表示该作者的某一篇论文共有5 位作者,其为第2作者(若为通信作者,则视为第一作者;若存在并列一作,也视为第一作者;特殊情形(比如通信作者)将以“*”标记,如:5(2*),计分为5(1))。根据公式(1)进一步计算累计pa和平均pa,并将以上字段信息合并为表4。

表4 本领域发文数量大于5 篇的高产作者和pa
Table 4 Productive authors publishing more than 5 papers and their pa chain in this field

注:#n.表示平均pa排名第n;NINHCCDCP.中国疾病预防控制中心营养与食品安全所;CNCFSRA.国家食品安全风险评估中心;RUC.中国人民大学;JNU.江南大学;BHU.渤海大学;JSIQS.江苏省标准化研究院;NJAU.南京农业大学;AHUT.安徽工业大学。

序号 作者平均pa/%1 王竹天 NINHCCDCP 13 4(4*)-5(2)-5(2)-5(5)-4(3)-5(5*)-4(4*)-4(4)-2(1)-5(1)-4(4)-1(1)-6(2) 459.64 35.36 2 肖革新#5 CNCFSRA 11 7(2*)-3(3*)-3(3*)-3(1)-5(1)-10(5)-7(7*)-10(10*)-7(7*)-2(1)-6(3*)-3(1) 544.19 49.47 3 李宁 CNCFSRA 11 9(6)-9(6)-7(5)-7(2)-6(5)-9(9)-8(8)-4(3*)-10(3)-11(4)-1(1)222.9420.27 4 杨大进 NINHCCDCP 11 4(4)-13(13*)-5(5*)-5(5*)-5(2)-5(2)-4(3)-4(2)-5(3)-4(2)-6(6)254.98 23.18 5 王志刚 RUC 10 4(4)-3(1)-3(3*)-3(3*)-3(3)-3(3)-4(1)-4(4*)-4(1)-3(1) 421.44 42.14 6 郭云昌 CNCFSRA 8 9(9*)-9(9*)-7(7*)-7(7*)-4(3)-4(4)-10(2)-11(3) 208.16 26.02 7 吴林海 JNU 8 3(3)-5(4)-4(4)-3(1)-3(3)-4(2)-2(2)-5(4) 187.62 23.45 8 唐晓纯#2 RUC 7 6(1)-5(1)-4(1)-5(1)-2(2*)-2(2*)-2(1) 382.95 54.71 9 刘兆平 CNCFSRA 7 14(13*)-1(1)-7(7*)-7(3)-9(8)-8(2)-6(3) 218.25 31.18 10 隋海霞 CNCFSRA 6 2(2*)-7(2)-7(7*)-9(3*)-8(4)-6(5) 178.47 29.75 11 鄂旭#4 BHU 6 2(2*)-5(2*)-5(1)-5(1)-4(1)-4(1) 301.09 50.18 12 金志刚 JSIQS 6 3(1)-6(2)-3(2)-1(1)-4(2)-2(1) 280.96 46.83 13 李太平#1 NJAU 6 2(1)-2(1)-1(1)-2(1)-3(2*)-1(1) 455.01 75.84 14 张龙昌 BHU 6 3(3)-3(1)-2(2)-2(2)-2(2)-5(2) 191.66 31.94 15 杨杰 NINHCCDCP 6 13(3)-5(3)-5(3)-5(1)-5(1)-4(1) 175.1829.20 16 李丽#3 AHUT 6 2(1)-2(2*)-3(2*)-3(1)-3(2)-2(2) 301.67 50.28姓名 作者单位 文献数量 pa链 累计pa/%

由表4可知,这些高产作者中,平均pa前5 名分别是:李太平、唐晓纯、李丽、鄂旭、肖革新,他们应该是本领域研究合作的优秀候选人。从累计pa来看,王竹天、王志刚也是本领域具备合作潜质的优秀候选人。

2.2 交叉研究的研究主题分析

2.2.1 关键词共现分析

本文使用对数似然率(log-likelihood rate,LLR)算法对关键词共现网络进行聚类分析,得到了具有11 个主要聚类的关键词共现网络图谱(图3),这些聚类的轮廓值(Silhouette)均大于0.5,且部分大于0.7,说明这些聚类合理且令人信服[14]。这11 个聚类可以进一步归纳为3大类(表5),即:食品安全领域的新型数据采集技术(类I)、食品安全领域的新型数据分析技术(类II)、食品安全领域的新型数据科学应用(类III)。

由图3可知,1996—2019年我国食品安全与数据科学交叉研究领域形成了内部边界聚合且外部边界分明的复杂关键词共现网络图谱。该图谱有405 个节点和1 543 条连线,是一个由大量高频关键词形成的广阔知识空间。以下将根据引文空间聚类成员的归属和食品安全意义上的类别界定,以大类(I、II、III)划分为展开顺序,对所得到的关键词共现网络图谱进行深入的分析。

表5 关键词共现网络的聚类信息
Table 5 Clustering information of keyword co-occurrence network

注:*.交叉研究早期与“食品安全标准数据”相关的文献所产生的聚类。

聚类号及标签 文献数量 聚类轮廓值 平均年份 所属大类C0 风险评估 64 0.695 2011 III C1 食品安全 56 0.698 2011 III C2 物联网 45 0.616 2011 I C3 影响因素 42 0.781 2011 III C4 质量安全 41 0.650 2009 III C5 区块链 40 0.649 2010 I C6 题录* 32 0.843 2006 II C7 注水肉 28 0.743 2013 III C8 电子标签 21 0.894 2010 I C9 正态分布 4 0.994 2004 II C12 数学模型 4 0.986 2009 II

图3 我国食品安全与数据科学交叉研究的关键词共现网络图谱
Fig. 3 Keyword co-occurrence network map of cross-disciplinary studies on food safety and data science in China

RFID.射频识别(radio frequency identification);HACCP.危害分析与关键控制点(hazard analysis and critical control point)。

2.2.1.1 食品安全领域的新型数据采集技术

在大数据时代的背景下,物联网、区块链和电子标签等技术成为了采集新型食品安全数据的重要支撑技术。将网络嵌入食品生产流通各环节的物理设备,有利于提升食品供应链的智能化,完善食品溯源体系。尚培培等[15]研究了具备感知层、网络层和应用层3 层架构的产品电子代码(elctronic product code,EPC)物联网在牛肉供应链安全中的应用,实现了牛肉产品标准化唯一标识、不合格牛肉溯源追踪、全程信息共享3 个层面的食品安全保障。区块链技术的数据分布式储存与数据不可删改的特性将对食品从生产到零售的整个商业过程起到某种监督与净化作用。颜波等[16]设计并开发了基于RFID和EPC技术的具有企业、政府部门和消费者3 个追溯主体的罗非鱼供应链可追溯平台,在罗非鱼上架销售前一直使用可循环RFID标签,实现了销售前的全程追溯;而零售端顾客则可以通过独立包装外的条形码标签溯源,提升了生鲜食品安全监管的效率,满足了顾客的食品安全需求。

2.2.1.2 食品安全领域的新型数据分析技术

数学模型方法结合新兴的人工智能技术应用于食品安全领域,提升了食品安全数据及其分析挖掘技术在食品安全治理中的功能与地位。晁凤英等[17]对某出入境检验检疫局提供的食品安全检测数据,使用广度优先的Apriori算法进行了关联规则数据挖掘,并对挖掘出的几条有代表性的关联规则进行了解读,由此提炼出食品安全抽检的优化策略。质量控制图是一种简单、有效的统计技术[18]。带有上中下控制界限的、以检测食品生产过程安全和判断食品质量稳定状态为目标的控制图,已经逐步演化和固定为食品质量安全过程控制的专门化数据分析方法。秦燕等[19]使用控制图工具进行危险检出物指标预警,对广州食检中心某时段内的出口茶叶中的六氯环己烷和白兰地酒中的甲醇的检测数据进行统计分析,提出了Y-Pn控制图、C-Pn控制图、J-Pn控制图和控制图4种预警方法。

2.2.1.3 食品安全领域的新型数据科学应用

以数据密集型科学发现的研究范式,研究前沿且恰当的食品安全问题,是数据科学应用在食品安全领域的一种使命。因为面向主体对象不同,故其应用场景和应用需求也不相同[20]。所研究的对象是当前层出不穷的各类食品安全事件及危险源,如:使用主成分分析-最小二乘支持向量机预测模型鉴别地沟油[21]、使用层次分析法(analytic hierarchy process,AHP)评价水产品孔雀石绿的残留风险[22]、使用SGompertz-SLogistic生长动力学模型预测清蛋糕中金黄色葡萄球菌的生长速率[23]等;所研究的内容是在宏观层面上食品安全水平提升所亟待解决的各种问题,如:使用关联规则算法探寻食品质量安全保障的关键因素[24]、使用循环神经网络算法对食品安全描述文本的情感倾向进行分类[25]、通过构建贝叶斯网络对白酒质量安全进行预测[26]等;交叉研究所受益的主体及研究方向包括:政府的智慧监管与风险预警[27-29]、食品企业的生产控制与事后应对[30-32]、消费者的食品安全风险认知与支付意愿[33-35]等。

2.2.2 时间线聚类分析

使用Citespace软件进一步绘制关键词共现网络的时间线图谱,由图4可知,我国食品安全与数据科学交叉研究的各研究主题存续时间不同。例如:聚类C0、C1和C2存续时间都接近20 年,而且从聚类产生到现在一直是活跃的聚类;而另一些聚类的存续时间则相对较短,例如:聚类C6、C7和C8,存续时间只有大约7~10 年,且目前已经不再是该主题研究热度最高的时段,这些主题都具有从存续时间长的主题中分化产生的特点。图中的这些颜色与流向表征着我国食品安全与数据科学交叉研究的不同发展阶段。

图4 我国食品安全与数据科学交叉研究的关键词聚类的时间线图谱
Fig. 4 Keyword clustering time-line atlas of cross-disciplinary studies on food safety and data science in China

各研究主题领域颜色差异表征该领域首次出现共被引链接的时间差异;聚类之间的知识流向遵循由深色到浅色、由冷色向暖色的分布[36]

1996—2006年为重视食品标准数据与传统数理统计方法的阶段。此阶段的科技文献主要侧重引进国外先进的食品安全标准并与我国的食品安全标准进行比较[37-39];在数据分析上多基于HACCP系[40-42]、调查问卷方法和数理统计工具[43-45]

2007—2014年为新型食品安全数字技术和数学模型方法开始涌现的阶段。此阶段层次分析法[46-47]、贝叶斯网络[48]、关联规则[49]、决策树[50]、可拓决策[51]等数学模型方法被广泛地应用于食品安全风险评估和风险预警等方面;RFID[52-54]、QR二维码[55-56]、同位素指纹[57-58]等技术被广泛地应用于食品质量安全追溯领域。

2015—2019年为大数据与人工智能开始广泛地应用于食品安全各子领域的阶段。此阶段计算机视觉[59]、电子鼻与电子舌[60]、模式识别[61]等基于人工智能的食品安全无损检测技术得到应用;基于区块链技术的可追溯平台[62]、基于大数据的社会共治模式[63]、食品安全大数据的可视化分析方法[64]、基于大数据的食品安全风险分析[65]等由大数据技术驱动的食品安全智慧监管技术与模式正在探究与实践中。

2.2.3 关键词突现分析

本文采用Kleinberg突发事件检测算法[66]来探测文献空间中的突现词,Citespace软件会从论文题目、关键词和摘要等字段中提取候选专业术语,通过跟踪分析它们在不同时间区间内出现频率的突然变化(激增),识别出代表研究前沿的若干名词术语[67]。运行程序后,Citespace找到了47 个突现关键词,将突现度前50%的突现词按照其突现起止时间的升序排列得到表6。

表6 突现度最高的前50%的关键词
Table 6 Top 50% keywords with the strongest citation burstness

注:突现趋势栏中,红色代表突现期,蓝色代表平常年份,每一小格的时间跨度为1 年;对表格中的同义词“中国”与“中华人民共和国”进行了合并;#.对于非必须以英文出现的关键词(如:以“食品安全”替换“Food Safety”)以中文列示;*.由与“食品安全标准数据”相关的文献产生的特殊关键词。

序号 关键词 突现度 起始年 终止年 1996—2019年突现趋势1 中华人民共和国/中国 16.412 9 1996 2010 ▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▂▂▂▂▂▂▂▂▂2 检索工具* 13.731 5 1996 2006 ▃▃▃▃▃▃▃▃▃▃▃▂▂▂▂▂▂▂▂▂▂▂▂▂3 题录* 13.731 5 1996 2006 ▃▃▃▃▃▃▃▃▃▃▃▂▂▂▂▂▂▂▂▂▂▂▂▂4 GB* 7.823 5 1996 2006 ▃▃▃▃▃▃▃▃▃▃▃▂▂▂▂▂▂▂▂▂▂▂▂▂5 食品安全# 8.466 3 2006 2007 ▂▂▂▂▂▂▂▂▂▂▃▃▂▂▂▂▂▂▂▂▂▂▂▂6 供应链 5.148 1 2007 2009 ▂▂▂▂▂▂▂▂▂▂▂▃▃▃▂▂▂▂▂▂▂▂▂▂7 预警 4.550 7 2008 2010 ▂▂▂▂▂▂▂▂▂▂▂▂▃▃▃▂▂▂▂▂▂▂▂▂8 RFID/电子标签 10.881 3 2009 2014 ▂▂▂▂▂▂▂▂▂▂▂▂▂▃▃▃▃▃▃▂▂▂▂▂9 利益相关者 5.148 4 2012 2013 ▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▃▃▂▂▂▂▂▂10 信息化 4.939 2 2013 2014 ▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▃▃▂▂▂▂▂11 食品行业 4.822 2 2013 2015 ▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▃▃▃▂▂▂▂12 风险感知 4.908 8 2015 2017 ▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▃▃▃▂▂13 购买意愿 6.041 1 2016 2017 ▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▃▃▂▂14 食品检测 5.622 4 2016 2019 ▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▃▃▃▃15 社会共治 4.888 2 2016 2019 ▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▃▃▃▃16 食品污染物 4.888 2 2016 2019 ▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▃▃▃▃17 大数据 21.434 3 2017 2019 ▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▃▃▃18 食品药品 4.948 3 2017 2019 ▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▃▃▃

从表6可以看出,不同年份本领域的研究者所关注的研究热点不同。根据表6可以进一步把我国食品安全与数据科学交叉研究的热点演进划分为3 个阶段,与时间线聚类分析的年代划分相吻合。1)1996—2006年为重视国外食品安全标准的引进及与我国食品安全标准开展比较研究的阶段,“检索工具”、“GB(国家标准)”是这一阶段的突现词。2)2007—2014年,突现词“RFID”和“电子标签”代表了新型食品数字溯源技术的研究方向;突现词“利益相关者”与“食品行业”代表了与食品企业有关的研究方向;突现词“供应链”与“预警”等代表了与食品安全风险控制有关的研究方向。3)2015—2019年,突现词“大数据”代表了数据密集型科学发现的研究范式;突现词“风险感知”、“购买意愿”和“社会共治”等代表了这一阶段涌现出的研究热点。

3 讨 论

3.1 交叉研究当前的研究热点

3.1.1 新型数据采集技术与食品溯源及网络舆情的研究在食品从农田到餐桌的流通过程中,食品及其有关主体的多重属性被计量和记录,产生了食品关联属性的数据化基础[68]。以保障食品质量或数量安全为目的,提取这些数据,则产生了海量的食品安全数据。数据采集技术的发展使得文本资料、社会关系、地理方位等不易被提取的数据变得可被利用;使得政府、企业、检测机构、行业协会、媒体和消费者这6 类食品安全社会主体[20]所产生和需要的结构化、半结构化和非结构化数据[69]被各种技术手段收集和储存,以备挖掘与利用。

一方面,RFID和传感器、物联网等面向现实世界中食品理化数据的数据采集技术,推动了食品安全溯源技术的发展。圣光磊[70]通过改进滑动窗口射频识别数据分析-目标自适应射频识别数据分析(statistics moothing for unreliabler fid data-dynamic tags-based SMURF,SMURF-DSMURF)算法中数据完整性和标签动态性条件,设计了新的更高效的多层级射频识别数据分析(multi label DSMURF,MDSMURF)算法,并应用于白芍饮片溯源系统中,提高了数据噪声的清洗效率和多标签动态的阅读效率。钟聪儿等[71]将ALOHA算法应用于基于RFID技术的茶叶物流溯源系统中,并设计了仿真实验,结果表明:通过解决硬件不兼容、信息冗余等问题,能够显著地提高追溯系统的响应效率。

另一方面,网络爬虫及数据接口等面向虚拟世界中的食品资讯数据的数据采集技术,推动了食品安全舆情研究的发展。程铁军等[72]使用网络爬虫技术在线获取了2011—2014年总贴数达50万以上的超热度食品安全新闻事件15 例,并构建了4大类11小类的食品安全风险预警指标,通过粗糙集理论进行属性简约计算,从高热度舆情事件中提炼出易引发食品安全事件的关键食品流通环节,为源头管理和社会共治提供了针对性建议。洪小娟等[73]以所收集的包含588 个媒体微博节点的2014年食品安全微博舆情事件为数据集,使用Pajek软件进行了社会网络分析特有的网络结构、度、K-核以及派系分析,发现了食品安全新闻传播的核心节点、媒体派系以及传播模式,为食品安全舆情的利用与引导提供了可参考的建议。

3.1.2 新型数据存储技术与食品数据仓库及预警系统研究

大数据及其应用技术的爆炸式发展所产生的数据存储需求推动了数据存储技术的发展。大规模并行处理机(massively parallel processor,MPP)存储架构、Hadoop技术和分布式计算等新兴技术,让已经长期存在的食品安全大数据有了被规范化存储和多元化挖掘利用的可能性,尤其是基于数据库的食品安全预警系统,是当前研究的重要热点形态。郭曙超等[74]以山东地区进出口食品检测实验室的检测数据为数据集,根据食品安全工作需要,设计数据字典和体系架构,建立了“进出口食品与农产品实验室检测数据仓库系统”,该系统可进行数理统计、可视化分析与数据挖掘,能够实时掌握食品安全状况的动态,可以为食品安全管理人员提供高质量的决策依据。刘翠玲等[75]使用Eclipse开发环境和Java语言,设计并开发了一种基于多源大数据的食品安全监测预控系统,该系统后台采用My SQL关系数据库,实现了拉曼光谱仪数据的导入、分析与预警。黎建辉等[76]以云计算、云存储、分布式计算框架为系统主体,结合信息爬取、模式识别以及深度学习技术等,设计并开发了全球食品安全信息监控与分析云平台,通过对近5 000 个信息源的固定周期爬取与监控,成功地预警出了矿泉水水源污染事件、病死猪肉流入市场事件以及保鲜膜中塑化剂超标事件等具有重大社会影响的食品安全事件。

3.1.3 新型数据分析技术与食品安全智能解决方案研究

应用数据科学模型方法体系中的有监督学习、半监督学习和无监督学习[77]的各类算法对海量的食品安全数据进行计算分析,可以为食品安全的信息探测、数据预测和风险评估等各方面带来更加智能化的解决方案。刘金硕等[78]提出一种基于隐狄利克雷分配模型(latent Dirichlet allocation,LDA)的K平均值(K-means)聚类的网络食品安全问题话题发现算法,并以网络爬取的2017年包含43 个食品安全分类的1 920 条新闻报道为数据集,通过LDA-K-means算法进行聚类,以此发现新的食品安全话题,并与传统的向量空间模型(vector space model,VSM)算法进行了比对,实验结果表明,LDA-K-means算法相对于传统的VSM算法聚类效率更高,更加利于快速探测网络中新的食品安全问题话题。陈国庆等[79]使用基于荧光光谱和径向基函数神经网络,对光谱仪发射波长的网络特征参数进行训练,并对胭脂红溶液样本的浓度进行预测,结果表明,该方法对食品色素溶液种类识别的准确度接近100%,可应用于合成食品色素检测及食品安全监管。赵静娴[80]以2005—2009年华北地区20 个蔬菜种植基地的调查数据和国家农业科学数据中心的共享数据为数据集,抽取82 个样本作为训练集,抽取10 个样本作为验证集,应用决策树算法进行食品安全评估,提取了5 条规则,与验证集对比的准确率达到了90%,说明该方法能够有效指导农产品质量安全的提高方向。

3.1.4 新型数据可视化技术与食品安全决策辅助研究

食品安全数据可视化分析作为一个新兴的交叉研究领域,通过先进的交互式可视化工具帮助食品安全领域人员快速分析数据的分布态势、探寻数据间隐含关联、提升认知和分析能力、提高食品安全监管的科学性和有效性[81]。陈谊等[81]在分析食品安全大数据特征的基础上,使用了数据地图、ThemeRiver、双曲树、TimeWheel和SolarMap等新型图表,展示了时空数据、层次数据、多维数据和关联关系的数据可视化形式,为提升数据可视化的易用性和辅助食品安全决策的可靠性提供了技术路径。陈红倩等[82]提出了一种基于Open GL图形库与统计数据的农残检测数据的融合对比可视化方法,该方法可将一定规模的农残数据根据其所属的地区和类别进行分类统计,并将多个统计结果融合到一个可视化界面中,可对农残检测数据进行快速展示,并以此进行分析和预判,为有关专家进行农产品安全快速决策提供研判依据。杨璐等[83]提出了一种挖掘数据关系的可视分析图ExploreView,以国家食品药品监督管理总局抽检数据为数据集,使用立方体隐喻组织数据,进而完成数据编码,综合使用层次图、细节描述图和关系挖掘图等新式可视化图像,实现对数据的展示和交互,为食品质量安全的监测和预警提供决策帮助。江美辉等[84]以“上海福喜过期肉”事件新闻文本为研究对象,基于复杂网络理论,使用Gephi软件对非结构化的文本信息进行了拓扑特征分析和关联网络挖掘,结果表明,食品安全事件新闻报道的关注点具有集聚性,且关注点会随着时间推移而变化,该研究挖掘出了新闻实体间的隐含关系,为有关部门对食品安全突发事件的应急管理提供了决策依据。

3.1.5 面向对象的食品安全大数据技术应用研究

面向食品安全治理的不同社会主体的数据特征和数据需求的应用研究,是目前交叉研究的重要横向层面。总体来看,政府需要食品安全智慧监管类的研究。张亮等[85]提出了面向智慧型城市的食品安全监管体系,该体系基于感知网络发现与采集数据,基于云储存规划与分析数据,基于大数据技术挖掘与预测数据,为智慧城市食品质量的安全预警和应急管理提供了参考路径;食品企业需要产品质量与舆情安全类的研究,席磊等[86]提出了一种分布式无公害农产品数字认证系统,该系统具有中心化分布式拓扑结构,使用元数据、工作流和Web Service技术,可实现跨部门、跨地域的协同工作和高效认证的系统功能;检测机构需要共享分析和能力评价类的研究,沐晓馥[87]提出了一种基于AHP算法的检验检测机构检测能力管理信息系统绩效评价方法,该方法基于AHP算法设计了具有4 个一级指标和10 个二级指标的评价指标体系,用于量化评价不同检测机构的检测能力管理信息系统的绩效,为有关单位进行系统选型提供了实际的决策依据;行业协会需要行业自律和治理参与方式类的研究,刘根华等[88]以浙江省金华市为例,应用数据统计分析方法分析了行业协会参与食品安全社会共治的现实困难,提出了“政府职能前移”和“五方联动机制”等有益对策;媒体需要治理策略和信息查询类的研究,谢康等[89]基于Kahneman-Tversky前景理论和博弈论方法,定量化分析了媒体参与食品安全社会共治的条件,借助MATLAB软件进行系统仿真,得出媒体可采取的“提高违规者声誉损失度”、“持续跟踪调查或深度报道”、“动态监督”和“媒体群监督与共治代表制度”4 种有效策略;消费者需要风险感知和购买意愿类的研究,张宇东等[90]使用数理统计方法分析了所设计、发放与回收的550 份有效调查问卷,定量化地揭示了食品安全风险感知下,消费者的量化信息偏好、购买意愿和决策逻辑,结果表明,对食品安全风险严重性的主观判断会显著提升消费者对食品安全量化信息的偏好,而这种偏好会反向刺激消费者量化消费,以应对所认知的食品安全风险。

3.2 交叉研究未来的发展趋势

随着大数据时代的到来以及数据挖掘技术在食品安全领域的应用,数据科学在食品安全各领域的地位将会越来越重要,食品安全监管也将向着更加智能化的方向发展,社会食品安全水平必然会得到更加显著的提升。数据科学的发展是推动交叉研究进步的重要推动力,食品安全研究的发展过程中对数据科学产生的新需求是引领交叉研究进步的重要牵引力。从数据科学的发展趋势来看:数据可视化、文本挖掘与自然语言处理、社交网络分析、计算机视觉和高性能计算等会成为未来的大数据技术前沿[91]。若将这些前沿技术投射到食品安全领域,则会带来如下的未来研究热点:1)计算机视觉技术的发展将推动食品无损检测技术的研究;2)自然语言处理能力的提升将推动食品安全网络舆情处理的研究;3)各种机器学习算法的进步将推动食品安全历史数据的知识发现以及决策支持的研究;4)食品安全大数据的云储存与人工智能服务的需求将持续扩大,其产业化的研究将得到蓬勃发展。

4 结 语

在近23 年的发展历程中,我国食品安全与数据科学的交叉研究从零星的学科交集萌芽,逐渐发展出一个新兴交叉学科的雏形,目前正处于新的快速增长期。文献数量呈指数式增长,目前已存在3 375 篇各类文献的研究体量,期刊论文和学位论文的年平均增速分别达到51.49%和52.45%,作者合作度为2.24。涌现出的高产和高贡献度作者越来越多,例如南京农业大学的李太平教授、中国人民大学的唐晓纯副教授和安徽工业大学的李丽副教授等。通过CNKI的“分组浏览-研究层次”检索功能获知,我国食品安全与数据科学交叉研究目前涉及到国内工程技术(自科)、行业指导(社科)和基础研究(社科)等16 个学科领域。结合科学计量学的分析,得出以下3 个方面的结论。

第一,通过关键词共现图谱分析,找出了本领域3大类11小类热点研究主题。通过时间线聚类图谱分析与关键词突现度图谱分析,划分出了本领域发展史上的3 个典型历史阶段,即:1996—2006年的食品安全标准引入与比较和食品安全数据的数理统计阶段;2007—2014年的食品安全数字技术与数学模型阶段;2015—2019年的食品安全大数据与人工智能阶段;预计在未来计算机视觉、自然语言处理技术、机器学习算法和大数据服务产业会在我国食品安全与数据科学交叉领域发挥更加重要的作用。

第二,通过文献分析,在食品安全与数据科学交叉融合的方向层次来看,数据科学的数据采集、数据存储、数据分析和数据可视化等技术,在23 年间不同程度地与食品安全的食品溯源、网络舆情、风险预警、智慧监管和可视化决策等重要方面相融合,诞生出新的食品安全前沿研究形态,是推动交叉研究不断发展的重要纵向动力。数据科学的各种技术与食品安全社会共治的各个主体的实际需求相结合,诞生出各种面向对象的食品安全大数据技术,是推动食品安全与数据科学交叉融合、促进食品安全大数据技术发展的重要横向动力。

第三,值得注意的是,虽然在仅仅23 年的时间里,我国食品安全与数据科学的交叉研究得到了迅猛发展;但是高被引论文[92]却只是总体文献中的极少数,国内研究与世界先进水平相比仍有差距;相比起食品安全领域的其他成熟学科板块,本领域的学科影响力仍然较为有限。结合未来的科技发展趋势和国家科技政策导向,我国食品安全与数据科学交叉研究应该得到社会各界更多的重视;本领域经过探索且被证明是成熟可行的研究范式,应该以课程化的形式进入到与食品安全有关的专业学科的课程体系之中;各级科学基金也应该加强对本领域的支持力度,推动本领域新的科研成果的不断产生以及科技成果的高效转化,以此推动我国食品安全监管防控的智能化进程。

本文也存在一定的局限性,因为数据下载阶段可检索到并可供下载的数据与所在高校(或研究机构)所购买的数据库的时间跨度及文献种类的权限有关[93]。故可能存在少量未被CNKI收录的文献,或作者单位未购买下载权限的数据库所包含的文献,未被纳入本研究的数据集会造成少量的样本缺失,并会一定程度地影响科学计量与主题分析的精准度。

参考文献:

[1] 中国政府网, 新华社. 中共中央 国务院关于深化改革加强食品安全工作的意见[EB/OL]. (2019-05-20)[2019-06-07]. http://www.gov.cn/zhengce/2019-05/20/content_5393212.htm.

[2] 赵美玲, 秦卫平. 我国食品安全研究现状与热点的文献计量学分析[J]. 科技管理研究, 2014, 34(3): 68-73. DOI:10.3969/j.issn.1000-7695.2014.03.014.

[3] 张尧学, 胡春明. 大数据导论[M]. 北京: 机械工业出版社, 2018:22-24.

[4] ROSLING H. The joy of stats[EB/OL]. (2019-05-20)[2019-06-07].https: //www.bilibili.com/video/av58376864.

[5] 李杰, 杨冕, 吴超. 安全科学研究主题结构及前沿分析[J]. 中国安全科学学报, 2017, 27(5): 7-12. DOI:10.16265/j.cnki.issn1003-3033.2017.05.002.

[6] 马凤, 周文罡. 科学计量学研究: 国内外比较分析[M]. 武汉: 武汉大学出版社, 2016: 19-34.

[7] 邱均平, 赵荣英, 董克, 等. 科学计量学[M]. 北京: 科学出版社, 2016:19-37.

[8] CHEN Chaomei. Visualizing patterns and trends in scientific literature[EB/OL]. (2019-06-07)[2019-06-07]. http://cluster.cis.drexel.edu/~cchen/citespace/.

[9] 陈悦, 陈超美, 胡志刚, 等. 引文空间分析原理与应用: CiteSpace实用指南[M]. 北京: 科学出版社, 2014: 12-13.

[10] 中国科学技术信息研究所. 2017年版中国科技期刊引证报告(扩刊版)[M]. 北京: 科学技术文献出版社, 2017: 43-229.

[11] 毛国敏, 吴何珍, 生冬梅. 期刊论文下载次数的概率密度服从对数正态分布[J]. 辽宁师专学报(自然科学版), 2017, 19(3): 100-105.

[12] BROWN J R, HARTWICK E B. Influences of temperature, salinity and available food upon suspended culture of the Pacific oyster,Crassostrea gigas: I. absolute and allometric growth[J]. Aquaculture,1988, 70(3): 231-251. DOI:10.1016/0044-8486(88)90100-7.

[13] DU Yongping, YAO Changqing, LI Nan. Using heterogeneous patent network features to rank and discover influential inventors[J]. Frontiers of Information Technology & Electronic Engineering, 2015, 16(7):568-578. DOI:10.1631/FITEE.1400394.

[14] 李杰, 陈超美. CiteSpace: 科技文本挖掘及可视化[M]. 北京: 首都经济贸易出版社, 2016: 150-151.

[15] 尚培培, 林国龙, 马占鑫. 物联网环境下食品供应链安全探究[J]. 食品工业科技, 2013, 34(7): 297-299. DOI:10.13386/j.issn1002-0306.2013.07.084.

[16] 颜波, 石平, 黄广文. 基于RFID和EPC物联网的水产品供应链可追溯平台开发[J]. 农业工程学报, 2013, 29(15): 172-183. DOI:10.3969/j.issn.1002-6819.2013.15.021.

[17] 晁凤英, 杜树新. 基于关联规则的食品安全数据挖掘方法[J].食品与发酵工业, 2007(4): 107-109. DOI:10.3321/j.issn:0253-990X.2007.04.027.

[18] 傅雪夫. 质量控制图及其在食品分析质量管理中的应用[J]. 食品科学, 1987, 8(8): 1-8. DOI:10.7506/spkx1002-6630-1987.08.001.

[19] 秦燕, 李辉, 李聪. 控制图分析在食品安全预警中的应用[J]. 中国公共卫生, 2004(9): 69-70. DOI:10.11847/zgggws2004-20-09-39.

[20] 陶光灿, 谭红, 宋宇峰, 等. 基于大数据的食品安全社会共治模式探索与实践[J]. 食品科学, 2018, 39(9): 272-279. DOI:10.7506/spkx1002-6630-201809041.

[21] 彭秀辉, 刘飞, 陈珺, 等. PCA-LS-SVM预测模型在地沟油鉴别中的应用[J]. 计算机与应用化学, 2013, 30(10): 1207-1210. DOI:10.3969/j.issn.1001-4160.2013.10.026.

[22] 魏建华, 许慨, 蔡颖, 等. 出口水产品中孔雀石绿残留风险评价数学模型的建立[J]. 中国国境卫生检疫杂志, 2012, 35(2): 126-130.DOI:10.16408/j.1004-9770.2012.02.006.

[23] 胡铮瑢, 陈喜生, 罗晨曲, 等. 清蛋糕中金黄色葡萄球菌生长预测模型的建立[J]. 食品安全质量检测学报, 2019, 10(4): 955-961.

[24] 袁彦彦, 王兴芬, 杨浩. 基于关联规则技术的肉类食品冷链物流质量安全保障因素发现及质量安全预警模型[J]. 物流技术, 2015,34(21): 182-185. DOI:10.3969/j.issn.1005-152X.2015.11.049.

[25] 刘金硕, 张智. 一种基于联合深度神经网络的食品安全信息情感分类模型[J]. 计算机科学, 2016, 43(12): 277-280.

[26] 姜同强, 莫名垚, 任钊, 等. 贝叶斯网络及其在白酒安全预警中的应用[J]. 现代食品科技, 2018, 34(6): 288-292; 273. DOI:10.13982/j.mfst.1673-9078.2018.6.040.

[27] 余学军. “互联网+”时代食品安全智慧监管策略研究[J]. 食品工业,2018, 39(8): 244-246.

[28] 张亮, 陈少杰. 面向智慧型城市的食品安全监管体系[J].食品研究与开发, 2014, 35(18): 192-196. DOI:10.3969/j.issn.1005-6521.2014.18.051.

[29] 王冀宁, 吴雪琴, 陈庭强. 人工智能在食品安全智慧监管中的应用研究[J]. 中国调味品, 2018, 43(11): 170-173.

[30] 刘贝贝, 杨子威, 廖芬, 等. 食品安全事件后企业促销策略对品牌资产的影响[J]. 西北农林科技大学学报(社会科学版), 2019, 19(2):152-160. DOI:10.13968/j.cnki.1009-9107.2019.02.18.

[31] 徐成波, 李江一. 食品安全生产对成本影响的实证研究: 基于工业企业数据的经验证据[J]. 贵州财经大学学报, 2018(5): 64-76.

[32] 王春娅, 余伟萍. 食品企业社会责任救赎丑闻品牌的作用边界:感知质量与丑闻范围的调节作用[J]. 财经论丛, 2018(8): 85-96.DOI:10.13762/j.cnki.cjlc.2018.08.008.

[33] 王建华, 陶君颖, 陈璐. 消费者安全食品购买意愿与支付行为: 偏差识别与影响因素[J]. 江海学刊, 2019(3): 86-93; 254. DOI:10.3969/j.issn.1000-856X.2019.03.088.

[34] 范志萍, 程景民, 覃凯. 山西省城乡消费者食品添加剂风险认知现状分析[J/OL]. 中国公共卫生. (2019-04-28)[2019-06-07]. https://kns.cnki.net/KCMS/detail/21.1234.R.20190428.1608.060.html.

[35] 张宇东, 李东进, 金慧贞. 安全风险感知、量化信息偏好与消费参与意愿: 食品消费者决策逻辑解码[J]. 现代财经(天津财经大学学报), 2019, 39(1): 86-98. DOI:10.19559/j.cnki.12-1387.2019.01.007.

[36] 曹文杰, 赵瑞莹. 国际农业面源污染研究演进与前沿: 基于CiteSpace的量化分析[J]. 干旱区资源与环境, 2019, 33(7): 1-9.DOI:10.13448/j.cnki.jalre.2019.190.

[37] 薛庆根, 高红峰. 美国食品安全风险管理及其对中国的启示[J]. 世界农业, 2005(12): 15-18. DOI:10.3969/j.issn.1002-4433.2005.12.005.

[38] 李江华, 赵苏. 对中国食品安全标准体系的探讨[J]. 食品科学, 2004,25(11): 382-385. DOI:10.3321/j.issn:1002-6630.2004.11.103.

[39] 刘宗德, 马霞. 法国家禽质量认证系统对我国食品质量和安全保障体系的启示[J]. 食品科学, 2006, 27(12): 847-850. DOI:10.3321/j.issn:1002-6630.2006.12.218.

[40] 徐建英. HACCP的原理程序以及应用和发展[J]. 食品与发酵工业,1996(5): 77-79. DOI:10.3969/j.issn.0253990X.1996.05.003.

[41] 李正明. 风险评估及食品安全控制[J]. 食品与机械, 1998(3): 11-13.DOI:10.13652/j.issn.1003-5788.1998.03.003.

[42] 黄丽彬, 李柏林, 齐凤兰, 等. 食品工业中HACCP应用现状和未来发展[J]. 食品科技, 2001, 22(2): 4-8. DOI:10.13684/j.cnki.spkj.2001.02.002.

[43] 周洁红. 生鲜蔬菜质量安全管理问题研究[D]. 杭州: 浙江大学,2005: 7-9.

[44] 周洁红. 消费者对蔬菜安全认知和购买行为的地区差别分析[J].浙江大学学报(人文社会科学版), 2005(6): 113-121. DOI:10.3785/j.issn.1008-942X.2005.06.014.

[45] 王志刚, 翁燕珍, 杨志刚, 等. 食品加工企业采纳HACCP体系认证的有效性: 来自全国482 家食品企业的调研[J]. 中国软科学, 2006(9):69-75. DOI:10.3969/j.issn.1002-9753.2006.09.008.

[46] 黄天柱, 王飞, 杨树峰. 基于层次分析法的我国食品质量主体责任研究[J]. 食品工业, 2014, 35(7): 219-222. DOI:10.3969/j.issn.1004-471X.2014.07.219.

[47] 龚玉霞. 基于层次分析法的我国食品安全风险来源管理对策研究[J]. 食品科技, 2013, 38(6): 330-333. DOI:10.13684/j.cnki.spkj.2013.06.074.

[48] 张丽, 滕飞, 王鹏. 基于贝叶斯网络的食品供应链风险评价研究[J].食品研究与开发, 2014, 35(18): 179-182. DOI:10.3969/j.issn.1005-6521.2014.18.047.

[49] 顾小林, 张大为, 张可, 等. 基于关联规则挖掘的食品安全信息预警模型[J]. 软科学, 2011, 25(11): 136-141. DOI:10.3969/j.issn.1001-8409.2011.11.030.

[50] 赵静娴. 基于决策树的食品安全评估研究[J]. 安徽农业科学, 2011,39(32): 20259; 20302. DOI:10.3969/j.issn.0517-6611.2011.32.225.

[51] 雷勋平, QIU R, 吴杨. 基于供应链和可拓决策的食品安全预警模型及其应用[J]. 中国安全科学学报, 2011, 21(11): 136-143.DOI:10.3969/j.issn.1003-3033.2011.11.022.

[52] 夏雪, 丘耘, 胡林, 等. 农产品质量安全追溯系统中信息技术的研究及应用现状[J]. 食品研究与开发, 2014, 35(15): 107-112.DOI:10.3969/j.issn.1005-6521.2014.15.031.

[53] 姜磊. MV与RFID技术在食品生产管理中的应用[J]. 食品工业,2013, 34(8): 185-188. DOI:10.3969/j.issn.1004-471X.2013.08.185.

[54] 刘尧, 高峰, 徐幸莲, 等. 基于RFID/EPC物联网的猪肉跟踪追溯系统开发[J]. 食品工业科技, 2012, 33(16): 49-52. DOI:10.13386/j.issn1002-0306.2012.16.005.

[55] 唐艳薇, 郭中华, 李树庆, 等. 基于QR码的清真牛羊肉质量安全信息追溯系统的设计实现[J]. 江苏农业科学, 2014, 42(10): 395-397.DOI:10.3969/j.issn.1002-1302.2014.10.133.

[56] 施连敏, 郭翠珍, 盖之华, 等. 基于二维码的绿色食品溯源系统的设计与实现[J]. 制造业自动化, 2013, 35(16): 144-146. DOI:10.3969/j.issn.1009-0134.2013.16.043.

[57] 郭波莉, 魏益民, 潘家荣. 同位素指纹分析技术在食品产地溯源中的应用进展[J]. 农业工程学报, 2007(3): 284-289. DOI:10.3321/j.issn:1002-6819.2007.03.055.

[58] 孙丰梅, 杨曙明, 王慧文. 稳定同位素溯源技术在肉类产品中的应用研究进展[J]. 食品与发酵工业, 2007(9): 136-141. DOI:10.13995/j.cnki.11-1802/ts.2007.09.032.

[59] 张淳, 秦世引. 面向食品加工过程智能化的计算机视觉技术进展[J].科技导报, 2010, 28(15): 112-117. DOI:10.3724/SP.J.1087.2010.3207.

[60] 高瑞萍, 刘辉. 电子鼻和电子舌在食品分析中的应用[J]. 肉类研究,2010(12): 61-67. DOI:10.3969/j.issn.1001-8123.2010.12.014.

[61] 王冀宁, 吴雪琴, 陈庭强. 人工智能在食品安全智慧监管中的应用研究[J]. 中国调味品, 2018, 43(11): 170-173.

[62] 赵磊, 毕新华, 赵安妮. 基于区块链的生鲜食品移动追溯平台框架重构[J]. 食品科学, 2020, 41(3): 314-321. DOI:10.7506/spkx1002-20181119-217.

[63] 陶光灿, 谭红, 宋宇峰, 等. 基于大数据的食品安全社会共治模式探索与实践[J]. 食品科学, 2018, 39(9): 272-279. DOI:10.7506/spkx1002-6630-201809041.

[64] 陈谊, 刘莹, 田帅, 等. 食品安全大数据可视分析方法研究[J]. 计算机辅助设计与图形学学报, 2017, 29(1): 8-16. DOI:10.3969/j.issn.1003-9775.2017.01.002.

[65] 韩丹, 慕静. 基于大数据的食品安全风险分析研究[J]. 食品工业科技, 2016, 37(13): 24-28. DOI:10.3969/j.issn.1002-0306.2016.13.024.

[66] KLEINBERG J. Bursty and hierarchical structure in streams[J]. Data Mining and Knowledge Discovery, 2003, 7(4): 373-397. DOI:10.1023/a:1024940629314.

[67] 赵丹群. 基于CiteSpace的科学知识图谱绘制若干问题探讨[J].情报理论与实践, 2012, 35(10): 56-58. DOI:10.16353/j.cnki.1000-7490.2012.10.005.

[68] 维克托·迈尔·舍恩伯格, 肯尼思·库克耶. 大数据时代: 生活、工作与思维的大变革[M]. 杭州: 浙江人民出版社, 2013: 105-127.

[69] MANYIKA J, CHUI M, BROWN B, et al. Big data: the next frontier for innovation, competition, and productivity[EB/OL]. (2011-05-01)[2019-06-07]. https://www.mckinsey.com/business-functions/mckinseydigital/our-insights/big-data-the-next-frontier-for-innovation.

[70] 圣光磊. 一种基于白芍饮片溯源的RFID动态多标签数据清洗改进算法[J]. 贵阳学院学报(自然科学版), 2019, 14(1): 75-79.DOI:10.16856/j.cnki.52-1142/n.2019.01.020.

[71] 钟聪儿, 邱荣祖. RFID在茶叶物流追踪与追溯中的关键应用技术[J].安徽农业大学学报, 2016, 43(6): 1039-1044. DOI:10.13610/j.cnki.1672-352x.20161205.022.

[72] 程铁军, 高原. 基于公众关注角度的食品安全风险预警因素研究[J].食品工业, 2019, 40(1): 272-276.

[73] 洪小娟, 姜楠, 洪巍, 等. 媒体信息传播网络研究: 以食品安全微博舆情为例[J]. 管理评论, 2016, 28(8): 115-124. DOI:10.14120/j.cnki.cn11-5057/f.2016.08.015.

[74] 郭曙超, 龚方, 昃向君, 等. 食品安全检测数据仓库技术的应用与研究[J]. 食品研究与开发, 2013, 34(17): 125-128. DOI:10.3969/j.issn.1005-6521.2013.17.033.

[75] 刘翠玲, 徐莹莹, 孙晓荣, 等. 基于多源大数据食品安全监测预控系统的设计与实现[J]. 食品科学技术学报, 2018, 36(3): 88-94.DOI:10.3969/j.issn.2095-6002.2018.03.013.

[76] 黎建辉, 杨风雷, 崔建业, 等. 全球食品安全信息监控与分析云平台架构研究[J]. 计算机应用研究, 2014, 31(8): 2361-2366; 2376.DOI:10.3969/j.issn.1001-3695.2014.08.029.

[77] 方匡南. 数据科学[M]. 北京: 电子工业出版社, 2018: 1-2.

[78] 刘金硕, 彭映月, 章岚昕, 等. 网络食品安全问题话题发现的LDAK-means算法[J]. 武汉大学学报(工学版), 2017, 50(2): 307-310.

[79] 陈国庆, 吴亚敏, 刘慧娟, 等. 基于荧光光谱和径向基函数神经网络的合成食品色素测定和鉴别[J]. 光谱学与光谱分析, 2010, 30(3):706-709. DOI:10.3969/j.issn.0517-6611.2011.32.225.

[80] 赵静娴. 基于决策树的食品安全评估研究[J]. 安徽农业科学, 2011,39(32): 20259-20302. DOI:10.3969/j.issn.0517-6611.2011.32.225.

[81] 陈谊, 刘莹, 田帅, 等. 食品安全大数据可视分析方法研究[J]. 计算机辅助设计与图形学学报, 2017, 29(1): 8-16. DOI:10.3969/j.issn.1003-9775.2017.01.002.

[82] 陈红倩, 李慧, 方艺, 等. 一种农残检测数据的融合对比可视化方法[J]. 系统仿真学报, 2016, 28(2): 354-360. DOI:10.16182/j.cnki.joss.2016.02.014.

[83] 杨璐, 张馨月, 郑丽敏. 挖掘数据关系的食品抽检数据可视化分析图研究[J]. 农业机械学报, 2019, 50(6): 272-279. DOI:10.6041/j.issn.1000-1298.2019.06.031.

[84] 江美辉, 安海忠, 高湘昀, 等. 基于复杂网络的食品安全事件新闻文本可视化及分析[J]. 情报杂志, 2015, 34(12): 121-127. DOI:10.3969/j.issn.1002-1965.2015.12.023.

[85] 张亮, 陈少杰. 面向智慧型城市的食品安全监管体系[J].食品研究与开发, 2014, 35(18): 192-196. DOI:10.3969/j.issn.1005-6521.2014.18.051.

[86] 席磊, 张浩, 郭伟, 等. 分布式无公害农产品数字认证系统的构建与实现[J]. 农业工程学报, 2010, 26(8): 236-242. DOI:10.3969/j.issn.1002-6819.2010.08.040.

[87] 沐晓馥. 基于AHP的检验检测机构检测能力管理信息系统绩效评价方法研究[J]. 中国管理信息化, 2016, 19(22): 46-47. DOI:10.3969/j.issn.1673-0194.2016.22.029.

[88] 刘根华, 郑文钟, 李铭熙. 行业协会参与食品安全“共治”困境及对策研究: 以浙江省金华市为例[J]. 浙江师范大学学报(社会科学版),2017, 42(6): 100-105. DOI:10.3969/j.issn.1001-5035.2017.06.100.

[89] 谢康, 刘意, 赵信. 媒体参与食品安全社会共治的条件与策略[J].管理评论, 2017, 29(5): 192-204. DOI:10.14120/j.cnki.cn11-5057/f.2017.05.018.

[90] 张宇东, 李东进, 金慧贞. 安全风险感知、量化信息偏好与消费参与意愿: 食品消费者决策逻辑解码[J]. 现代财经(天津财经大学学报), 2019, 39(1): 86-98. DOI:10.19559/j.cnki.12-1387.2019.01.007.

[91] 阮彤. 大数据技术前沿[M]. 北京: 电子工业出版社, 2016: 1-20.

[92] 李茂腾. 何为ESI“高被引论文”和“热点论文”?[EB/OL]. (2018-05-14)[2019-06-06]. http://blog.sciencenet.cn/home.php?mod=space&uid=3319332&do=blog&id=1113935.

[93] 李杰. CiteSpace中文版指南[EB/OL]. (2015-05-03)[2019-06-07].http://cluster.ischool.drexel.edu/~cchen/citespace/manual/CiteSpaceChinese.pdf.

Scientometric Analysis of Cross-Disciplinary Studies on Food Safety and Data Science in China

SHAO Hang1,2,3, SONG Yinghua1,2,3,*, LI Moxiao1,2,3,*, SHAO Wei4, LEI Shengjiao4, KU Renjun1,2,3, XIA Yaqiong1,2,3
(1. China Research Center for Emergency Management, Wuhan University of Technology, Wuhan 430070, China;2. Hubei Collaborative Innovation Center for Early Warning and Emergency Response Technology, Wuhan 430070, China;3. School of Safety Science and Emergency Management, Wuhan University of Technology, Wuhan 430070, China;4. School of Biology and Pharmacy, China Three Gorges University, Yichang 443001, China)

Abstract: China’s 13th Five-Year Plan for National Food Safety proposes to enhance the capacity of technical support for food safety. The collection, storage and mining of food safety data are a crucial part of food safety technology. Analyzing the achievements that have been made in cross-disciplinary studies on food safety and data science and exploring future trends in this area in China are of great practical significance for promoting the application of data-driven food safety technology.In this study, the China National Knowledge Infrastructure database was retrieved for “topic containing food safety AND data”, and totally 3 375 pieces of literature information published in 1996-2019 were collected and used as dataset for mining scientific and technological texts by scientometric method and Citespace software. Moreover, data visualization was carried out by using keywords clustering map, time line map and burstness map. It was found that the number of published papers in this field was increased exponentially in the past 23 years. Totally, 3 categories and 11 sub-categories of subject clustering were formed, and the development process involved 3 stages by time line clustering: 1996-2006, 2007-2014 and 2015-2019. Those studies showed that the cross-disciplinary study on food safety and data science in China has reached a certain scale in terms of output, cooperation and research topics, and is currently developing rapidly under the guidance of new disciplinary growth points.

Keywords: food safety; data science; scientometrics; Citespace; data visualization; cluster analysis; research hotspots

收稿日期:2019-06-08

基金项目:国家社会科学基金重大项目(15ZDB168);中央高校基本科研业务费专项资金项目(195261008);湖北省自然科学基金项目(2019CFB340);宜昌市应用基础研究项目(A19-302-02);武汉理工大学研究生优秀学位论文培育项目(2017-YS-022);武汉理工大学自主创新研究基金项目(2019IVA013);武汉理工大学自主创新研究基金项目(2019V1031)

第一作者简介:邵航(1994—)(ORCID: 0000-0001-9816-3921),男,硕士研究生,研究方向为食品安全管理、数据挖掘与公共安全、人工智能与安全仿真、安全科技与情报管理。E-mail: shaohang1994@163.com

*通信作者简介:

宋英华(1962—)(ORCID: 0000-0003-0372-3397),男,教授,博士,研究方向为突发事件应急管理、公共管理、协同决策。E-mail: song6688c@163.com

李墨潇(1987—)(ORCID: 0000-0002-0294-8044),男,讲师,博士,研究方向为安全科学与工程、食品安全、矿山安全、应急管理。E-mail: lmx@whut.edu.cn

DOI:10.7506/spkx1002-6630-20190608-078

中图分类号:TS201.6

文献标志码:A

文章编号:1002-6630(2020)13-0291-11

引文格式:

邵航, 宋英华, 李墨潇, 等. 我国食品安全与数据科学交叉研究的科学计量学分析[J]. 食品科学, 2020, 41(13): 291-301.DOI:10.7506/spkx1002-6630-20190608-078. http://www.spkx.net.cn

SHAO Hang, SONG Yinghua, LI Moxiao, et al. Scientometric analysis of cross-disciplinary studies on food safety and data science in China[J]. Food Science, 2020, 41(13): 291-301. (in Chinese with English abstract) DOI:10.7506/spkx1002-6630-20190608-078. http://www.spkx.net.cn