DOI:10.3969/j.issn.1672-3872.2024.02.003
基金项目:江苏中烟工业有限责任公司科技项目“基于苏产卷烟品牌需求的烟叶原料基地层级优化研究”(Y04H202001)
作 者:王桂瑶1 ,李少鹏2 ,詹 映3 ,田 震2 ,郭建华1 ,宋纪真1
(1. 中国烟草总公司郑州烟草研究院,河南 郑州 450000;2. 江苏中烟工业有限责任公司,江苏 南京 210000; 3. 上海创和亿电子科技发展有限公司,上海 200092)
摘 要:【目的】在近红外定量模型建立过程中,通过剔除异常样本,可以提高模型整体的稳定性和精度。【方法】课题组采用 PCA马氏距离法、半数重采样法、蒙特卡洛偏最小二乘交叉检验法对异常样本进行剔除后,利用PLS建立烟叶中多酚类物质咖啡奎尼酸模型,通过模型的平均绝对误差、平均相对误差、相关系数(R)和均方差(RMSEC)进行对比分析。【结果】采用三 种方法剔除异常样本后所建模型结果:马氏距离法平均绝对误差为0.15,平均相对误差为2.32%,RMSEC为0.15,R为0.94;半数重采样法平均绝对误差为0.17,平均相对误差为2.43%,RMSEC为0.17,R为0.92;蒙特卡洛偏最小二乘交叉检验法平均 绝对误差为0.14,平均相对误差为2.01%,RMSEC为0.14,R为0.95。【结论】采用蒙特卡洛偏最小二乘交叉检验法剔除异常样本较其他方法效果更佳。
关键词:马氏距离;蒙特卡洛;相关系数;模型
引文信息:[1]王桂瑶,李少鹏,詹映,等.基于近红外光谱技术的多酚类物质异常样本识别方法研究[J].南方农机,2024,55(2):10-12+25.
查看全文请下载PDF文件↓