作者:王辉等   来源:   发布时间:2023-12-19   Tag:   点击:
[麻进展]基于ARIMA模型的苎麻纤维产量预测研究

 :为了解长期定位试验下苎麻纤维产量的变化趋势推动苎麻种植产业增产提效基于苎麻多倍体1号品种2010—2019年共30个收获期的纤维产量数据构建ARIMA纤维产量预测模型并对模型精度进行验证。结果表明:ARIMA(203)模型最佳4个收获期中纤维产量预测值与实测值的平均相对误差百分比为7.72%,整体预测效果较好,适用于该地区多倍体1号纤维产量的短期预测

关键词:苎麻;ARIMA模型;时间序列;产量预测

 

苎麻是多年生草本植物是我国重要的特色经济作物。课题组利用自回归滑动平均模型(Autoregressive Integrated Moving Average Model,即ARIMA)对长期定位试验下苎麻的纤维产量展开分析和预测能够探究其长期生产过程中的内在潜力和时空变化为相关部门制定苎麻产业政策等提供依据。关于作物产量预测研究常用的方法有多元回归?神经网络和时间序列等而时间序列方法中采用ARIMA模型的比较多。ARIMA模型主要从变量间的因果关系分析着手重点探究产量与因素间的相互联系在产量的短期预测方面有着广泛应用。基于时间序列方法对苎麻纤维产量预测展开的研究较少且采ARIM模型进行预测分析的更是鲜见报道。

 

1 试验情况介绍

1.1 试验设计

试验用地位于湖南农业大学国家麻类长期定位试验基地试验品种为苎麻多倍体1号。课题组于20095月采集嫩枝扦插育苗同年6月移栽株距45cm栽培密度3.30×104·hm-2,面积20m2,品种重复4次。

 

1.2 数据选取

选取苎麻多倍体12010—2019年所有收获期(每年3个收获期30)的纤维产量数据另外从2020年?2021年的收获期中各选2个收获期的数据进行比较验证模型精度。

 

1.3 处理方法

1.3.1 数据平稳性检验

12010—2019年多倍体1号各收获期纤维产量的时间序列图。由图1可知虽然多倍体1号的纤维产量序列整体来看围绕某一数值上下波动但是难以直接判断该数列是否处于平稳状态因而需要对其进行检验。

1多倍体1号纤维产量时间序列图

   

利用Eviews软件对纤维产量时间序列进行ADF检验结果见表1。由表1可知:ADF统计量的P值为0.01,明显小于0.05可以认为苎麻纤维产量序列在1%显著性水平下是平稳序列。由此确认多倍体1号纤维产量序列属于平稳数列不需要进行差分处理。

1 多倍体1号纤维产量序列ADF检验表

  

 

1.3.2 模型系数的选取

ARIMA模型的表达式为ARIMA(pdq)。其中:AR是自回归p为自回归项MA为移动平均q为移动平均项数d为时间序列成为平稳序列时所做的差分次数。一般通过判断序列的自相关系数(ACF)和偏自相关系数(PACF)的拖尾或结尾情况确定p?q值。由表1可看出多倍体1号纤维产量为平稳序列因此ARIMA(pdq)预测模型中的d值取0即确定为ARIMA(p0q)最后对模型中的两个参数pq进行多种组合选择利用拟合优度R2?AICBIC准则评判拟合模型的优劣从中选择R2最大?AICBIC值最小的模型。采用SPSS软件对多倍体1号纤维产量数据进行处理可知自相关系数和偏自相关系数均存在拖尾现象可以初步确定模型中p?q阶数为23。为找出最佳模型p?q阶数为23的模型进行比对相关参数结果见表2

2 多倍体1号纤维产量ARIMA系列模型的各项参数构成

  

由表2可知所列的9ARIMA纤维产量模型中以ARIMA(203)?ARIMA(303)R2值最高均为0.75,其次为ARIMA(301),其R2值为0.72,而其他模型的R2值均小于0.70基本上可以排除。接下来再对上述3个模型的AICBIC值大小进行比较:从数值来看ARIMA(203)模型的AIC?BIC值分别为89.90?99.70,小于ARIMA(303)模型的数值93.77?104.98,也小于ARIMA(301)模型的数值92.98?101.39,因此,可以进一步排除ARIMA(303)ARIMA(301)两个模型,从而得到最优的多倍体1号纤维产量预测模型,即ARIMA(203),该模型的相关评价指标如表3所示。

3 多倍体1号纤维产量ARIMA(203)模型参数表

  

 

1.3.3 模型预测与精度验证

通过对时间序列的分析处理可以对其未来的发展趋势进行预测[3]。将ARIMA(203)纤维产量预测模型获取的2010—2019年共30期的纤维产量与实际值进行拟合分析同时比对2020?20214个收获期(每年各选2)的纤维产量的预测值和实测值检验模型的预测效果。

 

2 结果与分析

2.1 多倍体1号纤维产量的拟合结果分析

利用ARIMA(203)模型拟合的苎麻多倍体12010—2019年各收获期纤维产量相关参数指标如表4所示。由表4可知:模型的R20.75RMSE0.97×102kg·hm-2,平均误差百分比(MAPE)8.41%,小于10%,平均绝对误差值(MAE)0.59×102kg·hm-2,最大误差百分比为32.34%,最小为0.22%,最大绝对误差为2.83×102kg·hm-2,最小为0.02×102kg·hm-2。多倍体1号纤维产量中的大多数拟合值与实测值接近表明模型的拟合精度较好。

4 多倍体1ARIMA(203)模型的估计和参数结果

  

 

2.2 多倍体1号纤维产量的预测结果分析

将多倍体1号在2020?2021年的4个收获期的预测纤维产量与实测值进行对比结果如表5所示:4个收获期苎麻纤维产量的绝对误差值分别为0.05?0.03?0.761.13×102kg·hm-2,相对误差百分比分别为0.67%?0.45%?9.74%20.00%,平均相对误差百分比为7.72%,其中2021年三麻的预测精度偏差较大,相对误差百分比为20%2020年三麻的纤维产量预测精度最佳,相对误差百分比仅为0.45%4个预测收获期中有两期的纤维产量相对误差百分比小于1%。总体来看ARIMA(203)纤维产量模型的预测效果较好。

5 多倍体12020?2021年的收获期纤维产量预测精度比对

  

 

3 总结与讨论

本文基于苎麻多倍体1号长期定位试验中2010—2021年的纤维产量数据引入ARIMA模型同时结合前人的相关研究成果构建了ARIMA(203)纤维产量预测模型。模型的决定系数R20.75,平均相对误差为7.72%预测精度高于赵嘉宝等和蔡承智等学者研究的精度对苎麻种植地区无损预测纤维产量有较高应用价值。本研究在构建作物产量ARIMA预测模型时既不受作物外部生长的环境和气象因素影响也不考虑生产过程中相关要素的变动情况主要依托历史产量的时间序列来集中对内外部因素进行动态反应预测结果取决于序列的平稳性。与传统作物产量预测模型构建方法相比此预测模型具有数据样本少?运算方便的特点但在预测效果上存在差异精度有待进一步提高。苎麻是多年生草本植物其产量受多种因素影响因此后续还可以引入多个影响因子综合运用神经网络?随机森林等机器学习算法开展苎麻纤维产量的组合模型研究尽可能真实地推演苎麻多年栽种情况下纤维产量的变化。

 

 

参考文献

[1] 杨洁,唐昀,申香英,等.我国苎麻产业现状与振兴发展[J].中国麻业科学,2022(4):253?256.

[2] 高卫,张电学,雷利君,等.中国粮食产量影响因素分析及研究方法综述[J].安徽农业科学,2014(33):11954?1195511958.

[3] 王霞,房少梅.数学建模经验总结[J].教育现代化,2017(21):81?8287.

[4] 赵嘉宝,陈杰,安霞,等.基于ARIMA模型的吐鲁番市葡萄产量预测分析[J].江苏科技信息,2019(31):34?39.

[5] 蔡承智,杨春晓,莫洪兰,等.基于ARIMA模型的中国水稻单产预测分析[J].杂交水稻,2018(2):62?66.

文章摘自:王辉. 基于ARIMA模型的苎麻纤维产量预测研究[J]. 江苏经贸职业技术学院学报202305.003.


更多阅读