为保证数据的质量要求,在整个数据处理过程中采取了如下措施:
(1)数据采集方面,采用农业农村部畜牧兽医局和全国畜牧总站的数据作为数据源,保证数据来源真实可靠且有据可查。
(2)数据处理方面,按照完整性、一致性、连续性等原则对原始数据进行对比查证、筛查、鉴定、剔除等规范化处理,此外,在使用软件对数据进行处理的过程中严格遵循软件使用指南。
(3)数据校对方面,数据处理后经过组内成员多人核查,避免因人工误差影响数据的准确性。
本次研究数据为2019–2022年全国及29个省份的玉米和豆粕集贸市场(周度)/集市(月度)价格数据,对比分析价格变化趋势较为单一,因此通过Excel透视表AVERAGE函数以全国及29个省份(自治区、直辖市)为单位,按照周、月、季的顺序逐步计算平均值,将时间跨度提升至季度。
对于研究数据中的数据缺失,豆粕/玉米集贸市场周度数据采用SPSS中邻近点平均值的方式进行填补,邻近点的跨度为2。豆粕/玉米集市价格月度数据因缺失值出现在2019年1月和2月且2019年月度价格较为平滑,采用3月和4月的均值作为1月缺失值的填充,1月和3月的均值作为2月缺失值进行填充。
非连续性数据缺失填充情况:(1)豆粕集贸市场价格:2020年第40周、2021年第2周、2021年第6周、2021年第17周、2021年第39周、2022年第4周。(2)玉米集贸市场价格:2020年第8周、2020年第40周、2021年第2周、2021年第6周、2021年第17周、2021年第39周、2022年第4周。
连续性数据缺失填充情况(均为2019年1月和2月):(1)玉米集市价格:\(\text{ }\)江苏、浙江、安徽、福建、江西、山东、河南、湖北、湖南、广东、海南、重庆、四川、贵州、云南、陕西、甘肃、青海、宁夏、新疆。(2)豆粕集市价格:上海,其余省份(自治区、直辖市)同玉米集市价格相同。