肥料登记数据分析
数据预处理
- 产品通用名称规范化:针对附件1中肥料产品通用名称不规范的情况,进行了规范化处理,包括修改名称命名规范、去除空格和换行符、统一链接符等。规范化后的名称包括“床土调酸剂”、“复混肥料”、“有机肥料”、“有机-无机复混肥料”。
- 计算总无机养分百分比:计算了肥料产品的总无机养分百分比,公式为总氮百分比+五氧化二磷百分比+氧化钾百分比。
肥料产品数据分析
-
复混肥料分析:
- 筛选出复混肥料并按总无机养分百分比分为10组,其中第7组登记数量最多(2098个)。
- 使用K-Means聚类算法对复混肥料进行聚类,分为4类:
- 类型1:总氮百分比高。
- 类型2:五氧化二磷百分比高。
- 类型3:氧化钾百分比高。
- 类型4:三种属性均偏低。
- 聚类结果通过三维散点图、散点图矩阵和雷达图进行分析,验证了聚类的有效性。
-
有机肥料分析:
- 筛选出有机肥料并按总无机养分百分比和有机质百分比分为多个组,其中(1,6)组登记数量最多(840个)。
- 绘制有机肥料产品的分布热力图,发现大部分产品的总无机养分百分比处于0.0501~0.12608之间,有机质百分比处于0.45~0.72之间。
肥料产品多维度对比分析
-
复混肥料产品登记数量变化趋势:
- 复混肥料登记数量总体呈先上升后下降趋势。
- 历年登记数量排序基本为“第7组>第6组>第5组>第8组>第4组”,其中第9、1、10组登记数量极少。
- 结论:
- 市场对总无机养分百分比在0.216~0.576之间的复混肥料需求较高。
- 市场对总无机养分处于0.36~0.504之间的复混肥料需求下降。
- 市场对高总无机养分的复混肥料需求降低。
- 市场对总无机养分为中浓度的复混肥料需求稳定。
-
有效有机肥料产品分析:
- 提取出2021年9月30日仍有效的有机肥料产品。
- 广西省和湖北省的产品登记量主要集中在总无机养分百分比0.0501~0.08809,有机质百分比0.45~0.54的区间。
- 湖北省的肥料元素含量更稳定。
-
企业相似系数:
- 对10家产品登记数大于10的企业进行相似系数计算,发现ID3和ID6、ID3和ID7、ID6和ID7显著相似。
肥料产品属性提取
-
氮、磷、钾、有机质百分比及含氯程度提取:
- 对附件4的技术指标进行规范化处理,并利用正则表达式提取氮、磷、钾养分和有机质的百分比,以及肥料含氯的程度。
- 提取结果保存在“result4_1.xlsx”文件中。
-
原料名称及其百分比提取:
- 对原料与占比数据进行预处理和规范化,并利用正则表达式提取各种原料的名称及其百分比。
- 提取结果保存在“result4_2.xlsx”文件中。