[国际粮食政策研究所]：气候智能型作物保险工具：将农民的照片与动态作物建模相结合，以便在收获前准确估算产量

热门搜索：

气候智能型作物保险工具：将农民的照片与动态作物建模相结合，以便在收获前准确估算产量

2018-12-15国际粮食政策研究所陈***

气候智能型作物保险工具：将农民的照片与动态作物建模相结合，以便在收获前准确估算产量B.K. Singh博士、Dulal Chakraborty、Naveen Kalra博士和Jaya Singh博士*1. 介绍农业经济中的决策者和农业生产者必须在农产品的需求和供应之间取得平衡。例如，在印度，最近两个良好的季风季节导致产量过剩。由于农产品不能长期储存，这些产品的收获后价格趋于下降。通常，将产品运输到最近的市场变得不经济。这些价格暴跌导致社会经济问题、农民骚乱、食物浪费，甚至农民自杀。另一方面，产量下降可能引发不成比例的价格上涨，导致其他类型的社会经济问题和城市动荡。虽然经常用于解决减产风险，但对农民的作物保险补偿仍然相对不科学和主观。因此，政策制定者需要在供需之间取得平衡，并创造缓冲以防止价格冲击（上涨和下跌）。在出现短缺或盈余之前对农产品进出口进行规划，需要在作物成熟之前提供有关作物生产状况的真实信息。然而，没有万无一失的机制可以在收获前确定作物产量。BKC Weathersys一直在开发一款名为“Fasal Salah”的应用程序，该应用程序为农民提供与他们种植的作物相关的天气咨询。通过此应用程序，农民需要以预定的方式发送反馈以及作物图片。使用动态作物模型和人工智能分析，BKC已经能够生成*辛格博士（PI）;Jaya Singh博士（BKC WeatherSys Pvt Ltd董事）;杜拉尔·查克拉博蒂先生;Naveen Kalra博士是BKC Weathersys的顾问。报告由 *BKC （Weathersys） Pvt. Ltd.，印度根据合同编号提交2017年x393.bkc.in(1 - IFPRI 2017 - 18加以小麦)我们感谢国际粮食政策研究所（IFPRI）市场贸易和机构司研究员Berber Kramer博士委托我们进行这项用于产量预测图片分析的研究。我们还要感谢Koen Hufkens为我们提供了R程序，可以更详细地计算图像参数。我们还要感谢Francisco Ceballos和Samyuktha Kannan女士随时准备提供帮助。本研究的资金支持由国际粮食政策研究所（IFPRI）下属的CGIAR政策、机构和市场研究计划（PIM）提供。我还要感谢博洛格南亚研究所，他为我们提供了宝贵的分析数据。一种在收获前准确计算作物产量的算法。这项服务已经成功地与来自印度各地的大量农民合作。大规模整合这项技术可以使作物产量估算在足够的时间内提供，使政策制定者能够更有效地规划粮食进出口。更重要的是，这项服务还可以作为改善作物保险的工具，因为不再需要检查员亲自检查作物以评估损失和处理索赔。国际粮食政策研究所（IFPRI）目前正在使用一个名为“小麦摄像头”的应用程序进行类似的研究。在这个项目中，在南亚博洛格研究所（BISA）的协助下，旁遮普邦和哈里亚纳邦选定的小麦农民发送了2016-2017和2017-2018作物年度的作物图片。由于BKC和IFPRI在这方面的工作惊人地相似，IFPRI提供了对其农民数据和作物图片存储库的访问，并委托BKC审查以下问题：1.图片发送的农民可以预测收益率吗?2.基于图片的产量预测能否与作物模型衍生的产量相关联？3.将基于图片的方法与作物模型相结合是否能提供更准确的产量估算？本报告描述了如何使用农民的作物图景来预测产量、改进作物咨询和微调动态作物模型。2.输入的研究图1:IFPRI的农民 IFPRI提供了旁遮普邦和哈里亚纳邦选定小麦农民的综合数据库（图1），涵盖2016-17作物年度（来自737名农民的9，073张图片）和2017-2018年（来自2072名农民的15，190张图片）。该数据库包含作物的确切位置和图片。IFPRI还提供了农民在生长季节结束时通过进行作物切割实验（CCE）获得的实际产量BKC根据每个农民的地理位置为每个农民编制了一个完整的天气数据集。每天的天气参数 - 即温度（最小-最大值）、湿度、降雨量、辐射、作物品种、土壤质地、蒸发量以及风速和风向 - 用于通过运行作物模型来确定产量。3.收益率的确定:方法3.1使用BKC的动态模型（metGIS Agro）确定产量BKC基于从DSSAT等知名作物模型（如DSSAT（农业技术转让决策支持系统）、Info Crop、Soltani和Sinclair等知名作物模型中得出的显著特征，发展出动态作物模型（图2）。图2:metGIS农业BKC的动态作物模型（metGIS Agro）考虑了大面积作物和土壤的实际田间状况，以及种植的作物品种和实时天气因素，如温度、相对湿度、太阳辐射、蒸散、降水和土壤湿度等。该metGIS Agro是BKC的专有软件，为农学家提供来自各种来源和格式的数据，以及一套完整的用于数据显示、操作、分析和图像处理的工具。该软件还允许通过文本和语音消息以及电子邮件自动发送个性化咨询和公告（图 3）为了开发作物模型（图3），创建了许多数据库：农民数据库，作物生理学数据库，天气数据库和土壤数据库。农民数据库包括农民提供的投入;此信息有助于产量计算。这些输入包括作物名称、作物品种、作物播种日期和地理位置（纬度和经度）。图3:作物模型作物生理学数据库包括作物的生理参数，如作物生长周期、生长期数（GDD）、叶面积指数（LAI）等相关参数。GDD 按照以下既定公式每天计算：GDD = (T马克斯- t最小值/ 2)- - - T基地方程1天气数据库包括五个对作物生长和作物产量影响最大的天气参数。这些参数是温度（最小和最大）、降雨量、GHI（全球水平辐照度）、土壤湿度、湿度和土壤温度;它们是针对种植作物的每个位置实时收集的。将这些参数与基于位置的土壤物理信息相结合，有助于制定产量估算方程。3.2使用智能手机图片确定产量：卷积神经网络（CNN）模型的使用从广义上讲，深度学习是一种人工智能技术，其中开发人员和研究人员使用大量数据（称为训练集）来教计算机系统从图像或声音等输入中识别模式。我们尝试了流行的提取的基于参数的深度神经网络（DNN）模型和多层感知器（MLP），以及卷积神经网络（CNN）等图像处理DNN模型;我们发现后者更准确。卷积神经网络的概念是由福岛（1980）提出的，尽管LeCun等人（1998）报告了第一个卷积神经网络（CNN或ConvNet）以“LeNet-5”的形式出现。CNN利用了数据的空间性质。在自然界中，我们通过形状、大小和颜色来感知不同的物体。例如，自然场景中的对象通常由边、角/顶点（由两条或多条边定义）、色块等组成。这些基元通常使用不同的检测器（例如，边缘检测或颜色检测）或检测器的组合来识别，以促进现实世界中与视觉相关的任务中的图像解释（对象分类、感兴趣区域检测、场景描述等）。这些检测器也称为过滤器。卷积是一种数学运算符，它将图像和过滤器作为输入并生成过滤后的输出（表示输入图像中的边缘、角、颜色等）。从历史上看，这些滤波器采用一组权重的形式，这些权重通常是手工制作的或用数学函数建模的（例如，高斯（Huertas and Medioni，1986），Laplacian（Mintz，1994）或Canny滤波器（Canny，1986））。滤波器输出通过模拟称为神经元的人脑细胞的非线性激活函数进行映射。卷积网络提供了一种直接从数据中学习这些过滤器的方法，而不是通过明确的数学模型，并且已经发现与历史上制作的过滤器相比（在实际任务中）更好。对于卷积网络，重点是学习滤波器权重，而不是单独学习完全连接的成对（输入和输出之间）权重。通过这种方式，与传统的多层感知器网络相比，学习所需的权重数量减少了。在卷积网络中，人们学习几个过滤器，数量从个位数到数千个不等，具体取决于网络的复杂性。许多CNN原语已被证明在大脑的视觉皮层中具有概念上平行的成分。视觉皮层中的神经元在其输入细胞的某个区域受到刺激时会发出反应。该区域被称为神经元的感受野（RF）。等价地，在卷积层中，对应于输入层中某些位置的滤波器尺寸的输入区域可以被认为是感受野惟一的ID情节ID 1情节ID 2卷积层中的节点。流行的深度CNN或ConvNets（如AlexNet（Krizhevsky，Sutskever和Hinton，2012），VGG（Simonyan和Zisserman，2014），Inception（Szegedy，Ioffe和Vanhoucke，2016），ResNet（He，Zhang，Ren和Sun，2015））用于各种计算机视觉任务，具有许多这些架构基元（灵感来自生物学）。我们在这里报告一个简单的多层CNN模型，该模型从具有已知产量的作物图片中学习并将其应用于未知产量的作物图像;然后，我们将这些结果与作物模拟模型的产量进行比较，以改进估计。3.2.1 CNN模型在2016-2017年作物季节，我们检查了2016年11月至2017年4月期间737名农民报告的9，073张智能手机图片。在2017-2018季节，我们检查了来自6，820个地块的373名农民分享的15，190张小麦图片。农民通过唯一的6位数人口普查村庄代码和地块编号来识别。然而，在737名农民中，只有437名农民的地块的产量通过作物切割得到验证;因此，只有这437名农民报告的图片被用于2016-2017年CNN模型的培训和评估。图片数据库按以下层次结构进行组织（图 4）。图4:图片数据库的层次结构田间农民使用名为“Wheatcam”的移动应用程序将他们的图片上传到IFPRI服务器，然后将文件存储在图1所示的层次结构中，并在用于访问数据库中数据的索引文件中添加一个条目。所有照片均应在上午10点至下午2点之间在相同的照明条件下以固定方向（横向）和标准文件命名约定（如下所示）拍摄。dddddd_n_sssssssssssss其中 dddddd 是 6 位唯一 ID，n 是个位数站点 ID，SSSSSSSSSSS 是以毫秒为单位的 13 位时间戳。我们的目标是训练一个分类器来识别一组来自麦田的智能手机图片，并具有相应的作物产量。我们对每张图片都遵循了五个处理阶段的标准集合：a）读取数据，b）预处理数据，c）创建模型，d）学习模型参数，以及e）评估（又名测试/预测）模型。映像ID 1映像ID n映像ID 1映像ID n a)数据读我们使用Python中的Microsoft Cognitive Toolkit（CNTK）（Seide，2017）框架来读取数据，并使用卷积神经网络进行实验，以根据作物田的加工作物田图片预测作物产量。然后，我们使用神经二元分类在图片和数值作物模型输出之间进行选择，以提高估计的准确性。Microsoft Cognitive Toolkit （CNTK）（Seide， 2017），以前称为CNTK，最初由微软的计算机科学家开发，他们想要一种工具来更快，更有效地执行自己的研究。出于性能原因，CNTK 库是用 C++ 编写的，但 v2.0 包含新的 Python 语言 API，现在是使用该库的首选方式。CNTK 同时支持 CPU 和 GPU（图形处理单元）。可以通过不同的方式将数据读入CNTK。最简单的方法是使用Python中的NumPy / SciPy / Pandas阅读器将数据加载到内存中。但是，这只能对小型数据集执行。由于深度学习需要大量数据，因此我们选择利用内置的分布式读取器，这些读取器可以毫不费力地扩展到 TB 级数据。输入数据的格式为文本文件。这些文本文件的每一行采用以下形式：|标签 0 0 0 0 0 |特征 0 0 0 0 ...（88 x 88 x 3 个整数，每个整数代表一个像素）我们使用了与名为“features”的整数流相对应的图像像素。我们定义了一个create_reader函数，用于使用 CTF（CNTK 文本格式）反序列化程序读取训练和测试数据。标签是1-hot编码的（Bishop，2009）。b)预处理的数据尽管农民应该以固定的方向（风景）上传图片，但从一个农民到另一个农民确实发生了变化;因此，仍然需要检查和预处理每张图片以符合标准

点击免费查看完整报告