大数据时代
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

4. 智慧农业

东北吉林省,一望无际的稻田再过两个月就会迎来收获期。

与此同时,东北已经进入了稻瘟病的高发期,因此这也是防病灾最为关键的阶段。稻瘟病是一种伴随水稻整个生长周期的病害,每年仅在中国就会造成50万吨稻米的损失。

伴随着阴雨天的到来,稻瘟病正在悄然逼近。此时也是农民刘宾最担心的时刻,因为他的50亩稻田是全家一年的主要经济来源。“眼下这个季节多雨,而雨后的高湿高温天气最容易引发稻瘟病。”根据刘宾的经验,他家稻田染病的概率很高。

由于病灾发展速度快,打药的时机必须准确把握。虽然刘宾种了一辈子地,但是要把握好打药的时机并不容易。据刘宾介绍,打药的时机除必须在晴天以外,还要避开中午,但现在就是阴天,且雨一下就是一整天,此时水稻不可能得病,等过几天雨下完了,病菌也已经形成了,这时候再防治已经晚了。

倪光南

中国工程院院士

实际上,早在夏商周时期,中国人就已经开始通过数据来指导农业生产,只不过这些数据往往来源于漫长岁月的经验积累。例如,我们所熟知的二十四节气就是这种经验数据所凝结而成的。下雨时大家说“早霞不出门,晚霞行千里”,或者有些局部地区看见月亮边上有个光圈就知道明天要下雨,这都是过去人们的常识,在这些常识的背后,也是从数据中提炼出来的一些结论。

就在刘宾担心稻瘟病即将大规模暴发之前,他迎来了一群特殊的客人。

科百科技农业项目工程师吴龙春,是一名植保专业技术人员。他以前是学植保的,于2015年开始接触大数据技术。他的这次到来,并不是应用课本知识来指导刘宾,而是要利用大数据来解决农作物病虫害难于防治的难题。

吴龙春要做的不是通过眼睛观测天象,而是通过现在的传感设备采集到的数据来总结规律和分析判断。在吴龙春的指导下,刘宾在地里挖了一些坑(长和宽分别为30厘米和40厘米),用于安装无线传感设备,以便精准地控制水位的高低。

吴龙春带来的这些传感设备采用无线通信技术与网络互联,因此它不需要布设电线电缆。所有的数据采集完之后,都会通过设备上的微型无线天线传输到后台的主基站。通过这些传感设备,可以获取方圆1.5千米范围内的空气温度、湿度和土壤水分等数据,然后通过对这些气象数据进行建模分析,以预测稻田的生长走势。

其中,最为关键的就是叶面温湿度传感器,它主要获取稻子叶片的温湿度。温度是诱发稻瘟病的重要因素之一,因此要想获取准确的温度,传感器安装的位置极为关键。

吴龙春选择了中间层的叶子,这里的叶子相对来说发育比较健全,呼吸与光合作用也比较强,尤其是第三片和第四片叶子,因为正处于“青壮年”阶段,比较具有代表性。

工程师们安装完这十几种数据采集设备后,刘宾家的稻田环境数据就会实时传输到数据平台上。而这些数据除能为播种和收获提供时节依据、提高自身产量以外,还有一项更为重要的作用—预测病虫害的发生。

吴龙春表示,稻瘟病的爆发是在一定条件之下才能发生的,所以我们通过这种传感器采集它的一些相关数据,用数据的形式将植物的一些生理需要,或者说植物的一些特性展现出来,再经过一系列的模型与算法分析,最终会得到一个相对精准的预警信息。这个预警信息可以指导农户在一个相对精准的时间段喷药,或者采取一些防治措施。

时下,东北的水稻已经进入孕穗期,是水稻生长期中最关键的阶段。只要过了这个时期,一切就安全了。

由于8月高温,9月多雨,这种高温接着高湿的气候,极易导致稻瘟病的发生。

要来的终归还是来了,刘宾最担心的情况出现了。

但好消息也及时从远方传来,并最终令刘宾如释重负。区域性气候条件是决定稻瘟病是否爆发流行的关键性因素,通过对稻田的温度、湿度、光照、风力和风向等数据的实时监控与分析,专家们最终为刘宾提供了准确的打药时间。

困扰了农民几千年的难题,如今正在被大数据改变。

刘宾相信,这一回,他可以安心等到丰收了。

此时的吴龙春正在奔赴下一个场地,他这次要迎接几位远道而来的特殊客人。这是一批来自联合国环境署的专家,到吴龙春团队的项目基地来考察大数据的试点应用。联合国环境署专家这次来的目的,就是想把中国的农业大数据技术推广到世界上其他的国家和地区。

民以食为天,粮食是人类赖以生存、发展的基础。千百年来靠天吃饭的传统农业模式正在悄然改变,无论是进行育种,还是监控作物生长的全周期,或预测收获的时间节点,大数据都能为其提供帮助。如今的人们,可以更好地从自然中获取生存资源,合理利用自然,并与自然和谐相处。

黄世文

中国水稻研究所研究员

几千年来,人类与大自然的抗争一直没有停歇。与大自然的抗争不仅需要勇气,更需要智慧。如今的专家正试图利用大数据手段来破解这个困扰了人类上千年的生存难题。例如,对于稻瘟病的防治,只要预测预报得准,就能选准打药的最佳时机,选对防治的有效药剂,那它就是可防可控的。

中国科学院梅宏院士指出,农业社会在人类历史上持续长达几千年,而工业社会满打满算才200多年,工业革命给人类带来的整体冲击和变化实在太大了。但实际上,我们可以预期当前正在进行的这一场革命,它对社会改变之大、改变速度之快,比工业革命可能来得还要强烈。

中国科学院院士梅宏谈大数据发展现状与趋势

在全球范围内,研究发展大数据技术,运用大数据推动经济发展、完善社会治理、提升政府服务和监管能力正成为趋势。下面将从应用、治理和技术3个方面对当前大数据的现状与趋势进行梳理。

▶ 一是已有众多成功的大数据应用,但就其效果和深度而言,当前大数据应用尚处于初级阶段,根据大数据分析预测未来、指导实践的深层次应用将成为发展重点

按照数据开发应用深入程度的不同,可将众多的大数据应用分为3个层次。第一个层次,描述性分析应用,是指从大数据中总结、抽取相关的信息和知识,帮助人们分析发生了什么,并呈现事物的发展历程。第二个层次,预测性分析应用,是指从大数据中分析事物之间的关联关系和发展模式等,并据此对事物发展的趋势进行预测。第三个层次,指导性分析应用,是指在前两个层次的基础上,分析不同决策将导致的后果,并对决策进行指导和优化。

当前,在大数据应用的实践中,描述性分析应用和预测性分析应用多,指导性分析应用等更深层次的分析应用偏少。一般而言,人们做出决策的流程包括认知现状、预测未来和选择策略3个基本步骤。这些步骤对应了上述大数据分析应用的3个不同类型。不同类型的应用意味着人类和计算机在决策流程中不同的分工和协作。例如,第一个层次的描述性分析应用中,计算机仅负责将与现状相关的信息和知识展现给人类专家,而对未来态势的判断及对最优策略的选择,仍然由人类专家完成。应用层次越深,计算机承担的任务越多、越复杂,效率提升和价值也越大。

然而,随着研究应用的不断深入,人们逐渐意识到前期在大数据分析应用中大放异彩的深度神经网络尚存在基础理论不完善、模型不具可解释性及鲁棒性较差等问题。因此,虽然应用层次最深的指导性分析应用,当前已在人机博弈等非关键性领域取得了较好的应用效果,但在自动驾驶、政府决策、军事指挥和医疗健康等方面应用价值更高,且在与人类生命、财产、发展和安全紧密关联的领域真正获得有效应用,仍面临一系列有待解决的重大基础理论和核心技术挑战。在此之前,人们还不敢也不能放手将更多的任务交由计算机大数据分析系统来完成。这也意味着,虽然已有很多成功的大数据应用案例,但还远未达到我们的预期,大数据应用仍处于初级阶段。未来,随着应用领域的拓展、技术的提升、数据共享开放机制的完善,以及产业生态的成熟,具有更大潜在价值的预测性和指导性应用将是发展的重点。

▶ 二是大数据治理体系远未形成,特别是隐私保护、数据安全与数据共享利用效率之间尚存在明显矛盾,成为制约大数据发展的重要短板,各界已经意识到构建大数据治理体系的重要意义,相关的研究与实践将持续加强

随着大数据作为战略资源的地位日益凸显,人们越来越强烈地意识到制约大数据发展最大的短板之一,就是数据治理体系远未形成。例如,数据资产地位的确立尚未达成共识,数据的确权、流通和管控面临多重挑战;数据壁垒广泛存在,阻碍了数据的共享和开放;法律法规发展滞后,导致大数据应用存在安全与隐私风险……如此种种因素,制约了数据资源中所蕴含价值的挖掘与转化。

其中,隐私、安全与共享利用之间的矛盾问题尤为凸显。一方面,数据共享开放的需求十分迫切。近年来人工智能应用取得的重要进展,主要源于对海量、高质量数据资源的分析和挖掘。而对于单一组织机构而言,靠自身的积累往往难以聚集足够的高质量数据。另外,大数据应用的威力在很多情况下源于对多源数据的综合融合和深度分析,从而获得从不同角度观察和认知事物的全方位视图。而单个系统、组织的数据往往仅包含事物某个片面或局部的信息,因此只有通过共享开放和数据跨域流通才能建立信息完整的数据集。

然而,数据的无序流通与共享又可能导致隐私保护和数据安全方面的重大风险,必须对其加以规范和限制。例如,鉴于互联网公司频发的、由于对个人数据的不正当使用而导致的隐私安全问题,欧盟制定了“史上最严格的”数据安全管理法规《通用数据保护条例》(General Data Protection Regulation,GDPR;以下简称《条例》),并于2018年5月25日正式生效。《条例》生效后,Facebook和谷歌等互联网企业即被指控强迫用户同意共享个人数据而面临巨额罚款,并被推上舆论的风口浪尖。2020年1月1日,被称为美国“最严厉、最全面的个人隐私保护法案”——《加利福尼亚州消费者隐私法案》(CCPA)正式生效。CCPA规定了新的消费者权利,旨在加强消费者隐私权和数据安全保护,涉及企业收集的个人信息的访问、删除和共享。企业负有保护个人信息的责任,消费者控制并拥有其个人信息,这是美国目前最具典型意义的州级隐私立法,提高了美国保护隐私的标准。在这种情况下,过去利用互联网平台中心化搜集用户数据,实现平台化的精准营销这一典型互联网商业模式将面临重大挑战。

我国在个人信息保护方面也开展了较长时间的工作,针对互联网环境下的个人信息保护,制定了《全国人民代表大会常务委员会关于加强网络信息保护的决定》《电信和互联网用户个人信息保护规定》《全国人民代表大会常务委员会关于维护互联网安全的决定》和《消费者权益保护法》等相关法律文件。特别是2016年11月7日,全国人民代表大会常务委员通过的《中华人民共和国网络安全法》,明确了对个人信息收集、使用及保护的要求,并规定了个人对其个人信息进行更正或删除的权利。2019年,国家互联网信息办公室发布了《数据安全管理办法(征求意见稿)》,向社会公开征求意见,明确了个人信息和重要数据的收集、处理、使用和安全监督管理的相关标准和规范。相信这些法律法规将在促进数据的合规使用、保障个人隐私和数据安全等方面发挥不可或缺的重要作用。然而,从体系化、确保一致性、避免碎片化方面考虑,制定专门的数据安全法、个人信息保护法是必要的。

另外,我们也应看到,这些法律法规将在客观上不可避免地增加数据流通的成本、降低数据综合利用的效率。如何兼顾发展和安全,平衡效率和风险,在保障安全的前提下不因噎废食,不对大数据价值的挖掘利用造成过分的负面影响,是当前全世界在数据治理中面临的共同课题。

近年来,围绕大数据治理这一主题及其相关问题,国际上已有不少成功的实践和研究探索工作,如在国家层面推出的促进数据共享开放、保障数据安全和保护公民隐私的相关政策和法规,针对企业机构的数据管理能力评估和改善,面向数据质量保证的方法与技术,促进数据互操作的技术规范和标准等。当前,各界已经普遍认识到了大数据治理的重要意义,大数据治理体系建设已经成为大数据发展的重点,但仍处在发展的雏形阶段,推进大数据治理体系建设将是未来较长一段时间内需要持续努力的方向。

▶ 三是数据规模高速增长,现有技术体系难以满足大数据应用的需求,大数据理论与技术远未成熟,未来信息技术体系需要颠覆式创新和变革

近年来,数据规模成几何级数高速增长。国际数据公司(IDC)预测,2020年全球数据存储量将达到44ZB,到2030年将达到2500ZB。当前,需要处理的数据量已经大大超过处理能力的上限,从而导致大量数据因无法或来不及处理而处于未被利用、价值不明的状态,这些数据被称为“暗数据”。国际商业机器公司(IBM)的研究报告估计,大多数企业仅对其所有数据的1%进行了分析应用。

近年来,大数据获取、存储、管理、处理和分析等相关技术已有显著进展,但大数据技术体系尚不完善,大数据基础理论的研究仍处于萌芽期。首先,大数据定义虽已达成初步共识,但许多本质问题仍存在争议,如数据驱动与规则驱动的对立统一、“关联”与“因果”的辩证关系、“全数据”的时空相对性、分析模型的可解释性与鲁棒性等;其次,针对特定数据集和特定问题域已有不少专用解决方案,是否有可能形成“通用”或“领域通用”的统一技术体系,仍有待未来的技术发展给出答案;最后,应用超前于理论和技术发展,数据分析的结论往往缺乏坚实的理论基础,对这些结论的使用仍需要保持谨慎态度。

推演信息技术的未来发展趋势,在较长时期内仍保持渐进式发展态势,技术发展带来的数据处理能力的提升将远远落后于按指数增长模式快速递增的数据体量,数据处理能力与数据资源规模之间的“剪刀差”将随时间持续扩大,大数据现象将长期存在。在此背景下,大数据现象倒逼技术变革,将使得信息技术体系进行一次重构,这也带来了颠覆式发展的机遇。例如,计算机体系结构以数据为中心的宏观走向和存算一体的微观走向,软件定义方法论的广泛采用,云、边、端融合的新型计算模式等;网络通信向宽带、移动和泛在发展,海量数据的快速传输和汇聚带来的网络Pbps级带宽需求,千亿级设备联网带来的Gbps级高密度泛在移动接入需求;大数据的时空复杂度亟须在表示、组织、处理和分析等方面的基础性、原理性突破,高性能、高时效和高吞吐等极端化需求呼唤基础器件的创新和变革;软硬件开源开放趋势导致产业发展生态的重构;等等。