TensorFlow深度学习应用实践
上QQ阅读APP看书,第一时间看更新

4.5 Python实战——某地降水的关系处理

上面的章节对数据属性间的处理做了一个大致的介绍,本节将使用这个方法解决一个实际问题。

农业灌溉用水主要来自于天然降水和地下水。随着中原经济区的发展和城镇化水平的提高,城市用水日趋紧张。下面分析河南省降水量的变化及分布规律,为合理调度和利用水资源提供决策。数据集名为rain.csv,记录了从2000年开始到2011年之间每月的降水量数据。本节将以其降水量进行统计计算,找出规律并进行分析。

4.5.1 不同年份的相同月份统计

对于不同年份,每月的降水量也是不同的。一般情况下,降水量会随着春、夏、秋、冬的交替呈现不同的状态,横向是一个过程。对于不同的年份来说,每月的降水量应该在一个范围内浮动,而不应偏离均值太大,如程序4-13所示。

【程序4-13】

打印结果如下:

从打印结果可以看到,程序对平均每个月份的降水量进行了计算,获得了其偏移值、均值以及均方差的大小。

通过四分位的计算,可以获得一个波动范围,具体结果见图4-15。

图4-15 降水量的四分位图

从图4-15中可以直观地看出,不同月份之间,降水量有很大的差距,1~4月降水量明显较少,5月份开始降水量明显增多,在7月份达到顶峰后回落,11月和12月明显减少。

同时可以看到,有几个月份的降水量有明显的偏移,即离群值出现,可能跟年度情况有关,需要继续进行分析。

4.5.2 不同月份之间的增减程度比较

正常情况下,每年降水量都呈现一个平稳的增长或者减少的过程,其下降的坡度(趋势线)则应该是一样的。程序4-14展示了这种趋势。

【程序4-14】

最终打印结果如图4-16所示。

图4-16 降水量的趋势图

从图4-16中可以明显地看出,降水的月份并不是一个规律的上涨或下跌,而是呈现一个不规则的浮动状态,增加最快的为6~7月,而下降最快的为7~8月,之后有一个明显的回升过程。

4.5.3 每月降水不相关吗

每月的降水量理论上来说应该是具有相互独立性的,即每月的降水量和其他月份没有关系,但是实际是这样的吗?可以通过程序4-15来进行分析。

【程序4-15】

计算的最终结果如图4-17所示。

图4-17 月份之间的相关性显示

从图4-17中可以看出,颜色分布比较平均,表示月份之间的降水量并没有太大的相关性,因此可以认为每月的降水是独立行为,每个月的降水量和其他月份没有关系。