4.2 水文频率分布曲线
水文频率计算的两个基本内容包括分布线型及参数估计。下面主要介绍我国水文计算中常用的一些分布线型。
连续型随机变量的分布是以概率密度曲线和分布曲线表示的,这些分布在数学上有很多类型。我国水文计算中常用的有正态分布,皮尔逊Ⅲ型分布及对数正态分布等。
SL 44—2006《水利水电工程设计洪水计算规范》规定,频率曲线的线型一般应采用皮尔逊Ⅲ型,特殊情况,经分析论证后可采用其他线型。为此,本节以论述皮尔逊Ⅲ型频率曲线为主,并扼要介绍正态分布。
4.2.1 正态分布
自然界中许多随机变量如水文测量误差、抽样误差等一般服从或近似服从正态分布。正态分布具有以下形式的概率密度函数:
式中:a为平均数;σ为标准差;e为自然对数的底。
正态分布的密度曲线有以下几个特点。
1)单峰。
2)对于均值a对称,即Cs=0。
3)曲线两端趋于±∞,并以x轴为渐近线。
式(4.11)只包含两个参数,即均值a和均方差σ。因此,若某个随机变量服从正态分布。只要求出它的a和σ值,则分布便可确定。
可以证明,正态分布曲线在a±σ处出现拐点,并且:
正态分布的密度曲线与x轴所围成的面积应等于1。由式(4.12)和式(4.13)可以看出,a±σ区间所对应的面积占全面积的68.3%,a±σ区间所对应的面积占全面积的99.7%,如图4.2所示。
图4.2 正态分布密度曲线图
图4.3 皮尔逊Ⅲ型概率密度曲线图
4.2.2 皮尔逊Ⅲ型分布
英国生物学家皮尔逊通过很多资料的分析研究,提出一种概括性的曲线族,包括13种分布曲线,其中第Ⅲ型曲线被引入水文计算中,成为当前水文计算中常用的频率曲线。
皮尔逊Ⅲ型曲线是一条一端有限一端无限的不对称单峰、正偏曲线(见图4.3),数学上称为伽玛分布,其概率密度函数为
式中:Γ(α)为α的伽玛函数;α、β、a0为分别为皮尔逊Ⅲ型分布的形状,尺度和位置参数,α>0,β>0。
显然,α、β、a0确定以后,该密度函数也随之确定。可以推证,这3个参数与总体的3个统计参数EX、Cv、Cs具有下列关系:
皮尔逊Ⅲ型密度曲线的形状主要决定于参数Cs(或α),从图4.4可以区分为以下4种形状:
(1) 当0<α<1,即2<Cs<∞时,密度曲线呈乙形,以x轴和x=b直线为渐近线,如图4.4(a)所示。
(2) 当α=1,即Cs=2时。密度曲线退化为指数曲线,仍呈乙形,但左端截止在曲线起点,右端仍伸到无限,如图4.4(b)所示。
(3) 当1<α<2,即<Cs<2时,密度曲线呈铃形。左端截止在曲线起点,且在该处与直线x=b相切,右端无限,如图4.4 (c)所示。
(4) 当α>2,即Cs<时,密度曲线呈铃形,起点处曲线与x轴相切,右端无限,如图4.4 (d)所示。
以上各种形状的曲线都是对正偏而言的。
图4.4 皮尔逊Ⅲ型密度曲线形状变化图
(a)0<α<1;(b)α=1;(c)1<α<2;(d)α>2
水文计算中,一般需求出指定频率P所对应的随机变量xp,这要通过对密度曲线进行积分,求出等于或大于xp的累积频率P值,即
直接由式(4.16)计算P值非常麻烦,实际做法是通过变量转换,根据拟定的Cs值进行积分,并将成果制成专用表格,从而使计算工作大大简化。
令
则有
φ是标准化变量,称为离均系数,φ的均值为零,标准差为1。这样经标准化变换后,将式(4.18)、式(4.19)代入式(4.16),简化后可得
式(4.20)中被积函数只含有一个待定参数Cs,其他两个参数EX和Cv都包括在φ中,因而只要假定一个Cs值,便可从式(4.20)通过积分求出P与φ之间的关系。
在进行频率计算时,由样本估计出的Cs值,查φ值表得出不同P的φp值,然后利用估计出的、Cv值,通过式 (4.18)即可求出与各种P相应的xp值,从而可绘出频率曲线。如何求得皮尔逊Ⅲ型分布曲线的参数、Cv和Cs,是下面讨论的参数估计问题。