1.4 网络优化工具的应用
工具是网络优化工程师的好帮手,从技术的角度看,可以认为工具是人的经验的固化:人的经验转化为算法,算法转化为代码实现,并生成可执行文件(从这个意义上说,工具的平台界面是躯壳,算法是核心)。因此,网络优化软件的一个发展趋势是越来越智能化,数据源越来越多样化,能通过很多关联分析,从海量的数据中筛选出有用的线索。使用工具的目的是减轻人的不必要的工作量,但工具替代不了人。
常见的网络优化工具包括:路测软件、KPI报表、网络规划软件、扫频仪、Call Trace工具、MR分析工具、TCP/IP嗅探工具等。下面予以简单介绍。
1.4.1 路测软件及后台分析软件
路测软件是最常用的网络优化工具之一,用来记录手机侧的空口质量、收到和发出的信令。图1.4为典型的路测软件结构图。目前业内的主流厂家包括:大唐、鼎利、日讯、迈为等。路测软件的使用非常简单,以至于很多现场测试的工作可交由自动路测仪来完成,但难点在于如何从路测的数据中获取有价值的信息——这就取决于对系统原理和信令体系的理解。例如,初学者可能只能从路测软件中看到信号质量的变化和信令的异常,而熟练的网络优化工程师不仅能看到这些,往往还能从中看到网络设备的异常、RNC侧的算法参数设置,甚至能分析出一些数据链路层的配置细节。
图1.4 路测软件结构图
1.4.2 KPI报表
路测软件仅能监控某一特定时段、特定路段、针对某个特定UE的测量结果,却无法反映全时段、全网络的性能,而无线网络KPI报表可以弥补这一问题。当网络中的用户规模达到一定程度之后,KPI报表就有了统计意义。RNC侧有很多PM计数器,RNC每收到或发出一条信令都会触发这些计数器,OMCR或NMS每隔固定的周期(如15min)就读取这些计数器的数值,根据既定的KPI公式进行运算,得出KPI报表。需要注意的是,KPI报表仅仅是一种统计意义上的结果,并不代表用户的真实感受;并且,由于多种原因,KPI体系必然会存在统计上的漏洞,不可能及时发现所有的网络问题。
1.4.3 网络规划软件
网络规划软件用来进行覆盖预测和容量仿真。对于网络规划软件,有两种认识上的极端:一种观点认为规划软件总能精确地预测和反映网络状况;另一种观点则认为规划软件的结果并不可信。其实仿真软件的预测结果往往取决于多种因素,例如,三维电子地图的精度、传播模型校正精度、功率设置,以及一些随机因素。规划软件预测结果良好的,现网状况未必良好,但规划软件预测出来有问题的,则现网多半有问题。
除了在前期的网络规划阶段有所应用之外,规划软件在射频优化阶段也可以起到一定的辅助作用。例如,针对存在弱覆盖或干扰的区域,如果直接手动调整,往往带有一定的盲目性,此时可以通过规划软件对不同的优化方案进行仿真,找出一种相对最优的方案,再进行功率参数或工程参数的调整,会更有针对性,更节省时间。普天APOX网络规划软件的RSCP和C/I仿真图分别如图1-5和图1-6所示。
图1.5 普天APOX网络规划软件的RSCP仿真图
图1.6 普天APOX网络规划软件的C/I仿真图
1.4.4 扫频仪
扫频仪在干扰排查工作中往往能发挥重要作用。扫频仪既可以工作在时域,也可以工作在频域。时域的应用主要体现在排查系统内干扰,如导频污染和同频同扰码小区等;而频域模式往往应用于清频测试或排查系统外干扰。此外,扫频仪还可以用来排查基站间GPS不同步的问题,这也是一个常见的应用。图1.7、图1.8和图1.9显示的是某款扫频仪的测量结果。
图1.7 工作在时域的扫频仪窗口
图1.8 工作在频域的扫频仪窗口
图1.9 用扫频仪来筛选同频干扰小区
1.4.5 Call Trace工具
Call Trace以RNC为采集节点,记录了RNC收到的和发出的信令。在很多情况下,仅仅依靠路测软件是无法定位端到端的网络问题的。例如,用户按下拨打键之后,手机发出了RRC连接请求(RRC Connection Request),但并未收到网络侧的Setup响应,问题可能出在上行链路,也可能出在下行链路。如果没有Call Trace数据做对比,优化工程师根本无法得知RNC侧是否收到了RRC Connection Request,因而也就无法判断问题究竟出在上行还是下行。
目前各设备商RNC侧均集成了Call Trace工具,其记录信令的方式也很灵活,既可以根据小区ID筛选信令,也可以根据用户标识(如IMSI)来筛选信令,这就为优化人员提供了极大的便利。
【案例1.1】
现象描述
某市TD-SCDMA网络KPI报表中的PS域无线接通率在一个月之内有明显下降,从95%左右降至85%左右。
分析推理过程
(1)首先通过排查小区级KPI报表,发现大部分小区PS域无线接通率正常,只有很少的一部分小区接通率较低。
(2)对已筛选出的问题小区,派测试人员携带路测软件和路测手机赴现场进行DT和CQT测试,发现DT和CQT得出的PS无线接通率均较高,各小区覆盖范围内RSCP、C/I、上行干扰等无线指标均处于正常范围内,而与此同时网管侧的PS接通率报表依然偏低。
(3)在RNC侧打开Call Trace,对步骤(1)中筛选出的有问题的小区ID进行信令跟踪,并对测试log进行分析,发现这几个小区中每次PS接入失败都是在PDP激活阶段遭到网络拒绝,且接入失败的手机IMSI相对固定。
(4)至此,尚不能确定是手机的问题还是小区的问题。于是,对步骤(3)中筛选出的PS接入失败率高的IMSI进行信令跟踪——如果这几个手机(IMSI)在其他小区PS接通率正常,说明问题多半出在小区;如果这几个手机(IMSI)在其他小区PS接通率也不正常,说明问题多半与小区无关,而是与该手机(IMSI)有关。通过对测试log进行分析,发现这几个IMSI无论在哪个小区,PS接通率都非常低,因此基本可以肯定是手机的问题。
(5)对这几个IMSI进行电话回访,发现这几款终端都是X厂家推出的某款手机,其默认PS速率为32/32kbps,而网络侧此时只配置了64/64kbps、64/128kbps、64/384kbps等速率,32/32kbps并非标准业务速率,因此每次发起业务都被拒绝。
解决措施
打开系统侧的算法开关,无论终端以何种速率申请,RNC侧均允许接入,并将其指派为系统默认承载速率。优化之后,PS接通率有明显回升。
从这一案例可以看出,传统的Call Trace工具虽然可以对某个特定手机号(IMSI)进行分析,甚至可以列出该用户每次呼叫的详细信令流程话单,但无法获知用户的手机型号,无法将网络问题与手机型号之间做出关联分析。建网初期,手机的完善程度仍不甚理想,且手机的升级过程中难免会出现一些小问题,这些因素都可能会对用户感知和网络KPI带来负面影响。正是基于以上考虑,自三期招标以来,各设备商的Call Trace工具开始支持基于IMEI的信令分析。IMEI(终端设备识别号,俗称串号)的最大功能是用来协助辨别手机身份真伪,可以近似地认为,IMEI与手机型号之间存在对应关系。目前RNC侧提取IMEI的思路主要有这么几种。
第一种方法是CN侧导出。CN侧以标准格式输出IMSI和IMEI的对应关系,UTRAN侧分析工具手工导入该对应关系数据,完成终端行为分析。这种方法实时性不高,可能存在一定偏差,因此应用较少。
第二种方法是CN侧开启获取IMEI功能,即CN针对每次呼叫都下发身份请求(Identity Request),UE回复的身份应答(Identity Response)中携带IMEI标识。RNC对接收到的Identity Response消息,一方面进行解析获取IMEI,同时另一方面,将原始消息透传转发给CN,不会对核心网接收Identity Response消息有任何影响。
第三种方法是如果CN不能针对每次呼叫都下发Identity Request,则RNC侧可以模拟CN向UE发送Identity Request消息。RNC收到UE的响应消息Identity Response后,解析获取IMEI,并丢弃该消息,这样也不会对核心网有任何影响。
RNC提取IMEI后可根据需要存储到UE的上下文中,可建立IMSI和IMEI的映射关系,也可在呼叫跟踪的信令记录中携带IMEI,便于分析终端行为。例如,针对不同厂家各种类型的终端进行业务性能分析(接通率、掉话率等),以便发现终端潜在的问题。
基于Call Trace工具,还可以实现很多特色功能,例如对VIP用户的重点关怀——针对列表中的每个VIP用户,可通过Call Trace自动生成话单,话单内容包括每个用户什么时间在哪个小区发生接入失败,信令走到哪一步失败,大致原因是什么;在哪个小区发生掉话,掉话的大致原因是什么……
1.4.6 MR分析工具
海量的测量报告(MR)数据中包含了丰富的信息,是一座数据宝藏。在GSM时代,基于MR的网络优化工具就得到了广泛应用,例如,通过手机上报的Rxlev和TA分析网络覆盖,或通过MR数据建立网络干扰矩阵,然后通过遗传算法进行自动频率优化……
TD-SCDMA系统无线测量主要来自于UE或者Node B,其中,UE测量的数据以测量报告(Measurement Report)信令形式上报(周期性上报或事件触发上报),Node B测量数据以NBAP信令形式上报(周期性上报)。MR数据的采集原理,如图1.10所示。
图1.10 MR上报原理图
TD-SCDMA系统采集到的MR数据,大部分都与网络优化相关,如PCCPCH RSCP、SIR、DL BLER、UL BLER、UpPTS ISCP、下行DPCH ISCP、上行DPCH ISCP、TA、AOA等。通过对测量报告数据的过滤、筛选、计算和分析,可在全网范围内及时找出存在弱覆盖、越区覆盖(TA)、强干扰、业务质量差的小区,结合定位算法,可对覆盖、干扰、业务质量进行定位渲染,为网络优化工程师提供路测之外的覆盖、干扰、业务质量评估手段,大大节省时间成本。
MR的应用难点,一个是精确定位问题,一个是运算负荷问题。如果能在运算负荷较小的前提下实现相对精确的MR定位算法,那么MR数据分析的功能组合和应用空间必然更加广阔。
1.4.7 TCP/IP嗅探工具
自从数据业务的地位凸显,靠路测软件或KPI报表就能解决问题的时代已经过去了。很多数据业务的优化问题,需要通过TCP层抓包,并对数据进行深入分析,判断究竟是网络的哪个层面出现了问题。常用的抓包工具如Sniffer、Wireshark等。其中,Wireshark是业内应用最为广泛的一款免费开源工具,且功能强大。Wireshark的前身为大名鼎鼎的Ethereal,是以Gerald Combs为首的团队开发的网络分析软件,在1988年以GPL的形式公开。Gerald当时在所工作的公司是开发团队的中心成员,8年后因为WinPcap的开发,投身到CACE Technologies公司,结果Ethereal项目无法继续开发,而原来的公司不想让出Ethereal专利权,所以Combs的团队取得Wireshark这个新的商标,使开发工作能够继续。目前,Wireshark成长迅速,可以说是非常成功。图1.11是Wireshark的主界面。本书的后续章节,对TCP层以及应用层的协议分析,就借助了Wireshark抓取的码流。
图1.11 Wireshark主界面