1 概述

  多功能车辆总线(Multifunction Vehicle Bus,MVB)是针对车辆内部功能设备数据通信的现场总线,是列车通信网络系统(Train Communication Network,TCN)的核心部分之一。MVB总线分为固定大小的基本周期,每个基本周期又由周期相和偶发相组成,这样既可传送对时间有确切要求的数据,同时也可以处理偶发紧急数据[1]。这种方式较好地满足列车控制系统对实时性的要求。目前国内的CRH系列动车组中,CRHI、CRH3和CRHs均大量采用基于MVB标准的网络控制系统。作为MVB总线的一种,ESD+ MVB总线得到了广泛应用。其物理层采用隔离的RS-485差分信号,传输距离达200 m,主要适用于同一车厢内短距离的列车设备通信。

  ESD+ MVB总线通信系统的高效可靠传输是列车设备正常运行的基本前提。由于列车车载设备众多,总线信道环境一般较为恶劣,受到的干扰较多。随着运行时间的增加,线缆和设备元器件本身的性能会有所下降。列车长期的振动环境会对线缆连接可靠性造成不利影响。列车定期检修时维护人员可能需要对总线进行插拔,不规范的操作有可能会造成连接器缩针或不稳定等。上述因素都降低了ESD+MVB总线的可靠性,提升了列车设备的故障率。

  为提高总线的可靠性,目前主要有两个研究方向。一是从总线传输原理的角度出发,在设计阶段尽量提高总线的抗干扰性和通信性能,即在源头预防总线通信故障的发生。文献[2]从物理层的角度分析双绞线传输性能对总线通信质量的影响,文献[3]专门对MVB主站的周期扫描表最优化设计进行研究,用以提高总线系统的传输效率。文献[4]和[5]则从总体角度对总线进行性能分析。二是在列车设备的运营维护及检修维护阶段,通过测量定位和消除总线故障。文献[6]使用Duagon公司的MVB协议分析装置D412进行总线协议分析,该设备主要应用于开发阶段的实验室调试,并不适用于现场总线通信故障处理。文献[7]研究如何在有限时间内通过测试获得更为准确的误码率,有助于分析总线的通信质量。文献[8]说明如何通过总线注入故障的方法判断设备功能是否正常。文献[9]从底层实现过程数据、消息数据以及监视数据的实时捕获解析功能。上述文献都侧重于从总线通信系统的某一方面进行研究,但考虑到发生通信故障的原因复杂且隐蔽,现场测试环境较为受限,维修人员更多需要的是一套行之有效的测试策略和方法,用于快速有效地完成故障的定位和排查。全面考察各失效原因对总线通信的影响,据此给出明确的故障测试策略,用于指导现场维修人员进行故障处理。

2 ESD+MVB总线

  ESD+MVB总线分为物理层、数据链路层和应用层。应用层基于数据链路层的实现,与设备的核心功能相关,所传输的载荷数据由用户自身定义,没有统一的标准,这里对其不进行描述。

  ESD+MVB物理层采用隔离RS-485总线,最大总线长度为200 m,每段最多连接32个设备。数据编码采用曼彻斯特编码方式,通信速率固定为1.5 Mbit/s,在总线上传输的如图 1所示的固定几种码型[1]。

  总线线缆使用差分线对双绞屏蔽走线,线缆每米不得少于12个绞合对,线缆的差分阻抗为120 Ω±10%@0.75 MHz~3 MHz。线缆的损耗指标为<10 dB/km@1 MHz,<14 dB/km@3 MHz,差分线对间的分布电容<65 pF/m@1 MHz。若使用冗余A/B总线,A/B两个差分线对之间的串扰抑制指标为>55 dB@0.75 MHz~3 MHz。发送时,设备会同时往A/B两个总线上发送相同的数据,接收时,各设备选择自身所认可的单独A或B总线进行接收处理。总线拓扑链路的首尾设备需要分别加上终端匹配电路,既用于将空闲总线设置为明确的低电平,又可提供长距离总线的终端120 Ω匹配,防止信号反射,提升波形质量。终端匹配电路如图 2所示。

  ESD+ MVB数据链路层的介质访问控制采用主从控制方式,在同一时刻总线只能存在唯一的主设备,其他设备均为从设备。主设备以周期轮询的方式发送主帧,总线上的所有设备均可接收到主帧,并根据自身配置发送从帧。为增加可用性,总线上可能存在多个主设备,它们以令牌方式交换总线控制权[1],以确保在同一时刻仅有一个主站在工作。

  总线传输报文只有主帧和从帧两种。主站设备先传输主帧,从站设备随后传输从帧。一个从帧之前必定有一个主帧,但一个主帧不一定尾随一个从帧。主从帧的数据格式如图3所示。

  主帧的长度固定为33位,包括9位主起始分界符,4位F码,12位地址以及8位CRC校验序列。从帧可能有 5 种长度:33、49、81、153、297位,包括9位从帧起始分界符,5种长度分别对应16、32、64、128或256位的数据以及CRC校验序列。具体主帧的数据类型如表1所示。

3 故障原因及影响分析

  物理层和数据链路层的故障对总线有不同的影响。一种典型的ESD+ MVB总线拓扑结构如图4所示,下面将结合该拓扑结构对不同的故障原因及其影响进行分析。图中共存在3个从设备,1个主设备。设备以菊花链的方式进行总线互联,D1和D2分别为各设备的DB9总线接口。从设备1和从设备3分别位于总线的首尾两端,并进行了总线端接。

  在总线物理层,各故障原因及其对应的影响列举如下。

  1)原因:线缆屏蔽层不理想,或者屏蔽层线缆接地不理想。

  影响:总线出现偶发性通信故障,特别是在列车大功率牵引制动设备或空调设备等开启或关闭瞬间,出现较为明显的误码率升高的情况,且出现错误的端口呈现均匀分布。

  2)原因:线缆介质出现老化或质量下降。

  影响:总线出现偶发性通信故障,数据误码率偏高,使用专用的线缆测试仪器,可测得其分布参数不符合MVB总线规范要求。

  3)原因:总线断开或连接器断开。

  影响:将导致断开位置的下游设备无法收到主帧数据或从帧数据。例如,若主设备的D2连接器断开,则从设备2、3无法收到主、从帧数据。若从设备1的D2连接器断开,则从设备2、3仍然可以收到主帧数据,但无法收到从设备1发送过来的从帧数据。

  4)原因:设备连接器出现缩针,导致总线信号接触不良。

  影响:将导致总线出现偶发性通信故障,特别是在设备晃动的情况下,出现较为明显的误码率升高的情况,且出现错误的端口呈现均匀分布。

  5)原因:终端匹配电阻阻值出现较大偏差,或者出现断路或短路情况。

  影响:将导致总线空闲电平出现异常,不再符合规范,并且由于总线两端的匹配电阻与线缆差分阻抗不匹配,导致总线波形失真,通信质量下降,误码率明显升高,且出现错误的端口呈现均匀分布。

  6)原因:设备硬件驱动电路出现性能下降或失效。

  影响:将导致与该硬件相关的主、从帧波形失真或无效。若故障设备为主设备,则线缆上会存在失真的主帧,而各从帧设备由于无法识别该主帧,有可能总线上不存在其他设备发送的从帧。若故障设备为从设备3,则总线上主帧和其他设备发送的从帧正常,仅从设备3发送的从帧异常,有可能无法被其他设备识别。

  在总线数据链路层,各故障原因及其对应的影响列举如下。

  1)原因:主设备出现故障,无法发送主帧。

  影响:由于没有主帧信号,整条总线保持为空闲状态,没有任何总线数据。

  2)原因:主设备出现故障,对某个端口的轮询时间间隔出现抖动。

  影响:对该端口数据接收的实时性无法得到保证,有可能会导致对该端口的接收数据超时,导致数据失效,影响应用层的数据有效性判断。

  3)原因:从设备出现故障,无法识别主帧信号。

  影响:总线上没有出现该从设备作为源端口的从帧数据,数据接收设备无法接收到相应端口的数据。

  4)原因:从设备配置错误,同一个端口号被多个从站设备配置为源端口类型。

  影响:当主站轮询该端口时,多个从设备会同时发送该端口的从帧数据,导致出现总线冲突,该从帧几乎全部出错,但其他端口的数据不受影响。

4 测试策略

  根据上述分析,若发生总线通信故障,无法在应用层通过分析日志语句直接得知故障原因,定位故障设备,现场维护人员应采取先物理层后数据链路层的测试步骤进行故障定位和处理。

  1) 进行物理层测试和故障定位

  步骤1:在断电情况下,测量总线电阻阻值,包括线缆差分线对间的阻抗,差分线分别和地信号的阻抗,判断阻抗是否在正常范围内。如果不在正常范围之内,将设备逐一从总线脱离,重新测量,直至阻抗正常,所退出的设备即为故障设备。

  步骤2:将两端的匹配电阻取下,进行电阻阻值测量,判断阻抗是否在正常范围内。若不在正常范围内,则判断此终端匹配电阻失效。

  步骤3:在上电运行情况下,使用示波器测试总线电平。所用示波器应具备隔离功能,测试时应以总线本身的地信号作为示波器探头的地信号,需要分别测试两个差分总线信号相对于总线地信号的电平、两个差分信号之间的电平。判断总线空闲时的电平和工作时的电平是否在总线规范所规定的电平标准范围内。若总线上波形信号未发生跳变,则表示总线上没有主帧信号,可判断主站设备失效。若总线上某个从帧信号波形幅值存在问题,则可判断对应的从站设备存在故障。为进一步确认该从站设备为故障原因,可将该设备从总线脱离,此时总线波形信号应会恢复正常。

  步骤4:在条件允许的情况下,晃动总线。若总线误码率出现较大幅度的跳变,则可判断总线接头接触不良或者缩针。

  步骤5:启动列车大功率设备,分别评估在大功率设备启动和关闭瞬间总线的误码率指标。若总线误码率出现较大幅度的跳变,则可判断为总线屏蔽或接地存在缺陷。

  2) 进行数据链路层的测试和故障定位

  步骤1:使用示波器查看波形,确认总线上存在主帧信号若不存在,则可确定是主站设备出现故障。

  步骤2:使用总线分析仪等专用数据采集工具,采集总线上传输的数据帧。

  步骤3:判断主帧数据是否存在中断或轮询周期跳变的情况若存在,则可判断为主站设备出现故障。

  步骤4:判断从帧是否出现中断响应,或者响应延迟时间抖动幅度较大,某个端口的从帧出现较大的错误概率,则可判断该从帧对应的从站设备出现故障。

5 总结和展望

  当发生总线通信故障时,现场维修人员更需要的是一套有效的测试方法和策略,用于快速地定位和处理故障。全面分析各种故障对总线的影响,并给出总线测试策略和确定故障设备的判断依据。依据此策略和依据,实际现场已查明并解决多起电阻阻值异常故障、设备发送电路异常故障等。值得说明的是,提及的方法对于排查确定性故障有着较好的效果,但对于非确定、随机偶发性故障,效果有所欠缺,需要后续进行深化研究。

参考文献

  [1] International Electrotechnical Commission.IEC61375-1 Part I: Train Communication Network[S].Geneva:International Electrotechnical Commission, 1999.

  [2]宋娟,王立德,严翔,等.列车控制网络专用双绞线传输特性的研究[J].铁道学报,2012,34(3):61-67.

  [3]王永翔,王立德.多功能车辆总线周期扫描表的最优化设计[J].铁道学报,2009,31(6):46-52.

  [4]刘建伟,谭南林,焦凤川,等.多功能车辆总线系统性能分析[J].铁道学报,2006,28(6):83-87.

  [5]王树宾.动车组列车通信网络及其可靠性设计[J].铁道车辆,2007,45(10):20-22.

  [6] Duagon.MVB Monitor User’s Guide & D412 diagnostic  system datasheet [Z].Switzerland:Duagon,2004.

  [7]简捷,王立德,申萍.基于贝叶斯规则的MVB通信误码率测试方法[J].铁道学报,2014,36(1):56-61.

  [8]仲康正,徐惠勇. MVB总线故障注入方法研究与实现[J].电子技术应用,2016,42(8):74-76.

  [9]宋娟,王立德,严翔,等. MVB协议分析装置设计及其实时性分析[J].铁道学报,2011,33(11):41-45.

  [10]谢立国,马振球. 一种高效可靠的MVB总线网关设计[J].铁路通信信号工程技术,2016,13(5):24-27.