DCS系統中“從設備不存在”故障的解析與處理
隨著DCS(集散控制系統)在新型干法水泥生產線中的應用與發展,特別是國外DCS的引入,中控系統運行一段時間后暴露出來的故障很難及時得到解決,加之國外DCS工程師的服務費用實在太高,怎樣深入了解DCS系統的程序內核,增加故障出現后的應對手段,解決故障時少走彎路,是擺在水泥行業電氣自動化工作人員面前的一個課題,下面就本公司DCS系統中出現的疑難病癥作出淺析。
1、系統介紹
我公司中控系統選用的是ABB公司的DCF800系統,版本號為8.2,該系統以安裝簡便、容易維護等優點著稱,被廣泛應用于建材、發電、化工等行業。自2008年12月28日我公司2500tpd熟料生產線點火投產以來,DCS系統運行穩定、可靠。下圖為我公司DCS柜總貌:
從左至右分別為:DCS的控制器柜、SL_1F2_2站柜、SL_1F2_3站柜、SL_1F2_4站柜。控制器柜內含電源模塊、CPU、profibus模塊等組件,即圖中紅圈所示,左邊豎列為SL_1F2_1站。各站間通過DP線連接CI801模塊建立通訊。
2、故障描述
在2012年5月4日,中控操作員站突然出現“從設備不存在”“模件1 診測故障”等報警信息,5月5日起尾排風機與生料輥壓機頻繁跳閘,中控顯示“備妥丟失”和“無應答”。
經組織公司技術力量進行分析:尾排風機與生料輥壓機的DI810接入模塊均隸屬于該站通訊模件的第四塊CI801,即圖1所示的“SL_1F2_4”站的通訊模塊,結合中控電腦顯示的“SL_1F2_4 模件故障:從設備不存在”,經討論后認為報警和跳閘可能是因為“SL_1F2_4”站的CI801通訊模件故障導致。
3、故障原因分析及處理
在更換CI801后運行不久報警信息再次出現,尾排風機重復跳閘,在與ABB技術工程師電話討論后分析可能是出現了“丟包”現象,一般“丟包”的原因:1、CI801的供電電源故障;2、通訊電纜不通;3、通訊DP頭虛接;4、CI801模件損壞。為了一次性解決所有可能存在的故障,經請示領導后停窯兩小時,將CI801和電源、通訊電纜和DP頭全部更換,并將控制器主電源斷開重起,中控程序重新加載所有站,確認故障點清除后開機,中控報警消失,但在5月8日中午,“SL_1F2_4 模件故障:從設備不存在”報警如幽靈般再次浮現,即使更換PROFIBUS模件、DP電纜、DP頭和CI801也無濟于事,大窯一天內因尾排跳閘止料5次,事故處理陷入困境。
4、處理受阻后的臨時應急方案
為了保證大窯的正常運行,技術部仔細檢查了程序模塊,并分析了“應答”DI在程序中占用的時間,以及并不是每次出現報警就跳閘的特點,認定 “丟包”是在系統設定的時間內通訊不能建立,超過時限才會跳閘,如果時間足夠,即可讓系統一直處于等待狀態,而不會判定該站不存在。由于SL_1F2_4所屬的模件為重點設備的DI點,DO點由其它站來控制,于是決定在程序模塊的“應答”常量前加入一個時間控制模塊,看圖2紅色圓圈所示:[Page]
從圖2的波形中分析,我們以關延時為控制手段,在“無應答”故障出現后,時間控制模塊將會給控制器提供一個長達10秒(該數值0-60S可調)的虛擬“應答”信號,原理見波形圖中的TS量。
這樣足夠等到系統第二次掃描時能收到“數據包”,經調試檢查無誤后加載運行--有趣的一幕出現了:SL_1F2_4再也沒有出現“從設備不存在”的報警信息,但是,SL_1F2_1、SL_1F2_2和SL_1F2_3卻頻繁報警。
此時因為SL_1F2_4站不報警,尾排風機及窯上的主要設備再未出現跳閘現象,系統投料正常,大窯運行穩定,初步實現了應急方案的階段目標,給事故的徹底處理爭取到了時間。
5、故障的根本原因及解決辦法
SL_1F2_1、SL_1F2_2和SL_1F2_3站所屬的設備為生料輥壓機的輔機系統,窯上是不再跳閘了,但生料的入輥提升機、出輥提升機、進料皮帶機等設備出現了頻次很高的、無規律性的停機,真個是“你方跳罷我登場”。擺在技術部面前的就只有兩種選擇:第一是把所有輔機程序模塊的DI、DO全部加上與窯上SL_1F2_4站DI一樣的時間控制器,上升沿觸發,延時關閉,以躲過跳閘;第二是找到報警的真正原因,把故障徹底解決。
第一個選擇是當前可以操作的,但是這樣做工作量太大,而且修改程序后會否出現另外的報警信號心里沒有底,很有可能一個故障消除又帶來另一個故障,最后整個程序層層打包成了“木乃依”,可靠性與速度大大降低。第二個選擇沒有目的性,只能用最笨的辦法,需要對從控制器到通訊模件、全部線纜按當初新建網路時重組,這樣做無疑工作量更大,而且將會長時間影響大窯生產。
這是一個艱難的選擇,需要仔細地衡量。
就在山重水復的時候,柳暗花明的一刻出現了:生料系統因為跳閘太過頻繁,對設備沖擊太大,決定暫時全部停機不開,以待問題解決或者料盡停窯,此時無意識地掃視操作員站的信息,突然發現SL_1F2_1、SL_1F2_2和SL_1F2_3站原本不停閃爍的報警信息一瞬間消息得無影無蹤,“干擾,一定是干擾!”。目的一下變得明確:一臺一臺單開設備查找干擾源。在輥壓機系統的V型選粉機變頻器開啟的時候,報警信息出現。
該變頻器處于高、低壓綜合配電室內,距離DCS室約20米,AI、AO與DI、DO信號經KVVP型多芯屏蔽電纜沿電纜溝敷設與DCS系統硬連接,在DCS柜端拆除與之相連的電纜后故障并沒有消除,所以首先排除了因線纜連接傳導的干擾。鑒于生料輥壓機觸摸屏與DCS連接的DP電纜經過變頻器柜下電纜溝(路徑為唯一途徑),且在輥壓機開起,而V型選粉機未開時系統顯示正常,于是重點對V型選粉機變頻器柜進行了檢查。[Page]
故障的引發原因排除硬連接傳導后,就只剩下變頻器起動和運行時產生的強電磁對途經柜下的DP線的干擾,在不能改變敷設路徑的情況下,我們決定對變屏柜、DCS柜及DP線纜本身的屏蔽線進行重接,物品準備:3#砂紙、板銼。
首先將變屏柜屏蔽接地線連接螺絲松開,發現屏蔽接地線(圖4左)和接地點(圖4右)有發黑氧化跡象,用板銼進行打磨,砂紙拋光后重新安裝。
隨后檢查DCS控制柜屏蔽接地線,該連接方式為各出線電纜的屏蔽線與DP電纜的屏蔽線編織成銅辮再統一連接至接地樁,由圖5可以看出,原來的連接非常粗糙,存在虛接隱患,拆開后用砂紙拋光,做成接線鼻子,加裝彈性墊圈,螺母壓緊,用數字萬用表測量各DP線首端屏蔽線對地電阻為0.6歐姆,接地良好。
完工后對DCS柜、變頻器柜送電,中控室按流程逐一開機,至正常投料生產,操作員站未出現報警信息,連續運行至8月底,DCS系統運轉正常,故障得以徹底排除。
在召開事故分析會后確定最終原因應該是由于近四年的運行,屏蔽接地線接頭出現氧化和虛接,導致DP電纜受到變頻器運行時的強干擾不能完全屏蔽,從而影響到整個控制器收、發數據包的通暢。這也是DCS系統出現報警信息后時跳時不跳的原因所在。
6、結語
DCS系統因通訊模件出現的故障有很多,常規而有效的處理方法一般是直接更換模件,以減少停機時間,但在常規方法不給力的時候,就需要另辟蹊徑,在不影響主控系統的情況下,利用程序上的可以實現的方法優先保證窯系統的運轉以爭取時間。在最終處理問題的時候,往往會走入一個“前面運行幾年都很好,那干擾必定不會存在”這樣一個誤區,而干擾恰恰是通訊系統最大的敵人。因此,在通訊類故障出現后,首先查找干擾源往往會事半功倍。
注解:“丟包”
一般來說,DCS控制器以profibus協議進行通訊時,主站采集從站信息一個周期,即輪詢一周所用的時間為50-60ms,如果現場的開關量輸入信號低于這個范圍發生跳變,或是因某種原因造成本周期內信號不暢,就會出現采集不到DI信號或是DI信號不能及時傳送給控制器,新的周期內采集的數據覆蓋上周期數據,從而導致現場采集的DI信號丟失,俗稱“數據包丟失”或“丟包”。
編輯:
監督:0571-85871513
投稿:news@ccement.com