一、難以感知用戶(hù)側的訪(fǎng)問(wèn)體驗
用戶(hù)通過(guò)網(wǎng)絡(luò )訪(fǎng)問(wèn)應用的整個(gè)過(guò)程難以追蹤,訪(fǎng)問(wèn)異常等故障的獲知多來(lái)源于用戶(hù)投訴;
二、業(yè)務(wù)調用關(guān)系復雜,無(wú)法清晰了解整個(gè)鏈條的性能瓶頸
南方航空以項目組形式負責不同的微服務(wù)應用,當故障發(fā)生時(shí),需快速透析整個(gè)應用的邏輯架構和調用關(guān)系,快速找到責任項目組,降低MTTR;
三、電商化進(jìn)程加速,保障應用性能體驗成為重中之重
面對在線(xiàn)用戶(hù)量的上漲,系統承受的并發(fā)壓力不斷增大,如何快速解決問(wèn)題,確保應用高性能運行顯得非常重要。
一、獲知用戶(hù)側的訪(fǎng)問(wèn)體驗,重點(diǎn)保障海外同胞回國的航班需求
Bonree Net通過(guò)遍布全球的監測點(diǎn),主動(dòng)模擬撥測,通過(guò)監控海外多個(gè)地區訪(fǎng)問(wèn)南方航空官網(wǎng)的性能耗時(shí),確定官網(wǎng)的可用性;通過(guò)事務(wù)監測,模擬真實(shí)用戶(hù)操作是否順暢,了解每一步操作的耗時(shí)及通過(guò)率,監測票務(wù)流程的成功率,每個(gè)步驟的頁(yè)面響應耗時(shí),定位用戶(hù)的查票訂票流程;同時(shí)關(guān)注海外重點(diǎn)航線(xiàn)國家用戶(hù)訪(fǎng)問(wèn)質(zhì)量,選擇同樣的地區監測點(diǎn),并及時(shí)告警,保證航班業(yè)務(wù)正常運行,業(yè)務(wù)可用性大幅提高。
二、應用拓補可視化,量化性能指標,故障快速定位
Bonree Server可幫助南方航空了解各機器的負載情況,并與應用數據進(jìn)行關(guān)聯(lián)分析,可視化展示硬件資源百分比,讓運維人員一眼看到問(wèn)題所在。同時(shí),通過(guò) Bonree Server的快照分析功能即可查看代碼執行堆棧、CPU/內存/JVM信息、請求參數、SQL語(yǔ)句、JVM參數、服務(wù)器資源負載等信息的完整故障現場(chǎng)數據,可實(shí)現快速關(guān)聯(lián)分析,大大降低了耗時(shí),提高了運維效率。
當發(fā)現性能瓶頸及故障問(wèn)題時(shí),Bonree Server可直接定位是哪個(gè)系統調用出現的問(wèn)題,并將問(wèn)題指派給對應項目組進(jìn)行處理,減少溝通成本,縮短MTTR,排障時(shí)間提升至分鐘級。
三、全面實(shí)現基礎架構監控,實(shí)現基礎資源統一管理和告警
通過(guò)Bonree ITIM,全局監控數據中心的硬件設備,實(shí)現基礎資源統一管理和告警、整體項目規模建設對象達到12000個(gè),包括服務(wù)器、防火墻、交換機、路由器、虛擬機等。實(shí)現了設備展示的精簡(jiǎn)清晰、資源使用情況的實(shí)時(shí)呈現、精準的告警及告警關(guān)聯(lián)。
???為什么選擇博睿數據
一、技術(shù)創(chuàng )新能力業(yè)內領(lǐng)先:行業(yè)內首家通過(guò)了代表軟件能力成熟度最高等級的CMMI5級評估認證和ISO9001認證;
二、客戶(hù)第一的核心價(jià)值觀(guān):配備專(zhuān)業(yè)服務(wù)團隊,7*24小時(shí)及時(shí)響應,為客戶(hù)提供全面的專(zhuān)業(yè)服務(wù)。
???應用效果
一、核心業(yè)務(wù)可用性大大提升:核心業(yè)務(wù)平均響應用時(shí)從1450ms下降至130ms,業(yè)務(wù)可用性提升至98.5%;
二、應用崩潰率與請求錯誤率得到降低:APP請求錯誤率下降3.7% ,應用崩潰率下降2%;
三、性能指標得到量化:可視化展示硬件資源百分比,實(shí)現單筆業(yè)務(wù)數據精準查詢(xún),異常數據收集時(shí)間與排障時(shí)間縮短至分鐘級;
四、對業(yè)務(wù)進(jìn)行持續性監測:通過(guò)實(shí)時(shí)監控,主動(dòng)實(shí)時(shí)掌握用戶(hù)體驗,并快速定位異常環(huán)節,提升故障處理效率。