omniture

天旦BPC 4.3發(fā)布,人工智能產品化第一步

2018-07-31 14:00 8074
在保障業(yè)務系統(tǒng)一如既往穩(wěn)健運行的同時,天旦發(fā)布BPC4.3版本,帶來升級版的“云圖智能告警”,更準、更快、更易于部署的告警功能,讓IT運維從“自動化”轉變?yōu)椤爸悄芑薄?

上海2018年7月31日電 /美通社/ -- 如同生物會適應環(huán)境而進化,軟件產品也會不斷更新迭代,變得更強大、更智能、更好用。在保障業(yè)務系統(tǒng)一如既往穩(wěn)健運行的同時,天旦發(fā)布 BPC4.3版本,帶來升級版的“云圖智能告警”,更準、更快、更易于部署的告警功能,讓IT運維從“自動化”轉變?yōu)椤爸悄芑薄?/p>

曾經天氣被認為不可預測,直到人類發(fā)射了氣象衛(wèi)星
曾經天氣被認為不可預測,直到人類發(fā)射了氣象衛(wèi)星

天旦BPC + 云圖智能告警,構建數(shù)據中心的第一感知網絡       

“告警功能”始終是 BPC 保持行業(yè)領先、深受用戶喜愛的核心功能。這一次,我們圍繞告警智能化和性能升級進行了一系列大跨步的改進和增強,旨在幫助運維部門能夠更加高效、敏捷地完成工作,實現(xiàn)業(yè)務系統(tǒng)可用性“五個九”(99.999%)。遙想氣象衛(wèi)星的誕生讓人們擁有了對天氣的精準預測能力,升級后的 BPC4.3以全新告警組件“云圖智能告警”為中心,構建起數(shù)據中心的第一感知網絡。

產品化智能告警,運維人員的“筋斗云”

在以前,告警配置是任何性能監(jiān)控系統(tǒng)部署時相當耗費時間和人力資源的環(huán)節(jié)。要了解某項業(yè)務的性能狀態(tài),需要監(jiān)控哪些數(shù)據字段?這些字段又要以怎樣的標準作為性能指標?這就像只是熱個便當,卻必須綜合飯盒材質、食物種類去考慮火力大小、加熱時長一樣。

在“云圖智能告警”組件中,告警配置有了徹底的進化。將不同業(yè)務系統(tǒng)、不同應用組件的監(jiān)控需求進行梳理后,BPC4.3將告警場景歸納為五種類型,幾乎覆蓋了常見的高頻故障場景。五大場景化告警并非簡單的配置模板,而是根據行業(yè)Top客戶的實際部署方案與告警案例分析總結出的一整套智能告警算法,針對各種監(jiān)控場景實現(xiàn)智能、全量、高精度的把控。

天旦BPC云圖智能告警五大場覆蓋常見高頻故障場景
天旦BPC云圖智能告警五大場覆蓋常見高頻故障場景

有了“云圖智能告警”,告警配置如同熱便當時只需按下“一鍵加熱”一樣簡單智能,讓運維人員工作效率大大提升,讓部門迅速完成周全嚴謹又省時省力的監(jiān)控部署。

多維度告警分級,告別事無巨細的蕓蕓告警

在告警的事件管理上,每個企業(yè)都有自己的處理流程和速度標準,以銀行業(yè)為例,存在著告警事件發(fā)生后5分鐘內響應的硬性要求。得益于獨特的網絡旁路技術,BPC 可以做到實時監(jiān)控告警,但考慮到絕大多數(shù)企業(yè)的運維需求,BPC 默認將告警刷新頻率設置為分鐘級,有更高敏感度需求的企業(yè),則可以通過BPC提供的全量實時“互聯(lián)數(shù)據”自行構建使用場景。

天旦產品經理們在產品設計之初的用戶調研中發(fā)現(xiàn),分鐘級對于絕大部分事件完全滿足,但是對于一些比較敏感的核心業(yè)務,企業(yè)還是希望達到更為實時的監(jiān)控。了解到這一點,BPC4.3大力革新告警規(guī)則的結構,將單一規(guī)則升級為多個維度、多個層級的復合型規(guī)則。打個比方:

  • 當被監(jiān)控業(yè)務的成功率從100%下降到99.9%,BPC 只會提醒運維人員注意;
  • 而當下降到98%,BPC 就會全面告警并啟動處理流程;
  • 重要性較低的周邊系統(tǒng)可以以較長的分鐘級刷新告警;
  • 核心業(yè)務模塊則在秒級進行告警通知。

通過劃分告警的不同級別,BPC4.3“云圖智能告警”實現(xiàn)了對事件按照輕重緩急進行判斷和匹配不同處理規(guī)則,既保證了告警的準確及時,又避免了告警系統(tǒng)遇事就喊“報告大王”,實現(xiàn)了運維作業(yè)的精細化管理。

一鍵分析故障域,排障的智能“金剛鉆”

在過去,運維人員通過天旦BPC排障需要這樣操作:

Step1獲得告警信息
Step2進入歷史視圖查看指標變化
Step3在BPC中逐層鉆取,深入分析
Step4最終確認故障原因并處理

而在BPC4.3的“云圖智能告警”僅需2步:

Step1告警觸發(fā),告警通知同時呈現(xiàn)相應節(jié)點的指標變化(成功率、響應時間等)
Step2 一鍵完成故障域的自動下鉆分析,呈現(xiàn)最終的故障原因和故障范圍

全新“云圖智能告警”組件大大縮短事件處理流程,讓IT運維從“自動化”轉變?yōu)椤爸悄芑?,提高運維部門響應速度,讓告警排障緊跟IT運維的發(fā)展趨勢。

AIOps:智能化是運維的未來

將天旦評為“全球最酷廠商”的 Gartner 在2016年提出了 AIOps  的概念(Algorithmic IT Operations,算法驅動的IT運維),并且預測:到2020年,全球50%以上的企業(yè)將應用 AIOps。而實現(xiàn)運維智能化則是天旦產品自始至終貫徹的前進方向,最終也形成了 BPC 領先行業(yè)的巨大優(yōu)勢:

智能發(fā)現(xiàn):5年自研專利解碼引擎,自動發(fā)現(xiàn)應用訪問關系,自動解析業(yè)務數(shù)據內容。
智能梳理:服務路徑圖發(fā)現(xiàn),自動梳理業(yè)務訪問關系,呈現(xiàn)以服務為中心的拓撲視圖。

天旦服務路徑圖發(fā)現(xiàn),自動梳理業(yè)務訪問關系,呈現(xiàn)以服務為中心的拓撲視圖
天旦服務路徑圖發(fā)現(xiàn),自動梳理業(yè)務訪問關系,呈現(xiàn)以服務為中心的拓撲視圖

智能告警:五大場景,識別高頻業(yè)務故障,專有告警功能,精準捕捉并刻畫故障異常。
智能預測:實時監(jiān)控,智能算法自動根據歷史表現(xiàn)繪制基線,直觀發(fā)現(xiàn)變化趨勢。
智能排障:自動定位故障節(jié)點,一鍵解析造成故障發(fā)生的維度和維度值。

通過總結大量現(xiàn)有客戶部署情況和告警案例所得出的場景化告警模型,BPC4.3使得運維人員只需簡單配置全面覆蓋的告警規(guī)則,結合自動故障定位和自動故障域分析,加速故障發(fā)現(xiàn)和分析流程,縮短故障恢復時間。進化永遠沒有盡頭,接下來 BPC 也將通過引入更多自動化組件及智能算法,最終實現(xiàn)全智能式的故障發(fā)現(xiàn)、分析、管理。

走出“有多少人工,就有多少智能”的怪圈

人工智能算法的成長離不開對海量案例的分析和學習,而現(xiàn)有的諸多所謂“AI告警”定制化方案受限于遠遠不足的真實情境下實操案例,需要在部署后耗費繁重人工進行后期調整維護,成為無法預估的人力和工時黑洞,而且算法效果極不穩(wěn)定。

在這一點上,天旦作為企業(yè)級軟件產品公司的優(yōu)勢得以凸顯:通過提供全行業(yè)通用性的產品而非定制化的解決方案,使得智能算法真正成熟產品化,產品用戶共享行業(yè)經驗、共同受益;而國內銀行Top150中120+家的廣泛覆蓋與橫跨銀行、證券、電信運營商、大型企業(yè)的多維度客戶案例,也為算法的極速成長和精準智能提供了能量。天旦也將繼續(xù)堅持企業(yè)級軟件產品之路,努力將人工智能算法在運維領域產品化,并且全力推進 AIOps 的真正實現(xiàn)。

消息來源:天旦
China-PRNewsire-300-300.png
相關鏈接:
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網、科技、媒體、通訊企業(yè)的經營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection