云智慧劉洪濤:與其說AIOps是產(chǎn)品,不如說這是一種理念和策略

2019-08-07 10:32:25

“這些年大家都在談數(shù)字化轉(zhuǎn)型,但大家關(guān)注的核心焦點(diǎn)在建設(shè)上。怎么理解這句話?比如一家傳統(tǒng)企業(yè)要數(shù)字化轉(zhuǎn)型,會(huì)引進(jìn)很多數(shù)字化系統(tǒng)、手段,例如上云,利用大數(shù)據(jù)、IOT驅(qū)動(dòng)業(yè)務(wù)轉(zhuǎn)型升級(jí)。

但企業(yè)實(shí)現(xiàn)數(shù)字化后,會(huì)擁有上百個(gè)系統(tǒng),很容易出現(xiàn)緩慢、崩潰現(xiàn)象,面臨很多挑戰(zhàn)。其次,企業(yè)在運(yùn)維管理方面養(yǎng)了好幾十人的運(yùn)維團(tuán)隊(duì),工作量很大,但管理模式過于傳統(tǒng),效率很低。所以,這時(shí)候企業(yè)才開始用人工智能的手段來變革運(yùn)維領(lǐng)域,解決企業(yè)各種系統(tǒng)運(yùn)行問題。

圖片1.jpg

云智慧總裁劉洪濤

不過,目前,大多數(shù)企業(yè)客戶還屬于上云,上系統(tǒng)的階段,還沒考慮到系統(tǒng)維護(hù)、運(yùn)維的階段。這也是為什么企業(yè)IT領(lǐng)域,IT運(yùn)維發(fā)展滯后的原因。”云智慧總裁劉洪濤說道。

云智慧成立于2009年,是一家全棧智能運(yùn)維解決方案服務(wù)企業(yè)。今年6月,云智慧完成了由華山資本領(lǐng)投,紅杉資本中國(guó)基金、水木投資和浙民投/浙江絲路基金跟投的 2500 萬美元 D 輪投資。

數(shù)字化時(shí)代,傳統(tǒng)IT運(yùn)維管理的機(jī)遇與挑戰(zhàn)

目前,我國(guó)IT服務(wù)發(fā)展已經(jīng)進(jìn)入到相對(duì)穩(wěn)定的增長(zhǎng)階段,有著極為可觀的市場(chǎng)前景。據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),2017年中國(guó)IT服務(wù)市場(chǎng)規(guī)模為6077.7億元,同比增長(zhǎng)16.2%,預(yù)計(jì)未來四年將保持13.8%年復(fù)合增長(zhǎng)率,到2021年整體市場(chǎng)規(guī)模將突破萬億大關(guān)。

與此同時(shí),越來越多的高科技企業(yè)加入到數(shù)字化轉(zhuǎn)型大軍中,而IT服務(wù)市場(chǎng)的競(jìng)爭(zhēng)格局也發(fā)生著變化,優(yōu)質(zhì)IT服務(wù)企業(yè)開始進(jìn)入大眾視野。

然而,在移動(dòng)化、大數(shù)據(jù)、云計(jì)算、人工智能等新技術(shù)的推動(dòng)下,企業(yè)的 IT技術(shù)架構(gòu)悄然變遷,從傳統(tǒng)“IOE架構(gòu)”走向“互聯(lián)網(wǎng)架構(gòu)”?;ヂ?lián)網(wǎng)架構(gòu)所涉及的網(wǎng)元數(shù)、技術(shù)棧、服務(wù)數(shù)等元素成倍劇增,使得運(yùn)維壓力越來越大。

劉洪濤告訴i黑馬&數(shù)字觀察,企業(yè)一方面享受著數(shù)字技術(shù)帶來的創(chuàng)新成果,一方面卻又有意無意的忽略了IT自身的潛在風(fēng)險(xiǎn),不能在IT出現(xiàn)問題的第一時(shí)間發(fā)現(xiàn),并作出有效應(yīng)對(duì)。

首先,從C/S架構(gòu)到B/S架構(gòu),再到移動(dòng)化的APP和小程序,加上云計(jì)算、物聯(lián)網(wǎng)、邊緣計(jì)算等技術(shù)的應(yīng)用,企業(yè)IT架構(gòu)越來越龐大,運(yùn)維工作變得越來越復(fù)雜。

“一直以來,IT部門的職責(zé)局限于維護(hù)系統(tǒng)的穩(wěn)定運(yùn)行,鮮少與業(yè)務(wù)運(yùn)行指標(biāo)掛鉤,當(dāng)業(yè)務(wù)出現(xiàn)波動(dòng)后再?gòu)暮A咳罩?、監(jiān)控?cái)?shù)據(jù)中排查原因,往往已經(jīng)造成難以彌補(bǔ)的損失。”

其次,龐大的數(shù)據(jù)量也是運(yùn)維工作面臨的巨大挑戰(zhàn)。很多大型企業(yè)的服務(wù)器數(shù)量就達(dá)到上萬臺(tái),每時(shí)每刻產(chǎn)生海量的數(shù)據(jù),這些數(shù)據(jù)里還藏著大量關(guān)鍵信息,比如某系統(tǒng)的日志數(shù)據(jù)不正常,可能造成未來數(shù)小時(shí)整個(gè)業(yè)務(wù)流程的緩慢,甚至中斷。

第三,過去受限于技術(shù)和人力等方面原因,IT系統(tǒng)一旦出現(xiàn)故障,需要手工排查問題,效率非常差。

“科技進(jìn)步推動(dòng)IT從標(biāo)準(zhǔn)化、自動(dòng)化向數(shù)字化、智能化轉(zhuǎn)變。如此高速發(fā)展、競(jìng)爭(zhēng)激烈的經(jīng)濟(jì)環(huán)境中,企業(yè)必須重新審視IT與業(yè)務(wù)的關(guān)系,否則就會(huì)被行業(yè)領(lǐng)先者和互聯(lián)網(wǎng)創(chuàng)新企業(yè)所淘汰。

與此同時(shí),IT運(yùn)維的角色正在發(fā)生根本性轉(zhuǎn)變,從默默無聞的支撐者變成業(yè)務(wù)運(yùn)行不可或缺的賦能者。而智能運(yùn)維(AIOps)作為AI、大數(shù)據(jù)技術(shù)與IT運(yùn)維融合的產(chǎn)物,也成為傳統(tǒng)企業(yè)數(shù)字化轉(zhuǎn)型的必然選擇。”

智能運(yùn)維是理念和策略,數(shù)據(jù)是基礎(chǔ)

2016年,Gartner首次提出智能運(yùn)維(以下簡(jiǎn)稱AIOps)概念。

在Gartner的《Market Guide for AIOps Platforms》報(bào)告中對(duì)AIOps做出了定義:AIOps平臺(tái)是結(jié)合大數(shù)據(jù)、人工智能(AI)或機(jī)器學(xué)習(xí)功能的軟件系統(tǒng),用以增強(qiáng)和部分取代廣泛應(yīng)用的現(xiàn)有IT運(yùn)維流程和事務(wù),包括可用性和性能監(jiān)控、事件關(guān)聯(lián)和分析,IT服務(wù)管理以及運(yùn)維自動(dòng)化。

總的來說,與傳統(tǒng)IT運(yùn)維相比,智能運(yùn)維具有無可比擬的優(yōu)勢(shì)。過去受限于技術(shù)和人力等方面原因,IT系統(tǒng)一旦出現(xiàn)故障,便需要大量資源手工排查問題,效率非常差。

智能運(yùn)維不但有效減少告警的誤報(bào)率和錯(cuò)報(bào)率,通過交易鏈自動(dòng)追蹤和故障根因分析,幫助運(yùn)維第一時(shí)間發(fā)現(xiàn)問題根源,并把故障的排查和修復(fù)時(shí)間縮短到數(shù)個(gè)小時(shí)。

舉個(gè)例子,一家大型企業(yè)可能有數(shù)百套IT系統(tǒng),過去,出現(xiàn)故障后,如果依靠人力逐一排查,大概需要一周的時(shí)間。而使用智能運(yùn)維平臺(tái),不但有效減少告警的誤報(bào)率和錯(cuò)報(bào)率,通過交易鏈自動(dòng)追蹤和故障根因分析,能夠把故障的排查和修復(fù)時(shí)間縮短到數(shù)個(gè)小時(shí)。

在劉洪濤看來,智能運(yùn)維并不是一個(gè)全新的理念,而是IT運(yùn)營(yíng)分析/運(yùn)維管理(ITOA/ITOM)體系與大數(shù)據(jù)和人工智能技術(shù)結(jié)合的產(chǎn)物。

AIOps智能運(yùn)維平臺(tái)以ITOM/ITOA系統(tǒng)所采集的運(yùn)維大數(shù)據(jù)為基礎(chǔ),利用人工智能和機(jī)器學(xué)習(xí)算法對(duì)運(yùn)維數(shù)據(jù)進(jìn)行深入分析,涵蓋IT監(jiān)控,應(yīng)用性能管理、外網(wǎng)監(jiān)控、日志分析,系統(tǒng)安全等方面。

前幾年大家對(duì)AIOps爭(zhēng)論非常大,都在講自己對(duì)AIOps的定義與理解,以及接下來AIOps發(fā)展方向。當(dāng)時(shí)對(duì)其爭(zhēng)論的方向有這幾個(gè):第一類,AIOps是自動(dòng)化運(yùn)維,就是我們要把Ops消滅掉,通過自動(dòng)化運(yùn)維方式,用機(jī)器去取代人。第二類,利用智能化的手段,替代高重復(fù)性的工作,全程自動(dòng)化、智能化操作。

第三類是我們理解的AIOps,AIOps的核心在于企業(yè)解決的不是運(yùn)維的問題,而是如何提高運(yùn)維效率,解決如何支持業(yè)務(wù)的問題。

“對(duì)于AIOps,我們的觀點(diǎn)是,第一,與其說AIOps是產(chǎn)品,不如說這是一種理念和策略。通過以數(shù)據(jù)為基礎(chǔ),場(chǎng)景為導(dǎo)向,算法為支撐的AIOps平臺(tái),為企業(yè)現(xiàn)有運(yùn)維管理工具和管理體系賦予統(tǒng)一數(shù)據(jù)管控能力和智能化數(shù)據(jù)分析能力,全面提升運(yùn)維管理效率。

第二,現(xiàn)階段AIOps的目標(biāo)不是NoOps,而是BetterOps,通過更高效的運(yùn)維幫助企業(yè)快速洞察人力難以企及的故障和問題,準(zhǔn)確預(yù)測(cè)風(fēng)險(xiǎn),化被動(dòng)運(yùn)維為主動(dòng)運(yùn)維。

可以這么理解,企業(yè)IT運(yùn)維服務(wù)商,要幫助企業(yè)客戶把運(yùn)維問題消滅在內(nèi)部,讓使用者還沒有發(fā)現(xiàn)問題之前,運(yùn)維系統(tǒng)已經(jīng)把問題解決掉了,感受不到運(yùn)維的存在,做到無感知的運(yùn)維。就像我們?cè)谑褂梦⑿乓粯?,我們不?huì)感覺微信背后有一個(gè)運(yùn)維團(tuán)隊(duì)存在,雖然它偶爾會(huì)出故障,但極少,他們的運(yùn)維的工作做得非常多,才能實(shí)現(xiàn)這點(diǎn)。

第三,AIOps的基礎(chǔ)是什么?我們認(rèn)為是數(shù)據(jù)。“因?yàn)锳IOps需要收集企業(yè)內(nèi)部系統(tǒng)、外部系統(tǒng)、第三方的各種數(shù)據(jù),匯集到一起,通過AI的方式進(jìn)行分析和處理,幫助企業(yè)運(yùn)維人員用正確的運(yùn)維動(dòng)作和管理方式,提升整體的運(yùn)維效率。”

總的來說,把日常的IT管理工作移交給擁有機(jī)器學(xué)習(xí)和自動(dòng)化運(yùn)維能力的智能運(yùn)維平臺(tái),大大降低企業(yè)管理的時(shí)間成本和人力、資金投入。

而運(yùn)維管理人員也可以從篩查海量告警信息、執(zhí)行重復(fù)性巡檢任務(wù)、人工判斷故障、手動(dòng)解決問題的低效工作中釋放出來,專注于構(gòu)建更加高效、高擴(kuò)展的IT系統(tǒng),支持企業(yè)的數(shù)字化業(yè)務(wù)發(fā)展,這也就是業(yè)界所倡導(dǎo)的“IT從運(yùn)維到運(yùn)營(yíng)”之路。

AIOps智能運(yùn)維平臺(tái)還能有效預(yù)測(cè)潛在的IT故障,并在無需人為干預(yù)的情況下提前解決掉這些問題,而應(yīng)用系統(tǒng)故障率的降低,將有效提高云計(jì)算資源的使用效率。這得益于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法在IT監(jiān)控和應(yīng)用性能管理系統(tǒng)中的持續(xù)積累,不斷記錄IT運(yùn)維人員在不同場(chǎng)景下使用故障排除或修復(fù)基本問題的自動(dòng)化工具的操作。

劉洪濤認(rèn)為,企業(yè)采用AIOps的能力不僅取決于IT監(jiān)控系統(tǒng)的數(shù)據(jù)規(guī)模和自動(dòng)化系統(tǒng)的可用性,還取決于人員和流程的一致性。

服務(wù)商可以在很短時(shí)間內(nèi)把AIOps智能運(yùn)維平臺(tái)部署到企業(yè),但是任何管理轉(zhuǎn)型都不是安裝一套系統(tǒng)那么簡(jiǎn)單,需要根據(jù)業(yè)務(wù)特點(diǎn)對(duì)人員和流程進(jìn)行調(diào)整,而這往往需要更多的時(shí)間。

那么,一個(gè)完整的AIOps智能運(yùn)維平臺(tái)具備哪些要素呢?

劉洪濤指出,首先,這個(gè)平臺(tái)要具備完整的數(shù)據(jù)采集和數(shù)據(jù)處理能力,可以收集企業(yè)的多維度數(shù)據(jù),并且聚合到一起,這是基礎(chǔ)。

其次,在具有海量數(shù)據(jù)基礎(chǔ)之上,平臺(tái)要具備AI能力,這個(gè)能力不是隨便一個(gè)算法就能解決的,是針對(duì)運(yùn)維領(lǐng)域的算法能力。

第三,就是對(duì)客戶的業(yè)務(wù)要有充分和深度的理解。“我們知道,不同的行業(yè),不同的公司,業(yè)務(wù)屬性都不同,服務(wù)商需要依據(jù)客戶的具體業(yè)務(wù)和應(yīng)用場(chǎng)景,提供最佳實(shí)踐的解決方案,而不是一個(gè)標(biāo)準(zhǔn)化的產(chǎn)品。

基于此,我們要了解不同行業(yè)的特性,不同企業(yè)客戶的業(yè)務(wù),對(duì)其業(yè)務(wù)要有深度的理解,進(jìn)而針對(duì)他們的需求,提供個(gè)性化解決方案。

總的來說,我們的目標(biāo)就是,一方面,要追求解決方案的標(biāo)準(zhǔn)化,要把很多需求做到模塊化,方便客戶調(diào)用。另一方面,對(duì)客戶的業(yè)務(wù)要有深刻的理解,針對(duì)不同的客戶,提供不同的模塊產(chǎn)品組合,滿足其業(yè)務(wù)需求。”

基于對(duì)客戶的理解,從單一產(chǎn)品到解決方案延展

i黑馬&數(shù)字觀察了解到,2009年的時(shí)候,很多中小互聯(lián)網(wǎng)企業(yè)的監(jiān)控能力有限,Zabbix、Nagios等絕大部分監(jiān)控工具提供的都是內(nèi)網(wǎng)監(jiān)控,只能監(jiān)測(cè)內(nèi)部服務(wù)器的運(yùn)行狀態(tài),當(dāng)外網(wǎng)出現(xiàn)問題或監(jiān)測(cè)服務(wù)器宕機(jī)了,就無法收到任何告警信息,往往要等憤怒的用戶打來投訴電話,運(yùn)維工程師才知道網(wǎng)站或服務(wù)又不可用了。

云智慧看準(zhǔn)時(shí)機(jī),面向中小型互聯(lián)網(wǎng)用戶推出主動(dòng)式撥測(cè)的網(wǎng)站監(jiān)控SaaS服務(wù)——監(jiān)控寶,這是一個(gè)簡(jiǎn)單、易用,基于外網(wǎng)監(jiān)控的工具,它不需要有過多的投入,就能迅速發(fā)現(xiàn)問題。監(jiān)控寶恰好滿足了當(dāng)時(shí)網(wǎng)站互聯(lián)互通的需求痛點(diǎn),用戶增長(zhǎng)相當(dāng)快,2014年用戶已達(dá)18萬。

雖然監(jiān)控寶做得非常成功,但是,大部分客戶都是小微企業(yè),付費(fèi)意愿不強(qiáng),無法滿足云智慧進(jìn)一步發(fā)展的需求。再加上,2014年移動(dòng)互聯(lián)網(wǎng)的爆炸式發(fā)展,行業(yè)對(duì)APM的需求日趨火爆,云智慧順勢(shì)推出了APM應(yīng)用性能管理平臺(tái)透視寶。

“當(dāng)時(shí)我們發(fā)現(xiàn),基礎(chǔ)監(jiān)控是客戶最底層、最基礎(chǔ)的運(yùn)維需求,再往深入的看,就進(jìn)入代碼層面,叫應(yīng)用監(jiān)控,這就是后來我們所說的APM。”

據(jù)悉,APM和監(jiān)控寶很大的不同在于它能夠服務(wù)大中型企業(yè),解決的是復(fù)雜的IT系統(tǒng)性能問題。當(dāng)時(shí)有三家公司同時(shí)進(jìn)入這個(gè)對(duì)技術(shù)門檻要求很高的領(lǐng)域。

也就是說這個(gè)方向比原來的更有價(jià)值,客單價(jià)也從原來的一年幾千塊變成了幾十萬。因?yàn)锳PM滿足了大客戶的需求,而且大客戶都是有預(yù)算的。

隨后,云智慧又根據(jù)互聯(lián)網(wǎng)規(guī)?;l(fā)展的需求推出了另外兩塊業(yè)務(wù),壓測(cè)寶和天機(jī)數(shù)據(jù)。其中天機(jī)數(shù)據(jù)聚焦政企大數(shù)據(jù)方面的應(yīng)用,通過搭建大數(shù)據(jù)平臺(tái),進(jìn)行即時(shí)數(shù)據(jù)分析,提供業(yè)務(wù)發(fā)展和商業(yè)決策依據(jù)。

但是,i黑馬&數(shù)字觀察發(fā)現(xiàn),當(dāng)時(shí)市面上的幾家APM廠商過得都不太好,要么宣布轉(zhuǎn)型,拓展新業(yè)務(wù),要么就是創(chuàng)始團(tuán)隊(duì)退出,公司名存實(shí)亡,一時(shí)間APM被唱衰的論調(diào)此起彼伏。

“我們這幾家廠商從APM角度切入市場(chǎng)的戰(zhàn)略是沒有錯(cuò)的。隨著企業(yè)系統(tǒng)復(fù)雜度越來越高,而IT對(duì)業(yè)務(wù)的支持或者業(yè)務(wù)對(duì)IT的依賴度也越來越高,這樣客戶對(duì)故障率、穩(wěn)定性的需求愈加明顯,而APM就是能夠解決這些問題。

像BAT這類大型互聯(lián)網(wǎng)公司,自己做APM這件事很久了,沒有靠外面的一個(gè)產(chǎn)品或體系來做。因?yàn)橐粋€(gè)互聯(lián)網(wǎng)公司從底層架構(gòu)開始搭建到整個(gè)代碼開發(fā)完全都是自己的,所以對(duì)他們來說,自己去做APM是一個(gè)很自然的事情。”劉洪濤說道。

為什么后來大家都轉(zhuǎn)型了?

劉洪濤進(jìn)一步解釋道,一年IT預(yù)算幾千萬甚至是上億的大企業(yè),需要的是完整的解決方案,而不是一個(gè)工具化的產(chǎn)品,而APM并不是大型企業(yè)的剛需。而且做一個(gè)大客戶整個(gè)的銷售過程是很漫長(zhǎng)的,從挖掘客戶需求到達(dá)成合作、簽訂合同、實(shí)施,半年時(shí)間過去了,同時(shí)還要有豐富經(jīng)驗(yàn)的客戶服務(wù)團(tuán)隊(duì)才能做這種事。

幾十萬,很顯然,投入產(chǎn)出比不合理。這和中國(guó)APM市場(chǎng)的滲透程度有關(guān):大客戶不愿意買工具類產(chǎn)品,用什么產(chǎn)品他們不關(guān)心,他們關(guān)心的是解決問題??偠灾?,客戶對(duì)于故障分析這類問題的痛點(diǎn)是存在的,但客戶并不想去買一個(gè)工具性的產(chǎn)品。

“當(dāng)時(shí)我們賽道的幾家都是看到市場(chǎng)有需求,才進(jìn)來的,但后來我們也都發(fā)現(xiàn)了客戶不想要單一的APM的工具這個(gè)問題,這一點(diǎn)和美國(guó)那邊做單一APM產(chǎn)商活的很好的狀況不同。美國(guó)客戶是習(xí)慣購(gòu)買單一工具類產(chǎn)品,因?yàn)樗麄兊腎T成熟度高,IT架構(gòu)也比較清楚,客戶技術(shù)水平也高,而中國(guó)的客戶并不希望是買標(biāo)準(zhǔn)化工具。

就是因?yàn)槲覀冞@幾家都看到這個(gè)問題了,所以各自選擇了自己的下一步該怎么解決客戶問題的方向,發(fā)展到今天,大家的道路不同,結(jié)果也是不同的。”

經(jīng)過思考,云智慧開始轉(zhuǎn)型,從單一的工具開始向一體化解決方案升級(jí),目標(biāo)客戶定位開始向中大型企業(yè)延展,云智慧認(rèn)為,只有這部分客戶愿意為業(yè)務(wù)運(yùn)維一體化解決方案買單。在此基礎(chǔ)上,云智慧針對(duì)傳統(tǒng)行業(yè)客戶和互聯(lián)網(wǎng)客戶,提供了差異化的產(chǎn)品和解決方案。

互聯(lián)網(wǎng)客戶的技術(shù)能力較強(qiáng),對(duì)業(yè)務(wù)運(yùn)維服務(wù)需求不大,更偏向于工具性服務(wù),因此主打工具類產(chǎn)品即監(jiān)控寶和透視寶。傳統(tǒng)行業(yè)客戶需要綜合性問題的解決方法,對(duì)這類客戶,云智慧直接提供業(yè)務(wù)運(yùn)維解決方案。

談到云智慧的每次轉(zhuǎn)型升級(jí)背后的思考邏輯時(shí)候,劉洪濤指出,云智慧的基因來自對(duì)客戶業(yè)務(wù)和需求的理解,也是我們一直以來追求的。無論是初創(chuàng)階段做監(jiān)控寶,還是轉(zhuǎn)型做APM,或者又升級(jí)做業(yè)務(wù)運(yùn)維,智能運(yùn)維,我們始終圍繞的是客戶到底要什么,我們做對(duì)客戶的業(yè)務(wù),對(duì)客戶需求的深刻的理解。

基于這些理解,我們開始思考,到底做什么樣的東西才能夠滿足客戶需要。同時(shí),云智慧也有自己的技術(shù)能力,把想做的東西通過技術(shù)做成產(chǎn)品化的東西,再落地。

“一直以來,我們對(duì)客戶的現(xiàn)狀和未來有深度的思考和理解,對(duì)IT行業(yè)有深度的思考,同時(shí)又有技術(shù)能力去實(shí)現(xiàn)我們這些想法,幫助客戶解決問題。”

圍繞上述思考,云智慧提出了智能運(yùn)維實(shí)施的三階段戰(zhàn)略,第一,數(shù)據(jù)為先,在這個(gè)階段實(shí)現(xiàn)企業(yè)IT數(shù)據(jù)的完整采集;第二,初步智能化,幫客戶發(fā)現(xiàn)業(yè)務(wù)與IT的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)業(yè)務(wù)全鏈路追蹤和根因分析;第三,高級(jí)智能化,用AI幫助客戶解決更有前瞻性的問題,包括故障預(yù)測(cè)、容量規(guī)劃等。

概括來講就是,云智慧通過智能業(yè)務(wù)運(yùn)維DOCP平臺(tái),利用大數(shù)據(jù)和人工智能技術(shù),以實(shí)時(shí)大數(shù)據(jù)處理、AIOps技術(shù)體系為基礎(chǔ),由輕量級(jí)、低入侵、松耦合的一體化監(jiān)控、業(yè)務(wù)運(yùn)維和智能運(yùn)維解決方案,以及IT性能監(jiān)控、應(yīng)用性能管理、業(yè)務(wù)效能分析等應(yīng)用模塊為支撐構(gòu)成一體化的數(shù)字化運(yùn)維中心平臺(tái)。

這樣一來,企業(yè)客戶可以通過業(yè)務(wù)運(yùn)維可視化大屏,找到亟需解決的IT問題,持續(xù)提升業(yè)務(wù)運(yùn)營(yíng)和IT管理效率。

DOCP是一個(gè)運(yùn)維監(jiān)控管理和大數(shù)據(jù)智能分析平臺(tái),通過構(gòu)建起支持?jǐn)?shù)字化業(yè)務(wù)指標(biāo)體系,可以全量采集不同數(shù)據(jù)源的IT性能數(shù)據(jù)、告警信息、業(yè)務(wù)指標(biāo)數(shù)據(jù),利用大數(shù)據(jù)技術(shù)對(duì)海量數(shù)據(jù)進(jìn)行梳理、規(guī)范和關(guān)聯(lián),利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等AIOps方法體系實(shí)現(xiàn)根因分析和故障溯源,準(zhǔn)確評(píng)估系統(tǒng)異常對(duì)業(yè)務(wù)造成的實(shí)際影響,實(shí)現(xiàn)監(jiān)控、分析、發(fā)現(xiàn)、告警等數(shù)字化運(yùn)維環(huán)節(jié)的高效管控和業(yè)務(wù)與IT數(shù)據(jù)的雙向驅(qū)動(dòng)。

自從2016年云智慧推出智能業(yè)務(wù)運(yùn)維DOCP以來,已經(jīng)陸續(xù)在銀行、保險(xiǎn)、證券、零售、制造、航空等多個(gè)行業(yè)的不同應(yīng)用場(chǎng)景落地,并獲得了用戶的一致認(rèn)可。

以金融行業(yè)為例,F(xiàn)intech的發(fā)展推動(dòng)傳統(tǒng)金融機(jī)構(gòu)加速數(shù)字化轉(zhuǎn)型,利用AI、大數(shù)據(jù)、區(qū)塊鏈、物聯(lián)網(wǎng)、生物識(shí)別創(chuàng)新技術(shù),重塑自身業(yè)務(wù)模式、內(nèi)部流程和決策管理能力,滿足業(yè)務(wù)增長(zhǎng)的需求。

而互聯(lián)網(wǎng)金融業(yè)務(wù)的持續(xù)增長(zhǎng),傳統(tǒng)以穩(wěn)定可靠為先的IT管理模式和運(yùn)維服務(wù)流程難以滿足個(gè)人消費(fèi)者互聯(lián)網(wǎng)級(jí)的用戶體驗(yàn)需求,因此需要更加精益、敏捷的新一代運(yùn)維管理解決方案。

針對(duì)金融行業(yè)的需求特點(diǎn),云智慧推出全棧智能運(yùn)維解決方案,以數(shù)據(jù)為基礎(chǔ),場(chǎng)景為導(dǎo)向,算法為支撐,面向雙態(tài)IT系統(tǒng)構(gòu)建全棧統(tǒng)一監(jiān)控平臺(tái),實(shí)現(xiàn)豎井系統(tǒng)的數(shù)據(jù)連通;基于機(jī)器學(xué)習(xí)的跨系統(tǒng)調(diào)用鏈監(jiān)控與追蹤,準(zhǔn)確分析業(yè)務(wù)波動(dòng)根本原因;依托PB級(jí)大數(shù)據(jù)能力,實(shí)時(shí)處理網(wǎng)絡(luò)、APM、日志數(shù)據(jù),實(shí)現(xiàn)面向事件的異常檢測(cè)、根因分析、故障預(yù)測(cè)和智能告警,有效降低MTTR;圍繞業(yè)務(wù)目標(biāo),實(shí)現(xiàn)業(yè)務(wù)與IT的統(tǒng)一健康態(tài)勢(shì)可視化,支撐決策。

在最后,劉洪濤坦言,云智慧從網(wǎng)絡(luò)監(jiān)控工具到一體化智能運(yùn)維解決方案的過程中遇到很多困難與挑戰(zhàn),“首先,從團(tuán)隊(duì)自身的迭代就是很大的挑戰(zhàn)。我們?cè)瓉淼漠a(chǎn)品經(jīng)理是做簡(jiǎn)單產(chǎn)品的,現(xiàn)在他要提供復(fù)雜的解決方案;前端的售前,原來是產(chǎn)品銷售型變成解決方案型的售前;整個(gè)公司的客戶服務(wù)流程或者業(yè)務(wù)流程也會(huì)發(fā)生很大的變化。

其次,單一的Saas產(chǎn)品銷售是很容易的,客戶需要簽了合同,開帳號(hào)用就好了,但現(xiàn)在變成解決方案了,交付流程就變得很復(fù)雜,需要和客戶討論實(shí)際情況是什么樣,我們需要根據(jù)客戶的實(shí)際情況,提供相應(yīng)的解決方案,而且還要讓這個(gè)方案落地。

而且當(dāng)解決方案在在客戶那里上線以后,使用的過程中還會(huì)遇到各種問題,需要幫助客戶迭代升級(jí)維護(hù)。所以對(duì)于公司整體運(yùn)營(yíng)來說,挑戰(zhàn)非常大的。”