思科联天下
●都在說AI,大語言模型,百模大戰,我們維運團隊能幹點什麼呢
● IT系統出現嚴重故障導致業務中斷,大語言模型時代就無法提前預警嗎
● 業務不間斷運作的要求越來越苛刻,維運人員集體抱怨每晚都睡不踏實
● 我們維運團隊的開發小夥伴真能幹,開發出來了基於大語言模型的維運智能體。但為啥不太懂思科呢
● 過去已經發生過的嚴重故障,不會再出現吧
● 一線值班的兄弟要是能有二線兄弟的技術能力就好了
● 這麼多日誌,怎麼能做到既不錯殺一千,也不放走一個
● 日誌分析從傳統基於正規表示式過渡到機器學習,還是需要大量人工標記的訓練樣本,太過耗時耗力
閒話不多說,直接上乾貨。這麼多頭痛的事情,思科CX GAIOps(生成式智慧維運)是怎麼解決的呢?
先讓我們了解一下
CX GAIOps(生成式智慧運維)是什麼?
◎ 全新一代基於本地開源大語言模型(LLM)+思科內部海量知識庫+客戶實際運維資料訓練所得的維運智能體
◎ 三個組件:
1)基於LLM的日誌分析平台(跨廠商全端即時異常判斷與根因分析)
2)基於LLM的AI本地維運聊天機器人(凝練思科專家經驗)
3)基於LLM的AI輔助維運智能體(使用自然語言產生配置)
◎ 四個基本功能:
1)綜合維資訊分析推理診斷
2)基於知識、案例的推理問答
3)多廠商跨全端即時資訊查詢
4)基於自然語言產生配置/API,自動下發和驗證
◎客戶本地部署(On-Prem模式),無需外傳數據,保護客戶資料安全及隱私
CX GAIOps(生成式智慧運維)
為什麼是全新一代?
◎ 基於LLM大語言模型,透過少量無重大業務影響日誌資料對模型進行訓練
◎ AI日誌分析平台自動學習日誌流中各種設備的日誌,自學習映射轉換成模版,無需大量人工正則或TextFSM等匹配方法
◎ 可對監測結果進行人工糾偏,實現本地資料匯出再訓練,不斷迭代提升準確性
◎ 相對早期基於正規表示式和近期基於機器學習ML的日誌分析,大語言模型已經演進到了全新一代的自動學習與識別
為什麼說只有思科的服務團隊
才能做出來呢?
◎ AI業界大佬一致認可的是在大語言模型時代,專業領域的數據才是核心資產,是每個企業的金礦。只有思科服務(CX)團隊擁有思科維運知識庫(海量Case,海量Log,軟體Bug知識庫等核心資料資產)
◎ 思科服務團隊在2年前就進行了早期投入與研發,形成了一套完整的方法與流程,至少領先業界1年以上的時間
◎ 思科服務團隊已經在客戶處使用真實的多廠商資料進行了1年以上的模型訓練
具體如何解決
你頭痛的事情呢?
◎ 痛點1:如何實現故障的快速定位與提前預警,如何從每日海量日誌定位異常日誌。 CX GAIOps透過在客戶本地的資料學習和微調來實現精準的異常日誌識別,做到了不錯殺一千也不放過一個。
◎ 痛點2:發現異常日誌,該採取什麼正確行動。 CX GAIOps透過思科知識庫的訓練為客戶提供異常日誌的操作建議。
◎ 痛點3:過去發生過的重大故障會不會再出現。 CX GAIOps將客戶過去幾年的重大Case的特徵提取出來,訓練到模型中,在檢測到類似日誌後即時給出建議措施。
◎ 痛點4:第一線的值班人員不理解Error Message的具體意義。 CX GAIOps提供了一個基於大語言模型的聊天機器人,第一線人員可以透過自然語言和機器人互動並理解具體含義。
◎ 痛點5:產品的命令手冊經常超過9千頁,很難學習和使用。 CX GAIOps提供基於大語言模型的聊天機器人,技術人員可以透過自然語言和機器人互動來產生所需的精確命令。