2022 年 12 月,愛分析舉辦了“2022愛分析·數據智能網絡研讨會”。愛分析邀請Kyligence合夥人&副總裁李棟進行了題為《指标中台,構建數字化管理新體系》的主題演講。
指标是企業數據價值消費單元,也是企業實現精細化管理、數據驅動的必要工具。目前,更廣泛的人員正在參與和影響企業業務發展,這對指标質量、指标開發效率、指标更新時效等提出了更高要求。指标中台無疑成為企業實現指标管理、提升運營效率的重要工具。
Kyligence 合夥人&副總裁李棟在會上的演講圍繞指标中台展開,分享了指标中台的發展背景和趨勢、典型客戶建設指标中台案例和效果,介紹了指标中台技術底座對解決寬表爆炸、企業數據指标口徑、企業數字化管理等痛點的價值。
現将李棟總的演講實錄整理後分享如下。
Kyligence 合夥人&副總裁李棟:
01 公司簡介
我的分享主題是《指标中台,構建數字化管理新體系》。首先簡單介紹一下Kyligence,Kyligence是全球領先的多維數據庫和指标中台的技術軟件供應商,于2016年由Apache Kylin開源項目的創始團隊創建。Apache Kylin是目前較為領先的大數據 OLAP 開源技術。Kyligence研發的多維數據庫和指标中台等産品,也是依托于Apache Kylin技術實現。同時Kyligence入選了《2022 Gartner Innovation Insight for Metrics Store》報告,這是唯一入選的中國廠商。此外,我們還有很多合規認證等。
02 指标中台的趨勢和背景
在上周的12月15号,由愛分析和Kyligence共同打造的中國首份《指标中台市場研究報告》剛剛發布。在此之前,雙方還開展了一項關于“企業指标管理與數據分析現狀”的調研。調研涵蓋了銀行、保險、制造、零售與消費品等各個行業的數字化轉型領先企業,涉及數據、IT、業務等多種角色一起深度參與,收集了很多寶貴數據。此外還有來自銀行、保險、零售等行業客戶的最佳實踐。基于所有這些信息,我們整合成了這樣一份指标中台報告,歡迎大家下載。我今天的分享也将以這份報告中的内容為主線進行展開。
首先是關于指标中台的趨勢和背景。德魯克曾經說過,沒有度量就沒有管理,因為不能去管理一些不可度量的事物。除此之外,我們也會看到企業數字化經營的關鍵,是要建立以指标為核心的管理體系,例如KPI、OKR,或是平衡計分卡、BI等管理手段,本質上都是在幫助企業的決策者和管理者更好地了解企業的經營指标,構建可觀測的經營管理體系。
指标是通用的管理語言
為什麼指标這麼重要?指标是企業内部通用的管理語言,連接着業務和數據。一方面在業務側,人人用指标,指标是企業業務運營、經營管理過程中的共同語言。在數據側,指标又是通用的數據語言。隻有把數據加工成為指标,或者通過數據計算出指标結果,才能夠體現出數據分析的價值。在愛分析和Kyligence聯合開展的“企業指标管理與數據分析”的調研中,當評價指标體系對于公司的重要程度時,能看到有85%的企業認為指标體系對于公司很重要,有49%的企業是經常使用指标體系管理業務。
指标體系建設面臨的挑戰
指标體系的重要性已很明确,然而企業在建設指标體系的過程中面臨諸多挑戰。第一個挑戰是現有系統難以滿足業務人員更精細化、更實時的用數需求。如業财一體化中,業務人員和财務人員希望站在全局的視角上,同時對業務部數據和财務數據有宏觀的了解。這要求對現有的跨平台或多渠道的數據進行整合,這是企業當下面臨的第一個挑戰。
第二個挑戰是企業IT能力和成本有限,無法滿足業務爆發式的增長。比如保險公司每周都會發布新産品,每個新産品都需要運營團隊對用戶的各種行為數據進行詳細分析。然而公司不可能為每個新産品都投入相應的IT資源,包括通過數據開發人力進行手工開發等,這個成本很難吃得消。
第三個挑戰是管理人員缺少統一的指标查詢入口。這個挑戰本質上還是指标口徑問題。以銷售額為例,從财務視角和業務視角對銷售額的計算口徑就會不一樣。口徑不一緻,管理上就需要花很多時間對齊口徑。
第四個挑戰是數據治理缺少有效的抓手。當企業缺乏有效的抓手去開展數據治理工作時,将很難産生直接的成果和效益。調研數據也驗證了這一點,在統計中發現,像指标質量、指标體系不完整、數據分析平台性能待完善等,都是企業普遍面臨的問題。
什麼是指标中台
指标中台産品的設計初衷就是解決以上問題。為什麼叫指标中台?對于中台,大家很熟悉的概念有One Data、 One ID、 One Service 等。指标中台是集中管理、存儲指标以及提供指标服務的一個平台,提供業務模型、指标管理、指标加工、數據服務等一體化的解決方案。指标中台在企業整體的架構中,處于數據湖、數倉和數據應用之間。
指标中台主要有兩部分,上面一部分是指标應用,下面一部分是計算引擎。應用層的目的是構建指标目錄,包括像指标定義、指标可視化、指标質量、指标管理、指标服務等功能。在指标定義中,需要定義指标的口徑、指标的計算邏輯、商業意義、商業價值以及指标的歸屬。
在計算引擎層,針對指标分析、指标查詢、指标服務等功能實現,需要具備高性能、高并發的計算分析能力,以支撐平民數據分析師對海量數據的使用。
基于指标中台,在下遊的多種分析工具如BI、Excel、Tableau及其他可視化工具、協同工具中,都可以獲取最權威的具備一緻性的數據。
03 指标中台實踐案例
接下來介紹指标中台的實踐案例。
平安銀行:潘多拉指标中台
銀行業的數字化一直走在各個行業的前列。首先介紹一個來自于平安銀行的案例。平安銀行是一家全國性的股份制商業銀行,金融服務種類齊全。平安銀行從2016年起開始數字化轉型布局。在平安銀行的零售業務闆塊中,包括信用卡、消費金融、汽車金融等細分業務闆塊,每個闆塊都涉及到産品、渠道、客戶交易等信息。從數據分析的角度來看,要想實現精準營銷、改善客戶體驗,需要從不同維度、不同渠道以及用不同的指标來進行複合性的分析。例如在精準營銷中,對客戶生命周期全鍊路進行管理時,需要結合客戶在銀行的交易數據、産品數據、行為數據等進行綜合分析。
在建設指标中台之前,平安銀行通過傳統的BI報表分析的方式,面臨許多挑戰:1)數據治理難,報表口徑不一緻,取數存在信任危機;2)數據協同難,不同部門間的數據處理模式不同,相互之間很難複用;3)數據處理工具使用難,效率低,如平安銀行的零售業務中數據開發人員高達200名,依然存在數據開發周期長、響應慢的問題。
為解決以上問題,平安銀行建設了潘多拉指标平台,并選型使用 Kyligence 多維數據庫作為底層核心組件。所有業務人員通過潘多拉指标平台自助獲取所需要的任何業務的指标數據,可以減少重複性報表的開發工作,通過指标看闆、智能的歸因分析和趨勢預測來對指标進行一站式的、全鍊路的分析和洞察。此外,也能通過潘多拉指标平台的指标定義、指标發布、指标管理等一系列指标自動化管理流程來提升數據和指标管理效率。
目前平台已經接入了15000多個指标、1000多個維度,活躍用戶也已超過5000人。從效果來看,數據開發效率得到大幅提升,數據開發周期縮短了3-5天,ETL人力縮減了30%,同時指标複用率超過25%。
百勝中國:指标分析與管理應用提升數據決策效能
接下來再介紹來自于百勝中國的案例。百勝中國是全球性的餐飲集團,是零售餐飲行業的典型代表,肯德基、必勝客都屬于百勝中國下的品牌。随着百勝中國的快速發展,尤其互聯網業務的爆發式增長,整個公司的數據體量也在不斷增長。
為提升整體經營效率,百勝中國的各個部門包括區域級别、門店級别都産生了大量的數據分析需求和指标應用的需求,如銷售部門需要從地區、時間、金額、頻次等多個角度分析銷售訂單情況。如果每個指标都通過報表開發,整體的分析效率會非常低下。
百勝中國與 Kyligence 進行合作,并通過建設指标分析與管理應用體系,對以上諸多問題進行了改善。整體的數據準備時間降至30分鐘,相較之前用時縮短75%;OLAP性能大幅提升,500億+數據體量下平均響應時間僅4秒,90%的查詢用時在1秒以内。指标分析與管理應用體系的性能充分滿足包括集團、區域等各級數據分析師在内的數據消費者使用需求。
此外,這套指标分析與管理應用體系還保留了業務人員既有的數據分析習慣。過往百勝分析師習慣使用Excel,這套體系能在大數據體量下依然支持分析師使用Excel對接或進行自助式分析。
這些案例的背後,是包括 Kyligence指标中台引擎、産品、方法論在内的整套解決方案。一方面,Kyligence有企業級指标中台解決方案,以Kyligence的多維數據庫技術為核心底座,具備指标管理引擎,支持高性能的指标計算和查詢服務,為金融、零售、制造等企業提供端到端的解決方案,幫助企業簡化數據分析和指标管理。
另一方面,Kyligence也推出了名為Kyligence Zen的一站式指标中台産品。這是一個标準化的SaaS産品,支持企業将雲端的S3、CSV文件等常用數據源快速接入指标中台,通過指标目錄、指标自動化、目标管理、指标API、歸因分析、指标模闆等開箱即用的能力迅速從零開始搭建、實踐指标中台。
04 指标中台技術底座
企業業務增長帶來寬表爆炸問題
為什麼Kyligence的指标中台解決方案在技術上更有優勢?這主要是因為底層多維數據庫技術。舉個例子,Kyligence服務的一家互聯網行業電商客戶,這家電商企業從2019年下半年開始建設自己的數字化平台。如下圖所示,左側從數據庫、日志系統中抽取的數據進入數據倉庫。數據進入數據倉庫的貼源層後,經過加工一步步變成寬表、業務表。業務表包含了各種業務指标,如銷售相關的各種指标,客戶相關的各種指标,網絡流量、廣告相關的各種指标等,每個指标都是從貼源層原始數據一步步加工形成。每個業務表的背後都存在着大量的寬表。
這裡就會産生一個問題,指标數量的快速增長帶來了寬表爆炸。這也是多數企業在數據湖建設和數據倉庫建設過程中面臨的共性問題。Kyligence在服務這家電商客戶時看到,業務端的一個訂單表背後會産生1萬多張寬表。大量的寬表一方面快速消耗計算和存儲資源,另一方面寬表的ETL需要消耗大量的開發運維人力,帶來計算成本和人力成本的持續增長。
多維數據庫解決寬表爆炸問題
Kyligence多維數據庫能有效解決寬表爆炸問題。什麼是多維數據庫?多維數據庫來自于經典的OLAP Cube理論。經典的OLAP Cube 理論下,在三維的Cube 中,每個維度代表業務中的一個維度,每個格子代表一個維度下的度量。也可以換一個角度理解Cube,即Cube中的每個節點代表一個基礎指标,如任何一個時間、任何一個地區、某個商品品類的銷量對應的就是一個節點。在多維數據庫中,每個格子代表的基礎指标加上一些業務口徑,如時間段、地區等就可以構成豐富的業務指标體系。多維數據庫的核心在于它存儲的是維度和度量,而不是以表為核心去存儲數據。
此外,所有指标的生命周期也能被統一管理。而在關系型的數據庫中,不同的指标用不同的寬表進行存儲,生命周期難以實現統一管理。經常出現的情況是,寬表與寬表間的數據更新不同步,導緻指标的生命周期不一緻,最終出現數據信任問題。
多維數據庫基于空間換時間的思想,将指标預計算好并存儲在多維數據庫中,因此業務分析時具備高性能。此外,多維數據庫也更節省成本,相較于昂貴的計算資源,多維數據庫通過雲上存儲實現空間換時間,性價比更高。
那麼,多維數據庫是如何解決寬表爆炸問題的?回到電商客戶案例中,所有數據進入貼源層後都可以被多維數據庫進行統一管理。
數據如何實現統一管理?在多維數據庫中定義的多維數據模型、維度和指标,本質上是在貼源層的表上定義了統一的業務元數據。基于業務元數據,一方面能更好地管理底層數據,另一方面,可以賦予上層的業務用戶更好的數據消費能力。同時,包括數據分析師在内的業務用戶也能更加自主地基于多維數據庫中的基礎指标進行創新,創建更多的衍生指标。業務端的指标都是衍生指标,不會産生底層寬表,自然也不會帶來寬表爆炸問題。
怎麼理解這一點?這裡補充一點背景知識。基礎指标、衍生指标等概念來源于指标體系構建過程。最開始通過表進行初步計算如求和的指标是基礎指标,圍繞着基礎指标,通過口徑、時間、四則運算産生更多衍生指标、複合指标、時間衍生指标等概念。其中,隻有基礎指标是需要被預計算的,外圍的衍生指标、複合指标不需要。正是基于多維數據庫對指标體系的梳理,能有效減少寬表爆炸問題。而在關系型數據庫中,衍生指标或者複合指标都是通過寬表的方式創建的,會消耗更多IT成本。
再回到電商客戶案例中,一開始貼源層有5000多張表,通過多維數據庫定義出2000多個基礎指标,進而衍生出1萬多個衍生指标。其中5%的衍生指标可以基于基礎指标通過大規模并行處理在線計算得到;95%的指标已經完成了預計算。通過多維數據庫,數據人員可以更好地管理數據,業務人員也會更加自主地使用指标進行業務創新。
多維數據庫的Cube理論使整個寬表的數量大幅降低,充分預計算加少量在線計算的方式也能降低企業整體的TCO(計算總擁有成本),因此多維數據庫能更好地應對寬表爆炸挑戰。
通過以上介紹,可以證明多維數據庫确實是支撐指标中台的更好的技術底座。
今天的分享就是這些。歡迎大家來試用Kyligence指标中台技術,在kyligence.io網站上有兩個産品試用入口,一個是關于多維數據庫,一個是一站式指标中台産品。最後歡迎大家下載由愛分析和Kyligence聯合出品的《中國指标中台市場研究報告》。前面介紹的内容可能比較簡略,在這份報告中會有更加詳細的介紹,包括案例、指标體系構建方法論、指标中台落地方法論等。
有話要說...