明略數據創始人兼董事長吳明輝
從2015年開始,大數據就已經被移出了新興技術炒作曲線。而當2011年8月首次出現該曲線中,當時預計大數據技術需要2年到5年才能進入企業的實際生産型應用中。從那以後,大數據就迅速被熱炒。然而,就在2017年的今天,市場上依然看不到有效的商業模式。
根據國家信息中心《2017中國大數據發展報告》,2010年起開始大量湧現大數據創業公司,目前仍然呈現增長趨勢。但調查顯示,目前大多數創業公司仍處于天使輪和A輪階段,僅有13.04%的企業處于B輪,僅有8.94%的企業到達C輪及以後,這說明多數大數據企業仍處于發展初期。
2017年,曾經是大數據創業公司代表的成功IPO,但其市值遠低于之前的融資估值。除了基礎技術平台和技術服務以及營銷、客戶和企業運營優化等應用外,是否還存在其它更有效的大數據與行業應用相結合的路徑? 如何更有效地結合人工智能?2017年8月22日,即将宣布C輪的明略數據,作為一家中國大數據創業公司給出了自己的回答,這就是知識經濟。
企業級知識圖譜:一個獨特的大數據商業化方向
2014年創業的明略數據,以大數據為創業方向。2017年初,明略數據提出了“行業人工智能大腦”,到了8月22日即推出了包括了中國市場上首個企業級知識圖譜數據庫“蜂巢”和企業級人工智能統一入口“小明”為核心的行業人工智能大腦“明智系統”,并明确提出了把企業級知識經濟作為大數據與行業應用相結合的新方向。
以“明智系統”為代表,明略數據初步形成了包括數據處理、從數據治理到形成數據知識的知識圖譜引擎CONA、用于存儲的知識圖譜數據庫NEST(即蜂巢)、形成業務知識的行業大腦“明智”以及用于輸出知識的新一代企業級人機交互平台“小明”,由此形成了一個把知識經濟在企業級市場落地的大數據商業化模式。
之前,明略數據對外有MDP大數據處理和存儲平台、大數據分布式計算平台、SCOPA可視化大數據關聯關系挖掘應用平台即明略的上一代人機交互平台,而CONA和NEST都屬于隐藏在這三大平台下的支撐技術系統。随着“明智系統”的推出,明略數據原有的産品架構将全面融入“明智系統”, “小明”也将和SCOPA并行成為明略數據的新一代企業級人機交互平台。
所謂知識圖譜,可以理解為信息的結構,即用數據挖掘、信息處理、知識計量和可視化圖形顯示出來,揭示知識的動态發展規律。知識圖譜在互聯網領域最成功的商業模式就是搜索,此前谷歌的 Graph就構建了一個與搜索結果相關的知識體系,大幅提升了搜索的精準度。
明略數據創始人兼董事長吳明輝表示,把知識圖譜應用到企業級市場,是大數據與企業應用相結合的一個新路徑和新模式,有着巨大的商業價值。以前的企業信息化,是把企業流程結構化、電子化、自動化;而現在的智能化,則是把企業人員大腦中的知識提煉出來,形成企業及行業知識的結構化、電子化和自動化,這樣才能夠真正發揮大數據的價值。
大數據+人工智能=知識經濟大時代
1996年,聯合國經濟合作與發展組織在一份題為《以知識為基礎的經濟》的報告中,對“知識經濟”首次給予了明确的定義:“知識經濟是建立在知識和信息的生産、分配和使用之上的經濟。”一個區别于農業經濟、工業經濟的新經濟形态開始興起。
然而,直到近兩年來,随着雲計算、大數據和人工智能技術的全面成熟和相互融合,一個知識經濟的大時代才真正開始。以深度神經元網絡為代表的人工智能技術在2016年全面成熟,的、微軟的CNTK和DMTK、加州大學伯克利的Caffe等開源人工智能框架和算法軟件已經可以商用,各大公有雲廠商也推出了大規模的人工智能雲服務。
而深度神經元網絡的輸入數據,其本身就是帶标簽的數據信息,所謂“标簽”就是人工标注的知識分類,比如人工把一張圖标注為“花”,從而讓深度神經元網絡模型“認知”這張圖代表了“花”。換句話說,标注數據的過程本身就是信息的結構化與知識化,經過深度神經元網絡為代表的人工智能處理後就能形成可自動化輸出的知識體系以用于決策支持。
明略數據的MDP大數據處理與存儲平台,就能夠實現數據的智能化打标簽。MDP可實現數據資産管理、元數據管理、數據知識管理、數據質量管理等數據管理與數據治理功能,通過自動化、智能化的數據識别、分類、标簽技術,發現、還原、構建和管理數據的數據字典、數據特征、數據輪廓、數據關系、業務涵義等,從而更快、更好、更直觀的理解數據本質。
而明略數據的知識構建與管理平台通過規則和機器學習等手段,用大數據分布式挖掘技術,快速從信息中提取和構建知識,并對知識進行固化和管理。可快速應用人工智能技術構建業務模型,并在生産中快速部署和使用;同時提供規則、模型、工具等各種知識管理與分享功能,讓知識能夠在企業内部有效的積累和使用。
基于MDP、和SCOPA,明略數據在過去三年為公安、金融、工業等業務場景進行了數據治理,已經積累了幾百條業務規則,其中包括為泰康人壽實施的基于知識圖譜數據庫的壽險營銷分析平台、為某公安部門實施的基于知識圖譜的關聯關系研判實戰平台、為中國中車實施的關鍵設備狀态故障監測與自動分析等。
基于這些業務規則形成的知識圖譜,如今被用于金融、公安和工業等三大“行業大腦”,成為機器大腦中的知識庫,而自動化的知識體系通過人工智能交互接口“小明”輸出,就能形成撬動知識經濟的商業模式。
發現知識經濟的創業路:産品經理主導的進化
2014年創立的明略數據,其前身是秒針系統,是一家大數據營銷技術公司。2006年,吳明輝從北大計算機系碩士畢業後,帶着自己的大數據處理平台科研成果創立了北京秒針信息咨詢有限公司,“秒針系統”為核心産品。當年創立“秒針”主要是當時還沒有等開源大數據技術,而吳明輝當時的大數據處理技術在國内處于領先水平,“靠着技術吃飯就行了”。
2014年的時候,發生了斯諾登事件,讓吳明輝看到了曆史上難得的商業機遇。于是吳明輝決定把“秒針”積累的大數據技術拿出來産品化,做國産的數據技術平台,這就是MDP以及由此創立了明略數據。在2014年的時候已經出現了不少基于和Spark的大數據創業公司,把和Spark等開源大數據技術進行商業化。技術的同質化,讓吳明輝一邊創立明略數據,一邊思考未來的可持續競争力來自哪裡?
在推廣MDP的過程中,明略數據開始接觸各類客戶,包括最早的銀聯。2015年的時候開始接觸公安類客戶,才發現在公安業務場景裡真正把大數據用起來了,而且能創造很大的價值。而很多其它行業場景,雖然一上來就先建大數據平台,但建完了以後其實并不知道要做什麼。公安業務場景率先發揮了大數據的業務價值,這促使吳明輝思考今後的方向,“最終還是要與行業應用相結合”。
“明略數據今天做的數據結構化,其實就是在構建行業知識和知識圖譜。我們從最早做國産大數據技術平台,到後來開始思考數據的應用,最後找到了人工智能的方向,再通過人工智能走向知識經濟,這就是我們發展的路徑。”如今,明略數據正在構建各行業的知識圖譜建設,通過明略知識工程完成人工智能的可複制行業應用。
吳明輝表示,明略數據緻力于将人工智能應用到行業,提升行業知識轉化為企業競争力的效率,讓企業和組織在專業領域更高效。而明略知識工程,指的就是“明智系統”。明略數據近400位員工中,75% 左右為技術專家,核心團隊來自清華、北大等,他們正在一起創造知識經濟的未來。
“大數據産業在過去三年裡有很多創業公司都融錢了,但這一波有一點過火了。這個行業發展到今天,必須要把數據轉換成價值,才會持續的增長。不能創造價值的公司,最終都會倒掉。”吳明輝表示,“人工智能也是一樣,要把它真正的商業化。光靠VC打雞血是不行的,最終企業一定要有自己的造血能力。”
明略數據經過36個業務領域的探索,與688位客戶的深度接觸,将圖數據技術落地到行業應用中,構建了适合多維多層關系挖掘的企業數據架構,經過關系關聯挖掘找到業務規律,為決策者提供用于解決問題的結構化信息——知識。如今,通過公安、金融、工業與物聯網三大行業的客戶一同構建行業知識圖譜、開展決策智能自動化工程,明略數據找到了大數據落地的商業化新路徑。
吳明輝說他本來是一個科學家,在創業過程中逐漸轉型為産品經理,而明略數據今天的産品和産品方向就是産品經理思維主導的結果。“我是搞技術出身的,做企業以後就變成了産品經理了。我跟團隊一直在聊,不管是做ToC的業務還是ToB的業務,最本質的方向是什麼?就是思考客戶需要,做什麼樣的産品能夠産生和沉澱用戶價值,這是核心。”
“互聯網行業裡開源的越來越牛,單純做底層的引擎已經沒價值了。這時候就會發現,底層的引擎再加上行業理解,才有可能把數據價值發揮出來。”吳明輝說,“當開始思考行業理解的時候,一種打法是做每個行業的個性化解決方案,這個過程會發現又跟傳統企業級服務廠商一樣了。而我們是一個産品公司,一定要思考怎麼最有效率地提供服務,最後發現人工智能這樣的引擎,所有客戶業務一個引擎就能解決了。人工智能就像微信,一個應用就能集成所有的服務,而背後的引擎就是知識圖譜。”
從大數據創業到“行業大腦”的商業模式,明略數據找到了一條與衆不同的大數據和人工智能商業化路徑。而這個方向的選擇,也契合了全球即将進入知識經濟大周期的階段。這雖然是一種運氣,但與吳明輝十多年的技術堅持、從科學家轉向産品經理的勇氣、不斷探索商業化的決心等都密切相關。
接下來,明略數據還準備與更多的行業專家或團隊合作,甚至可以是資本層面的合作,共同推進“行業大腦”。由此,一個知識經濟的大時代,即将開始。(文/甯川)
有話要說...