新用戶登錄后自動創建賬號
登錄SDCC 2015將于2015年11月19-21日在北京.朗麗姿西山花園酒店召開,柏睿數據董事長兼CTO劉睿民在數據庫實戰論壇上帶來《RapidsDB海量并行SQL在大數據深度學習中的運用》的主題演講。一個雨過的午后,風輕云淡,記者在望京SOHO的辦公室采訪了柏睿數據科技有限公司董事長兼CTO劉睿民。
數據庫的故事
時代的變遷,科技的進步改變了我們的生活方式及思維方式,同樣也改變了某個行業。劉睿民告訴記者,回顧過去30多年,整個數據庫行業沒有太大的變化,那時人們還使用諾基亞手機編輯短信,聽著磁帶隨身聽(Walkman)……現在一切都變了,變成數字化的東西?!叭藗兟犑裁礃拥囊魳?,在哪里聽,何時聽?”這背后隱藏著可以量化的數據,如果通過精準地計算,便可以得出上述問題的答案。
事實上,數據庫行業是一個基礎行業,同時也是一個高門檻的行業?!皵祿炜床灰?,摸不著,我們可以將它比作Excel表格。在我們制造的數據庫中,一張表可存儲一千億條數據,數據庫可裝有幾萬張這樣的數據表。而且我們的數據庫產品一秒鐘能給20萬條不同的記錄打上標簽?!眲㈩C窠忉尩?。
當前有很多互聯網企業不斷地發展,但他們所做的只是一種應用,“應用終有一天會被替代”,到人人網偷菜已是逝去之事?,F在來看,互聯網金融很火,但它也只是一種應用。他認為,數據庫則不同,它是最基礎的東西,就像高樓大廈里的鋼筋,無可替代。所以說數據庫行業是一個基礎性行業。
在六七年前,無論是技術,還是人才方面,國外都已為數據庫行業的發展做好了鋪墊。盡管國內的數據庫行業起步較晚,劉睿民告訴記者,自90年代初他便開始從事相關工作,多年的經驗積累讓他對行業的發展及前景看得更為透徹?!斑@個行業需要很長時間的積累,入行的門檻高?!眲㈩C窀嬖V記者,在柏睿數據創立之前,他花費了三年的準備時間,其中包括尋找技術人才組建團隊??梢哉f,做基礎的人才很難找到?,F在公司的團隊里有劉睿民的導師和以前的同事,他們有的來自美國、澳洲、印度,也有國內的高端人才?!皩ξ覀儊碚f,未來在全球尋找有價值的人才,把他們聚在一起,在基礎方面做更扎實的工作,創造出更先進的數據庫,這才是最重要的?!?/p>
激增的數據量推動行業發展
近年來,隨著“互聯網+”的興起和影響,對數據庫行業來說,數據的增量比原來大很多。舉例來看,現在一個用戶每天會產生10TB的數據(1TB相當于1000GB),而過去用戶一年的增量數據也只有幾百GB?!半S著時代的發展,不難預料未來數據的量會有上千倍的增長,那么處理數據的方式也會發生變革?!?/p>
事實上,目前大量的增量數據是從手機端和其他智能終端中產生出來的,譬如汽車制造廠會使用智能終端來跟蹤車的運行狀態、物流狀態,包括在生產線上的狀態等,它是一個被互聯網化的應用。國家提出“中國制造2025”的戰略,正是針對制造業如何智能化、互聯網化而提出的。
過去我們認為數據庫中的數據先被存儲下來,然后在從盤中提出數據進行分析。隨著互聯網化和智能化的潮流下,這過程沒有必要存在。在很多情況下,我們是根據流動的、實時的數據進行計算和應用?!八?,今年11月,我們將推出一個新產品‘流數據庫’。目前這一數據庫產品是國內領先的,在國內尚無競爭對手?!眲㈩C褡孕诺卣f。
劉睿民認為,未來隨著數據增量的爆發,大家用到的可能是5G的網絡,用到的數據會更多,暢通的網絡會成為生活的一部分,當然也包括一些前沿的技術,如谷歌眼鏡等,都會逐漸地融入到人們的生活中。同時,未來5-6年,數據庫行業的變化也會非常迅速,數據量激增,數據處理的模式和以前會完全不同,而柏睿數據新推出“流數據庫”更多的是為物聯網做好準備。
數據庫的應用
正是由于數據庫屬于基礎行業,所以其應用范圍非常廣,如制造業、零售業、電信、電力、互聯網行業等。劉睿民表示,柏睿數據目前的客戶都是企業級用戶,比如在傳統企業中有 中國聯通 、諾基亞西門子、 萬達信息 等公司;而互聯網行業里面也有像多米音樂這類企業,他們現在都已經成為柏睿數據的客戶。
“很多案子都是有共性的”,比如柏睿數據之前與中國聯通合作的名為“用戶搜索的時空軌跡展現”的案例。舉例來說,有的客戶喜歡在互聯網上看新聞視頻,柏睿數據通過多個復雜、精確度高的公式,計算出客戶的喜好與某種東西的近似度?!拔覀儠_地計算出客戶在什么時間點,什么情景,在哪些因素的影響下客戶99%會點擊推送的視頻?!笔聦嵣?,這是一種構建在數據庫上的應用。中國聯通通過它可精準地向客戶推送流量等服務。
“后來我們發現,很多行業都有類似的需求,比如券商?!碑斎谭e累了大量的證券交易數據會在終端上沉淀下來。他們想知道怎樣才能避免客戶更換交易所,比如提供什么樣的資訊或服務能讓客戶愿意留下來。盡管通訊和證券是兩個風馬牛不相及的行業,但對于應用數據的需求都是相同的。
劉睿民表示,目前這種數據庫的應用仍在推廣階段,今后幾年柏睿數據會做更多類似的案例,也會與同行分享,讓大家知道如何更好地應用數據庫。對整個行業來說,也將起到一種促進作用。
俗話說:“打江山容易,守江山難”,企業如何才能可持續發展是企業家更為關注的事情。劉睿民表示,數據庫行業之于TMT整個大行業來說,就如同鋼鐵之于工業,屬于信息行業的基礎構架/支柱。無論是中國的新經濟還是全球未來的整體發展現在都處于數據大爆發的信息轉型期,這為數據庫行業也帶來了巨大的機遇和挑戰。
“我認為,基礎的東西,不會輕易垮掉。中國的IT企業享受了前兩輪信息革命的福利,這一次我們也勢必可以參與到其中去,從底層基礎開始參與全球大數據行業規則的制定。所以,我并不急于賺錢,而是希望在一個個案例把事情做好,基礎打牢。柏睿希望可以和同行一起,幫助基礎之上的應用企業更好地迎接一個全新的、真正意義上的大數據時代?!?/p>
“這不僅僅是利潤的問題,更多的是我們怎樣來順應一個由中國制造向中國智造技術轉變和崛起的趨勢,真正引領全球技術 潮流。只有這樣才可以持久領先、基業長青?!?/p>