專訪陳應東︰所有信息化,都離不開數據庫
發布時間︰2020/4/7 來源︰時空雜志 閱讀︰17012
分享到︰

  作為中國最早一批研發空間數據庫的技術人員,陳應東認為,空間數據庫將在未來的5G、物聯網、人工智能的推動下迎來全新的發展機遇。采訪過程中,他提出的兩個比喻讓記者印象深刻,一是數據庫就像是硬件中的芯片,雖然處于底層但至關重要。二是數據庫就像是圖書館里的管理員,藏書再多也要能夠找得到才管用。

  本期《時空》對話北京博陽世通信息技術有限公司總經理陳應東,探尋作為數據時代底層基礎設施的數據庫,究竟在發揮著怎樣的作用?獨特的空間數據庫又在經歷著怎樣的轉變?

  《時空》︰博陽世通名字的由來?

  陳應東︰博陽是我們取自英文“Beyond”的諧音,寓意是通過我們的自主研發超越現有技術和產品。世通則是“世界通用”的簡寫,當時我們希望我們的數據庫能夠被所有人使用。兩個詞合起來,就是說我們想要做出讓全世界人都使用的,領先的數據庫,即博陽世通。

  《時空》︰能否簡單的解釋一下,數據庫、數據管理平台以及數據中心,這三者之間的區別和關系是什麼?

  陳應東︰數據庫本質上其實就是一種用于儲存數據的基礎性軟件。而數據管理平台,大家可以簡單理解為是在數據庫的基礎上加入了一些管理功能的軟件系統,更加方便用戶的使用。

  但數據中心和前兩者的定義就不太一樣了,一般我們將數據中心更多的定義成為是一個實體的事物,可以是一棟樓或者是一個機構或部門,但不是信息化和軟件的概念。

  在這我想舉個例子大家更容易理解。數據中心就好比是一座圖書館(沒有電腦),它既代表著一個實體建築,也代表了一個單位或者是一項業務。這座圖書館里的書架數量以及能夠存放書籍的空間,其實就相當于是現在我們用的機房和服務器,屬于硬件設施。

  而數據庫,其實就是傳統圖書館中的圖書管理員,他們負責把這些書籍(數據)分門別類的存放好,並且能夠整理成目錄方便以後及時找到。再說數據管理平台,則相當于是圖書館中設立的服務窗口,負責借閱、歸還等服務。

  其實用的還是管理員(數據庫),但是它又實現了一些除了儲存以外的其他功能,比如調取、錄入、管理等等。為的就是能夠讓不熟悉圖書館書籍存放方式(數據庫軟件)的人也能快速找到想要的書(數據)。

  《時空》︰作為這個領域的專家,您如何定義空間數據與空間數據庫?而空間數據庫與主流的數據庫究竟又有哪些區別?

  陳應東︰其實,隨著時代的發展大家對這些定義的理解也發生了很大變化。以前我們認為,空間數據實際上就是地理空間數據,講的就是通過測繪在地球表面所獲取的數據,經緯度坐標或者是帶坐標的影像。

  但現在普遍的共識是,只要是帶有空間屬性的數據,都可以認為是空間數據。這樣判斷的話,幾乎百分之百的數據都帶有一些時間或空間屬性。那麼,能夠對空間數據進行儲存和計算的數據庫,或者是以處理空間數據為主的數據庫,我們就會稱之為是空間數據庫。

  空間數據庫與主流數據庫最主要的區別,就體現在針對空間數據的存儲能力和計算能力上。就目前來講,空間數據庫在這兩方面佔有絕對的優勢。

  這主要源于空間數據庫內核算法中就支持對空間數據以及非結構類數據的運算處理,而大多數主流數據庫采用的是外部連接空間引擎的方式,這使得後者的流程繁復以至于效率明顯低于空間數據庫。

  這里也舉個例子,比如我想要調取某一時段在北京某個小區發生的交易數據。主流數據庫會通過空間引擎查詢所有數據的空間位置信息,計算是否匹配該小區的坐標範圍,然後找出坐標對應的數據。

  而空間數據庫,因為自身就支持空間分析能力,所以直接用該小區的空間範圍與數據庫中的數據做一個簡單的拓撲分析,即可快速找到被該小區覆蓋的所有數據點。兩者之前的底層算法可能是一樣的,但是對于空間的理解不同,所以體現在空間數據的處理能力上也就自然天差地別。

  《時空》︰空間數據庫與主流數據庫,未來兩者會以什麼樣的關系繼續發展?

  陳應東︰這其實是我們一直也在討論的一個問題,即空間數據庫以及數據庫未來會如何發展?數據庫技術從上世紀60年代誕生至今,發展出了包括關系數據庫、對象數據庫等多種類型,每一類數據庫也都有各自的優勢和不足。

  對于未來的數據庫形態,我個人比較傾向于相信它會向著高度融合的方向發展,無論是現在主流的關系型數據庫,還是空間數據庫,未來或許都會結合成一體、各取所長。因為我們認為,純粹一種數據庫是不可能滿足所有的需求的。所以將來的一個數據庫或者數據管理平台,可能會用到很多種數據庫,這其中自然也包括空間數據庫。

  《時空》︰目前看來,在整個空間信息產業鏈中數據庫只佔了很小的產值份額,您對這種情況怎麼看?您認為空間數據庫應該在這個產業中發揮什麼樣的作用?

  陳應東︰我個人認為,目前無論是在國內還是國外,數據庫的發展都還是非常健康的。數據庫的產值或者是市場規模,這跟它的自身定位與商業模式有關,但不能代表數據庫在整個信息時代的價值和重要性。

  我常用的一個比喻就是,數據庫在軟件中的地位,其實就相當于芯片在智能硬件中的地位。它直接關系到後端的軟件系統好不好用,以及整個信息化工作能否穩定安全的運行。

  所有的信息化軟件都離不開數據,所以,所有的信息化也都離不開數據庫。再細點說,現在我們經常講的大數據、雲計算、智慧城市、人工智能、物聯網,哪一項不跟數據有關。

  這些數據都不是寫著紙上記在腦子里的數據,而都是儲存在數據庫的數據,這樣才能夠被檢索、調取、分析。所以,所有的信息化工作,背後其實都有著數據庫的支撐。但它真正能賣多少錢,或許還真的不多,甚至會比芯片在硬件中的佔比還低,但它依舊不可或缺。

  《時空》︰作為數據庫廠商,如何打破數據庫的天花板?

  陳應東︰數據庫的商業模式存在很強的特殊性,特別是在國內。目前主要表現為兩點︰一是國外數據庫產品通過先發優勢造成了壟斷,二是用戶對數據庫的產品需求逐漸轉化為服務需求。

  像Oracle、SQL Serve、DB2這樣的老牌數據庫產品,由于推出時間早,打下了堅實的用戶基礎,甚至在一定程度上成為了行業的標準。就像Windows系統在PC領域的地位一樣,後來者很難超越,所以這也就是國內數據庫廠商難做的主要原因。

  其次,因為數據庫這個東西它不能直接產生信息化結果的,本質上它是一個配套性的、基礎性的軟件。所以,現在的用戶對數據庫產品的需求越來越弱,反之則對服務的需求逐漸增強。

  以博陽世通近兩年的銷售情況為例,單純通過銷售數據庫產品獲得的收入,佔總體的比重已經非常小了,反倒是通過承接整體的信息化項目的營收也快速增長。

  如今市面上也很少能夠見到某一家企業或者是政府單位單獨采購一套數據庫,基本上都是一整套信息化項目的招標。所以對于數據庫廠商來說,以數據庫當作基礎,逐漸將業務延伸至應用前端,或許會是打破企業天花板的重要方式之一。

  《時空》︰AI、大數據分析大行其道的今天,空間數據庫的發展趨勢有哪些?博陽世通又為此做了哪些準備?

  陳應東︰未來,5G時代以及物聯網時代的到來,會使得AI和大數據分析越來越普及。與此同時,可預料的是需要儲存和處理的數據量會急劇增加,對于數據庫的需求和要求也會再提升一個量級,我們也面臨著相應的機遇與挑戰。

  其中挑戰主要是對于數據庫自身技術的要求,這方面博陽世通自2010年成立以來一直堅持自主研發,積累了許多的技術經驗,也為應對海量數據的精細化處理做好了充足的準備。而在我看來,未來的5G時代對于我們來說可能是機遇大于挑戰,機遇就在于我們掌握著對于空間數據處理的優勢。

  在現在的這個數據體量下,很多時候空間計算的能力還顯現不出來。但當5G、物聯網這個時代真正到來的時候,數據中空間屬性的重要性就會越來越高,對于空間數據處理能力的需求也會越來越大。屆時,具備強大空間數據處理能力的數據庫產品的價值就會顯現,而忽視這方面能力和積累不足的數據庫產品一定會死掉,這就是大勢所趨。

  當然,已經有很多人意識到空間數據的重要性,比如阿里巴巴和京東,他們都已經在自己的數據庫中加入了空間分析的模塊,並且在基礎架構設計中就已經開始重視空間屬性的作用。

  所以,對于空間數據的處理能力,一定將會幫助博陽世通在未來的時代佔據一席之地,我們也在期待著那個時代盡快到來。

majong | 下一页