日前,啟明創(chuàng)投投資企業(yè)、圖數(shù)據(jù)庫(kù)企業(yè)TigerGraph宣布將在二季度推出其最新版本TigerGraph 2.4。這項(xiàng)新技術(shù)將圖模式匹配與實(shí)時(shí)深度鏈接分析相結(jié)合,這一組合特別適用于欺詐與洗錢(qián)檢測(cè)、安全分析、個(gè)性化推薦引擎、人工智能和機(jī)器學(xué)習(xí)等。這一新版本的發(fā)布,將使得企業(yè)可以輕松通過(guò)圖計(jì)算洞悉深度鏈接的數(shù)據(jù)價(jià)值。
TigerGraph由創(chuàng)始人兼CEO許昱博士在2012年創(chuàng)立,總部位于硅谷紅木城。
圖分析是一種分析技術(shù),能夠方便地處理和探索組織、人員和交易等感興趣的實(shí)體之間的關(guān)系。Gartner發(fā)布了研究報(bào)告稱(chēng),到2022年,圖分析處理和圖數(shù)據(jù)庫(kù)的應(yīng)用將以每年100%的增長(zhǎng)率增長(zhǎng)。據(jù)了解,百度、阿里等也在去年推出了自己的圖數(shù)據(jù)庫(kù)。
許昱向21世紀(jì)經(jīng)濟(jì)報(bào)道記者解釋稱(chēng):“很多人聽(tīng)說(shuō)圖數(shù)據(jù)庫(kù)以為是存照片的,人工智能當(dāng)中現(xiàn)在分很多領(lǐng)域,比較熱的比如圖像識(shí)別、人臉識(shí)別,這個(gè)圖是圖片的圖。我們是把數(shù)據(jù)存成圖,就像現(xiàn)在看到的網(wǎng)狀結(jié)構(gòu)一樣,讓數(shù)據(jù)科學(xué)家、開(kāi)發(fā)者、商業(yè)用戶(hù)有能力把復(fù)雜數(shù)據(jù)關(guān)聯(lián)起來(lái),從關(guān)聯(lián)的數(shù)據(jù)中獲得深度的洞察力。”
圖可以把企業(yè)的所有數(shù)據(jù),如歷史數(shù)據(jù)或客戶(hù)信賴(lài)的數(shù)據(jù)全部綜合起來(lái),基于這個(gè)關(guān)聯(lián)的圖做各種各樣新的應(yīng)用。這個(gè)圖也屬于人工智能里面機(jī)器學(xué)習(xí)和數(shù)據(jù)分析這一塊,而且圖和機(jī)器學(xué)習(xí)以及AI是天然的互補(bǔ)的關(guān)系。
傳統(tǒng)的分析基于表狀的數(shù)據(jù)結(jié)構(gòu)做分析,圖分析是基于網(wǎng)圖狀的數(shù)據(jù)結(jié)構(gòu)做分析。
例如,銀行放貸時(shí),可以根據(jù)用戶(hù)關(guān)聯(lián)的電話號(hào)碼、通訊錄成員的貸款行為、過(guò)往記錄、黑白名單等信息通過(guò)機(jī)器學(xué)習(xí)來(lái)實(shí)時(shí)計(jì)算出放貸風(fēng)險(xiǎn);再如反洗錢(qián),基于圖數(shù)據(jù)庫(kù),通過(guò)環(huán)形算法,從可疑轉(zhuǎn)賬記錄出發(fā),往上游和下游兩個(gè)方面進(jìn)行探索,就可以發(fā)現(xiàn)資金來(lái)源賬戶(hù)和資金目的賬戶(hù),這些數(shù)據(jù)關(guān)聯(lián)可能有10層或者幾十層,而圖數(shù)據(jù)庫(kù)可以實(shí)現(xiàn)傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)做不到的查詢(xún)。
許昱以美國(guó)大型制藥公司舉例稱(chēng),其制藥成本很高,研究超過(guò)10億美元,在新藥出來(lái)后,則需要考慮向哪些醫(yī)院、醫(yī)生、病人推薦這個(gè)藥,這樣實(shí)現(xiàn)其最大化的優(yōu)化自己的營(yíng)銷(xiāo)成本?!斑@種推薦行為就是一種圖分析,就是一種社交圖譜或者影響力分析,通過(guò)這個(gè)圖的查詢(xún)和分析,我有哪些病人群,哪些醫(yī)生群,哪些人的影響力比較大,我首先針對(duì)他們?nèi)プ鰻I(yíng)銷(xiāo),銷(xiāo)售人員應(yīng)該直接去拜訪他們,有時(shí)間先拜訪他們,沒(méi)有時(shí)間就不用去別的地方了?!?/p>
實(shí)際上,隨著人工智能技術(shù)的發(fā)展,市場(chǎng)對(duì)于性能的要求越來(lái)越高,但僅僅依靠硬件的升級(jí)已經(jīng)無(wú)法完全滿(mǎn)足使用者的需求,配套的軟件產(chǎn)品如果跟不上發(fā)展,效率也無(wú)法達(dá)到要求。
“圖數(shù)據(jù)庫(kù)的性能使得其非常受研究人員的青睞。大數(shù)據(jù)時(shí)代,數(shù)據(jù)量非常大,大家收集的數(shù)據(jù)非常多,但拿到數(shù)據(jù)不代表能利用數(shù)據(jù),真正利用數(shù)據(jù)是獲取現(xiàn)有數(shù)據(jù)中分析產(chǎn)生業(yè)務(wù)價(jià)值。研發(fā)人員現(xiàn)在轉(zhuǎn)向圖數(shù)據(jù)庫(kù)很大的原因是,其擁有大數(shù)據(jù)平臺(tái),但是查詢(xún)很慢。而圖可以更好地關(guān)注對(duì)象和對(duì)象之間的關(guān)系的,當(dāng)你去做深度查詢(xún)的時(shí)候,它就會(huì)帶來(lái)一個(gè)特別大的優(yōu)勢(shì)。” 許昱舉例說(shuō)。
不過(guò),Gartner也指出,圖數(shù)據(jù)存儲(chǔ)可以跨越數(shù)據(jù)孤島、并有效地建模、探索和查詢(xún)數(shù)據(jù),但是目前擁有相關(guān)專(zhuān)業(yè)技能人才缺乏限制了其采用。
許昱坦言,圖數(shù)據(jù)庫(kù)現(xiàn)在是在加速發(fā)展中,但仍然面臨挑戰(zhàn),因?yàn)檫@個(gè)技術(shù)還是稍微有點(diǎn)新,尤其在中國(guó),需要培養(yǎng)一些人才?!敖鹑谛袠I(yè)是這種技術(shù)人才儲(chǔ)備比較多的行業(yè),但更多的機(jī)構(gòu)和企業(yè)可能技術(shù)人才儲(chǔ)備沒(méi)那么多。我們將會(huì)做在線和離線的各種教育培訓(xùn),制定并推出一套認(rèn)證系統(tǒng),包括在線考試、培訓(xùn)、認(rèn)證一級(jí)、二級(jí)、三級(jí)管理等。”
TigerGraph 中國(guó)區(qū)總經(jīng)理烏明捷認(rèn)為,中國(guó)是一個(gè)非常大而且特別的市場(chǎng),同時(shí)也向21世紀(jì)經(jīng)濟(jì)報(bào)道記者指出,在中國(guó)的挑戰(zhàn)也巨大,如在美國(guó)或者歐洲圖數(shù)據(jù)庫(kù)的使用基礎(chǔ),包括數(shù)據(jù)科學(xué)家的基礎(chǔ),以及客戶(hù)自己對(duì)數(shù)據(jù)和業(yè)務(wù)的分析能力比較強(qiáng)。而中國(guó)可能在這個(gè)方面,還在成長(zhǎng)的過(guò)程中。
來(lái)源 | 21世紀(jì)經(jīng)濟(jì)報(bào)道
作者 | 朱萍
編輯 | 黃鍇