siemens x
大數(shù)據(jù)

知識(shí)圖譜如何為數(shù)據(jù)分析帶來(lái)變革?

2025China.cn   2022年02月11日

  數(shù)據(jù)大爆炸時(shí)代,企業(yè)面臨著全面數(shù)字化轉(zhuǎn)型的挑戰(zhàn)。如何挖掘數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián),并將這些洞察應(yīng)用于關(guān)鍵業(yè)務(wù)決策,驅(qū)動(dòng)從數(shù)據(jù)分析到數(shù)據(jù)智能的轉(zhuǎn)化成為關(guān)鍵。

  作為高級(jí)數(shù)據(jù)科學(xué)的一大趨勢(shì),知識(shí)圖譜的應(yīng)用已經(jīng)滲透到不同領(lǐng)域的各個(gè)細(xì)分行業(yè)。根據(jù)Neo4j一項(xiàng)針對(duì)100名企業(yè)高管的相關(guān)調(diào)查揭示,88%的企業(yè)管理者已經(jīng)認(rèn)識(shí)到知識(shí)圖譜的價(jià)值,認(rèn)為知識(shí)圖譜可以幫助跨越管理和數(shù)據(jù)治理的瓶頸,在彌合數(shù)據(jù)孤島,改進(jìn)AI或者機(jī)器學(xué)習(xí),以及協(xié)助開(kāi)辟新收入來(lái)源等方面發(fā)揮重要作用。

  什么是知識(shí)圖譜?阿蘭·圖靈研究所(Alan Turing Institute)將知識(shí)圖譜定義為“對(duì)知識(shí)進(jìn)行編碼以在開(kāi)放、不斷發(fā)展、去中心化系統(tǒng)中大規(guī)模使用”的最佳方式。簡(jiǎn)而言之,知識(shí)圖譜是具有豐富含義、相互關(guān)聯(lián)的數(shù)據(jù)集。企業(yè)可以針對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行推理,并且自信地將其用于復(fù)雜的分析和決策中。

Neo4j高級(jí)產(chǎn)品市場(chǎng)總監(jiān)Maya Natarajan博士

  Neo4j知識(shí)圖譜包含數(shù)據(jù)、顯示動(dòng)態(tài)內(nèi)容的圖數(shù)據(jù)及語(yǔ)義在內(nèi)的三大要素。與關(guān)系型數(shù)據(jù)庫(kù)的平面結(jié)構(gòu)不同,當(dāng)數(shù)據(jù)被抽取到Neo4j動(dòng)態(tài)圖結(jié)構(gòu)中存儲(chǔ)時(shí),節(jié)點(diǎn)和節(jié)點(diǎn)之間的關(guān)系就被添加進(jìn)來(lái),為數(shù)據(jù)提供了動(dòng)態(tài)的內(nèi)容,即第一層上下文關(guān)系。而隨著信息不斷豐富,圖也會(huì)不斷增長(zhǎng)。在圖中獲取數(shù)據(jù)并為它添加語(yǔ)義,就獲得一個(gè)知識(shí)圖。語(yǔ)義為圖添加了第二層上下文關(guān)系,圖譜就具備了深入動(dòng)態(tài)的上下文關(guān)系。通過(guò)這個(gè)步驟將智能引入到數(shù)據(jù)當(dāng)中,便于系統(tǒng)或者客戶從中推斷出不同的含義。

  根據(jù)數(shù)據(jù)范圍,Neo4j知識(shí)圖譜的應(yīng)用范疇劃分為數(shù)據(jù)管理和數(shù)據(jù)分析。數(shù)據(jù)管理包括匯集、校驗(yàn)、治理和探索數(shù)據(jù)。而數(shù)據(jù)分析側(cè)重推理、預(yù)測(cè)判定。相對(duì)應(yīng)的,Neo4j提供行為圖和決策圖兩種類型的知識(shí)圖譜,協(xié)助客戶從行為知識(shí)圖譜過(guò)渡到?jīng)Q策知識(shí)圖譜,實(shí)現(xiàn)數(shù)據(jù)分析到數(shù)據(jù)智能,完成數(shù)據(jù)創(chuàng)新。

  行為知識(shí)圖譜

  行為知識(shí)圖譜是以數(shù)據(jù)管理為核心的知識(shí)圖譜,其主要目的是提供數(shù)據(jù)保障,并通過(guò)數(shù)據(jù)洞察來(lái)推動(dòng)決策行動(dòng)。數(shù)據(jù)保障側(cè)重把不同數(shù)據(jù)源的數(shù)據(jù)聚合在一起,進(jìn)行數(shù)據(jù)交叉驗(yàn)證從而產(chǎn)生洞察。而數(shù)據(jù)治理包括如何溯源數(shù)據(jù)目錄和結(jié)構(gòu),數(shù)據(jù)是否存在血緣關(guān)系以及是否合規(guī),以甄別存在的風(fēng)險(xiǎn)。數(shù)據(jù)洞察超越了信息存儲(chǔ)的可見(jiàn)性,專注于新知識(shí)的探索、演繹和推理。

  行為知識(shí)圖譜常見(jiàn)的用例包括耳熟能詳?shù)目蛻?60和患者360、產(chǎn)品360、供應(yīng)鏈360等在內(nèi)的X360系列,以及金融行業(yè)身份驗(yàn)證,訪問(wèn)管理,欺詐、反洗錢的根本原因分析以及改善建議等。Neo4j行為知識(shí)圖譜幫助客戶更加深入了解并精準(zhǔn)地劃分用戶,以提供個(gè)性化的服務(wù)。

  決策知識(shí)圖譜

  決策知識(shí)圖譜側(cè)重于數(shù)據(jù)分析和預(yù)測(cè)、判定,提供基于圖的分析和基于圖的機(jī)器學(xué)習(xí)。數(shù)據(jù)分析添加不同的語(yǔ)義,幫助客戶從更深層次理解數(shù)據(jù),從而改進(jìn)決策系統(tǒng)并采取最佳的措施。

  決策知識(shí)圖譜的主要用例包括流失分析、欺詐分析、風(fēng)險(xiǎn)分析、假設(shè)分析和影響分析以及實(shí)體解析和知識(shí)圖譜補(bǔ)全和預(yù)測(cè)模型等。由于數(shù)據(jù)是一個(gè)連續(xù)的圖譜,Neo4j客戶典型的數(shù)據(jù)圖都是從行為知識(shí)圖譜開(kāi)始,進(jìn)而演進(jìn)到?jīng)Q策知識(shí)圖譜。從數(shù)據(jù)洞察到數(shù)據(jù)分析,最后到基于圖的機(jī)器學(xué)習(xí)。以金融行業(yè)反欺詐為例,欺詐識(shí)別是一個(gè)數(shù)據(jù)洞察用例,Neo4j添加了很多圖算法開(kāi)展檢測(cè)并且進(jìn)行不同類型的分類和標(biāo)記。這些算法允許檢測(cè)不同的欺詐模式,同時(shí)通過(guò)算法來(lái)提取圖特征進(jìn)行訓(xùn)練,通過(guò)機(jī)器學(xué)習(xí)來(lái)實(shí)現(xiàn)建模,預(yù)測(cè)欺詐。

  知識(shí)圖譜如何助力企業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型?

  Neo4j知識(shí)圖譜解決方案是一個(gè)知識(shí)圖譜平臺(tái),建立在豐富的產(chǎn)品基礎(chǔ)上,包括負(fù)責(zé)數(shù)據(jù)存儲(chǔ)的Neo4j圖數(shù)據(jù)庫(kù),幫助建模的知識(shí)圖譜工作臺(tái),致力數(shù)據(jù)分析的圖數(shù)據(jù)科學(xué) (GDS) 以及數(shù)據(jù)可視化工具Neo4j Bloom。

  每個(gè)企業(yè)或組織都有大量各自為政的數(shù)據(jù),數(shù)據(jù)孤島其實(shí)不是一件壞事,由于每個(gè)數(shù)據(jù)孤島都較小,用戶可以方便地對(duì)其進(jìn)行數(shù)據(jù)維護(hù)和控制,并制定政策。但另一方面,數(shù)據(jù)孤島會(huì)降低數(shù)據(jù)質(zhì)量、分析速度和報(bào)告的準(zhǔn)確性。Neo4j為知識(shí)圖譜添加各種關(guān)聯(lián)以及豐富的上下文關(guān)系,將數(shù)據(jù)孤島串聯(lián)起來(lái),提供一個(gè)完整可見(jiàn)的數(shù)據(jù)查詢視圖?;诓樵円晥D,過(guò)渡到更深入的數(shù)據(jù)聯(lián)邦,獲得更加豐富的內(nèi)容。在這個(gè)過(guò)程當(dāng)中,知識(shí)圖譜描述了整個(gè)結(jié)構(gòu)中各個(gè)數(shù)據(jù)源之間的關(guān)聯(lián)關(guān)系,并添加了上下文,提供數(shù)據(jù)的上下文智能。

  企業(yè)管理者越來(lái)越將數(shù)據(jù)視為商業(yè)的重要資產(chǎn),這意味他們現(xiàn)在更加關(guān)注怎樣獲取數(shù)據(jù)洞察力、改善決策制定、提高業(yè)務(wù)績(jī)效。為了確保從數(shù)據(jù)中獲得最大的價(jià)值,管理者會(huì)關(guān)注三個(gè)主要領(lǐng)域:側(cè)重?cái)?shù)據(jù)管理和數(shù)據(jù)治理的業(yè)務(wù)大師、專注數(shù)據(jù)分析和機(jī)器學(xué)習(xí)及人工智能的分析師、數(shù)據(jù)創(chuàng)新者。知識(shí)圖譜將幫助企業(yè)在不改變現(xiàn)有數(shù)據(jù)格局和基礎(chǔ)設(shè)施的前提下進(jìn)行數(shù)據(jù)編排和自動(dòng)化,為管理者提供一個(gè)連續(xù)觀察層,優(yōu)化數(shù)據(jù)管理、數(shù)據(jù)預(yù)測(cè)和數(shù)據(jù)創(chuàng)新,加速企業(yè)數(shù)字化轉(zhuǎn)型。

  作為圖數(shù)據(jù)平臺(tái)的領(lǐng)導(dǎo)者,Neo4j所有的圖數(shù)據(jù)科學(xué)項(xiàng)目都始于知識(shí)圖譜,其67%的客戶已經(jīng)成功地實(shí)施了知識(shí)圖譜,包括美國(guó)航空航天局(NASA)、易貝(eBay),UBS,思科(Cisco),卡特彼勒公司(Caterpillar)以及阿斯利康(AstraZeneca)等。

  作者:Neo4j高級(jí)產(chǎn)品市場(chǎng)總監(jiān)Maya Natarajan博士

(轉(zhuǎn)載)

標(biāo)簽:Neo4j 知識(shí)圖譜 我要反饋 
2024世界人工智能大會(huì)專題
即刻點(diǎn)擊并下載ABB資料,好禮贏不停~
優(yōu)傲機(jī)器人下載中心
西克
2024全景工博會(huì)
專題報(bào)道
2024 工博會(huì) | 直播探館 · 全景解讀
2024 工博會(huì) | 直播探館 · 全景解讀

第二十四屆中國(guó)工博會(huì)于9月24日至28日在國(guó)家會(huì)展中心(上海)舉行,展會(huì)以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]

2024世界人工智能大會(huì)
2024世界人工智能大會(huì)

WAIC 2024將于7月在上海舉行,論壇時(shí)間7月4日-6日,展覽時(shí)間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會(huì)專題
2024漢諾威工業(yè)博覽會(huì)專題

2024 漢諾威工業(yè)博覽會(huì)將于4月22 - 26日在德國(guó)漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會(huì),本屆展覽會(huì)... [更多]