Neo4j圖數(shù)據(jù)庫(kù)基礎(chǔ)
在這個(gè)三篇系列文章的***篇文章中,我們將學(xué)習(xí)圖數(shù)據(jù)庫(kù)(graph database)的基礎(chǔ)知識(shí),它支持了這地球上***的一些數(shù)據(jù)池。
對(duì)于海量的各種非結(jié)構(gòu)化信息來(lái)說(shuō),圖數(shù)據(jù)庫(kù)已經(jīng)成為幫助收集、管理和搜索大量數(shù)據(jù)的技術(shù)。在這三篇系列文章中,我們將使用開源圖數(shù)據(jù)庫(kù)軟件 Neo4j 來(lái)研究圖數(shù)據(jù)庫(kù)。
在本文中,我將向你展示圖數(shù)據(jù)庫(kù)的基礎(chǔ)知識(shí),幫助你快速了解概念模型。在第二篇中,我將向你展示如何啟動(dòng) Neo4j 數(shù)據(jù)庫(kù),并使用內(nèi)置的瀏覽器工具填充一些數(shù)據(jù)。而且,在本系列的***一篇文章中,我們將探討一些在開發(fā)工作中使用的 Neo4j 編程庫(kù)。
掌握?qǐng)D數(shù)據(jù)庫(kù)的概念模型是有用的,所以我們從那里開始。圖數(shù)據(jù)庫(kù)中只存儲(chǔ)兩種數(shù)據(jù):節(jié)點(diǎn)node和邊edge。
- 節(jié)點(diǎn)是實(shí)體:諸如人物、發(fā)票、電影、書籍或其他具體事物。這些有些等同于關(guān)系數(shù)據(jù)庫(kù)中的記錄或行。
- 邊名關(guān)系:連接節(jié)點(diǎn)的概念、事件或事物。在關(guān)系數(shù)據(jù)庫(kù)中,這些關(guān)系通常存儲(chǔ)在具有鏈接字段的數(shù)據(jù)庫(kù)行中。在圖數(shù)據(jù)庫(kù)中,它們本身就是有用的,是可以以其自己的權(quán)限搜索的對(duì)象。
節(jié)點(diǎn)和邊都可以擁有可搜索的屬性。例如,如果你的節(jié)點(diǎn)代表人,他們可能擁有名字、性別、出生日期、身高等屬性。而邊的屬性可能描述了兩個(gè)人之間的關(guān)系何時(shí)建立,見面的情況或關(guān)系的性質(zhì)。
這是一個(gè)幫助你可視化的圖表:
Graph database image 1
在這張圖中,你知道 Jane Doe 有一個(gè)新的丈夫 John;一個(gè)女兒(來(lái)自她以前的夫妻關(guān)系)Mary Smith 和朋友 Robert 和 Rhonda Roe。Roes 有一個(gè)兒子 Ryan,他正在與 Mary Smith 約會(huì)。
看看它怎么工作?每個(gè)節(jié)點(diǎn)代表一個(gè)獨(dú)立于其他節(jié)點(diǎn)的人。你需要找到關(guān)于那個(gè)人的一切都可以存儲(chǔ)在節(jié)點(diǎn)的屬性中。邊描述了人們之間的關(guān)系,這與你在程序中需要的一樣多。
關(guān)系是單向的,且不能是無(wú)向的,但這沒(méi)有問(wèn)題。由于數(shù)據(jù)庫(kù)可以以相同的速度遍歷兩個(gè)方向,并且方向可以忽略,你只需要定義一次此關(guān)系。如果你的程序需要定向關(guān)系,則可以自由使用它們,但如果雙向性是暗含的,則不需要。
另外需要注意的是,圖數(shù)據(jù)庫(kù)本質(zhì)上是無(wú) schema 的。這與關(guān)系數(shù)據(jù)庫(kù)不同,關(guān)系數(shù)據(jù)庫(kù)每行都有一組列表,并且添加新的字段會(huì)給開發(fā)和升級(jí)帶來(lái)很多工作。
每個(gè)節(jié)點(diǎn)都可以擁有一個(gè)標(biāo)簽label;對(duì)于大多數(shù)程序你需要“輸入”這個(gè)標(biāo)簽,是對(duì)典型的關(guān)系數(shù)據(jù)庫(kù)中的表名的模擬。標(biāo)簽可以讓你區(qū)分不同的節(jié)點(diǎn)類型。如果你需要添加新的標(biāo)簽或?qū)傩?,修改程序?lái)用它就行!
使用圖數(shù)據(jù)庫(kù),你可以直接開始使用新的屬性和標(biāo)簽,節(jié)點(diǎn)將在創(chuàng)建或編輯時(shí)獲取它們。不需要轉(zhuǎn)換東西;只需在你的代碼中使用它們即可。在這里的例子中,你可以看到,我們知道 Jane 和 Mary 最喜歡的顏色和 Mary 的出生日期,但是別人沒(méi)有(這些屬性)。這個(gè)系統(tǒng)不需要知道它;用戶可以在正常使用程序的過(guò)程中訪問(wèn)節(jié)點(diǎn)時(shí)為其添加信息(屬性)。
作為一名開發(fā)人員,這是一個(gè)有用的特性。你可以將新的標(biāo)簽或?qū)傩蕴砑拥接晒?jié)點(diǎn)處理的表單中并開始使用它,而不必進(jìn)行數(shù)據(jù)庫(kù) schema 的修改。對(duì)于沒(méi)有該屬性的節(jié)點(diǎn),將不顯示任何內(nèi)容。你可以使用任何一種類型的數(shù)據(jù)庫(kù)來(lái)為表單進(jìn)行編碼,但是你可以放下在關(guān)系型數(shù)據(jù)庫(kù)中要進(jìn)行的許多后端工作了。
讓我們添加一些新的信息:
Graph database image 2, defining a new type of node
這是一個(gè)新的節(jié)點(diǎn)類型,它代表一個(gè)位置,以及一些相關(guān)關(guān)系?,F(xiàn)在我們看到 John Doe 出生在加利福尼亞州的 Petaluma,而他的妻子 Jane 則出生在德克薩斯州的 Grand Prairie。 他們現(xiàn)在住在得克薩斯州的賽普拉斯,因?yàn)?Jane 在附近的休斯頓工作。Ryan Roe 缺乏城市關(guān)系對(duì)數(shù)據(jù)庫(kù)來(lái)說(shuō)沒(méi)有什么大不了的事情,我們不知道那些信息而已。當(dāng)用戶輸入更多數(shù)據(jù)時(shí),數(shù)據(jù)庫(kù)可以輕松獲取新數(shù)據(jù)并添加新數(shù)據(jù),并根據(jù)需要?jiǎng)?chuàng)建新的節(jié)點(diǎn)和關(guān)系。
了解節(jié)點(diǎn)和邊應(yīng)該足以讓你開始使用圖形數(shù)據(jù)庫(kù)。如果你像我一樣,已經(jīng)在考慮如何在一個(gè)圖中重組你的程序。在本系列的下一篇文章中,我將向你展示如何安裝 Neo4j、插入數(shù)據(jù),并進(jìn)行一些基本的搜索。


































