從數據到大模型應用,11 月 25 日,杭州源創會,共享開發小技巧
自從今年初 ChatGPT 橫空出世并風靡全球之后,我們也迎來了一個并不陌生的名詞:LLM,即大語言模型。隨后,眾多與 LLM 相關的項目如火如荼,這項新技術點燃了人們對科技未來的無限想象。
半年過去了,人們開始冷靜地審視 LLM,思考它到底能為我們帶來怎樣的實際效益。與此同時,在過去的半年里,圖數據庫 NebulaGraph 研發人員也在探索這個問題,他們結合圖技術和知識圖譜,進行了自己的研究和嘗試。
OSCHINA 本期高手問答 (9 月 6 日 - 9 月 12 日) 我們請來了@wey 和 @xctylist 與大家一起討論 LLM 到底能為廣大圖技術從業者帶來什么。
大家可以從"LLM + 圖數據庫"、"LLM + 知識圖譜"等方向提出問題。除了以上提問范圍,你還可以擴展討論的范圍,涵蓋圖數據庫、LLM 相關領域的內容,包括 LLM 的應用、圖的應用場景等等:
* LLM 和知識圖譜的結合應用
* 快速上手使用 LLM
* 利用 LLM 生成圖查詢語句
* ...
* 圖數據庫:一種專門用于存儲和查詢圖數據的數據庫系統。它們被設計用于處理大規模的圖結構數據,提供高效的圖遍歷和復雜的圖查詢功能。圖數據庫能夠有效地存儲和處理知識圖譜數據,并支持復雜的查詢和推理操作。
* 知識圖譜:一個結構化的知識表示形式,用于存儲和組織實體、屬性和它們之間的關系。它以圖的形式呈現,其中實體表示為節點,關系表示為邊。知識圖譜旨在捕捉世界的語義關系,并提供一種有效的方式來查詢和推理關于實體之間關系的知識。
嘉賓介紹:
* 古思為:NebulaGraph 布道師,他是首個在 LlamaIndex 社區提出 Graph + RAG 概念的人;
* 程訓燾:NebulaGraph 核心開發者,從事圖數據庫的開發工作,目前致力于更好地將圖數據庫與 LLM 結合。



OSChina 高手問答一貫的風格,不歡迎任何與主題無關的討論和噴子。
下面歡迎大家就“LLM + 圖數據庫、LLM + 知識圖譜”相關問題向 古思為、程訓燾老師 提問,直接回帖提問既可。
高手問答第 306 期 —— 聊聊 LLM 與知識圖譜、圖數據庫的關系
@拉褲兜兜子 @南小山程序員 @八一菜刀 @Elven_Xu @夢夢閣
恭喜以上5位網友分別獲得禮盒 3 件套一套。
請于2023年9月21日前登陸賬號, 私信 @小白兔愛吃大灰狼 告知快遞信息(格式:姓名+電話+地址),過期視為自動放棄哦~
@NebulaGraph 你好,現在LLM很火,我理解的LLM他其實是基于已有的知識、數據,匯聚起來可以給你一些非創造性的答案、建議,例如你無法讓他去發現、創造未知的科學,不知道我的理解對不對。LLM其實未來可以代替一些重復性的人工客服工作以及提高一些工作效率,程序員可能不能完全代替,要是可以自己寫代碼、調試代碼、運行代碼那就真像黑客帝國里面的一樣了 ??
另外圖數據庫我之前接觸過neo4j,NebulaGraph相比而言有哪些優缺點呢?
@NebulaGraph 老師好,想請教學習下:1.大語言模型LLM是否可以協助提取分析數據關鍵信息生成圖數據嗎?怎么落地?2.圖數據庫和大數據框架計算引擎的結合,效率或者圖算法的優勢互補怎么更好發揮?
@NebulaGraph 你好,llm現在很火,可以部署一些在本地自己使用么,對電腦配置都有什么要求,有哪些類似于chatgpt 4的個人本地使用的開源免費項目推薦么?
@NebulaGraph
你好,圖數據庫目前業界有沒有將其應用到CAE領域,能否舉幾個案例???
謝謝!
@NebulaGraph您好,LLM能應運在短文本分類識別判斷?有沒有什么實際的案例?
@NebulaGraph
老師們好,請問大語言模型LLM和知識圖譜的相關性或者相似性是怎樣的呢?感覺二者有很多相似的地方,如:知識圖譜旨在捕捉世界的語義關系,并提供一種有效的方式來查詢和推理關于實體之間關系的知識,而大語言模型很大程度上也是一種語義關系、語義理解的作用。二者的共同點和最大的區別點又在什么地方呢?
@NebulaGraph 老師好,我想自己學習并且實踐一下這個領域,可否推薦一些入門資料和書籍,還有電腦配置也麻煩推薦一下,謝謝!
@NebulaGraph 圖數據庫幾年前我在做AI Music APP的時候用到過,但是我發現,對于尋求極致性能和效率,市面上的圖數據庫都是有些瓶頸的,往往需要投入大量資源,或者用戶忍受響應延遲;我們該怎么處理對于圖數據庫方面投入成本和收益的沖突呢?
@NebulaGraph 老師好,在圖數據庫中,關系、節點、屬性等數據體現,應用層獲取數據時主要通過cql語句獲取,那么在和LLM大模型結合過程中,請問該如何結合呢?比如針對搜索場景,將用戶的輸入通過NLP轉化為CQL語句的話,這個范圍好像太廣了(用戶輸入千奇百怪),無法聚焦,有什么好的處理經驗嗎?