ChatGPT 和其他類 GPT 的 AI 都是基于 GPT(Generative Pre-trained Transformer)架構的大型語言模型。它們是使用深度學習技術訓練的神經網絡,具有自然語言理解和生成的能力。 這些模型都是基于無監督學習的方式進行訓練的,利用大量的文本數據進行預訓練,并通過微調和遷移學習等技術來完成各種自然語言處理任務,如問答、對話生成、文本摘要、情感分析等。

加載中
置頂
發表了博客
昨天 10:15

Embedding技術與應用(4): Embedding應用工程探析

> 編者按:隨著互聯網內容數量的急劇增長,個性化推薦已成為各大科技公司的核心競爭力之一。那么,如何構建一個可靠、高效的基于嵌入技術的推薦系統,使其能夠在實際生產環境中正常運行呢?這是所有從業者都關心的問題。 > > 本文是Embedding技術與應用的最后一篇,探析 Embedding 應用工程的文章。作者認為,要讓一個推薦系統項目取得成功,不能僅僅停留在算法層面,更需要從工程實現的角度進行全面的考量和設計。 > > 文章詳細... 展開更多

收藏 0
0
置頂
發表了問答
11/17 14:31

高精度數字相關儀-手持測溫熱像儀

高精度數字相關儀LOKAL400 功能特點 時間域相關/評率域相關功能 漏水噪音自動跟蹤功能 (AFS漏水噪音自動搜索過濾) 可同時測量20段不同的管道材料 250段不同頻率濾波 測量精度高,適用于各種管道材料 多核CPU運算速度快,精度高 濾波器的自動和手動選擇 集相關儀/地面聽音/閥栓聽音于一體 圖形和數值顯示噪音數據 手持測溫熱像儀M600 產品介紹 M600手持紅外熱像儀是一款高分辨率手動對焦型熱成像測溫儀。內置艾睿光電12μm高性能... 展開更多

收藏 0
置頂
程序員
發表了博客
11/10 19:52

評估 RAG 的神器來啦!TruLens + Milvus=?

大型語言模型(LLM)的日益普及引爆了向量數據庫賽道,向量搜索技術也越發受到開發者關注。目前,主流的向量搜索技術提供者包括向量數據庫 Milvus 和 Zilliz Cloud,向量搜索庫 FAISS,以及與傳統數據庫集成的向量搜索插件。 與此同時,向量搜索日益成為檢索增強生成(retrieval augmented generation,RAG)中的一個重要組件。RAG([https://zilliz.com.cn/use-cases/llm-retrieval-augmented-generation](https://zilliz.com... 展開更多

收藏 0
0
置頂
程序員
發表了博客
11/15 16:35

OpenAI 上線新功能力捧 RAG,開發者真的不需要向量數據庫了?

近期, OpenAI 的開發者大會迅速成為各大媒體及開發者的熱議焦點,有人甚至發出疑問“向量數據庫是不是失寵了?” 這并非空穴來風。的確,OpenAI 在現場頻頻放出大招,宣布推出 GPT-4 Turbo 模型、全新 Assistants API 和一系列增強功能。其中,王炸功能 Assistants API 的內置工具支持了代碼解釋器、知識庫檢索以及函數調用,允許接入外部知識(文檔)、使用更長的提示和集成各種工具。它能夠幫助開發者分擔繁重的工作,并構建... 展開更多

收藏 1
0
置頂
發表了博客
11/14 16:04

CodeFuse開源ModelCache大模型語義緩存

CodeFuse 開源火熱進行中!本次開源的是 ModelCache 大模型語義緩存,可大幅降低大模型應用的推理成本,提升用戶體驗。 CodeFuse-ModelCache 項目地址: https://github.com/codefuse-ai/CodeFuse-ModelCache 0 背景 在LLM技術浪潮席卷全球的背景下,大型模型快速增長的參數規模,對部署所需的推理資源帶來了極大的挑戰。為了提高大型模型的推理性能和效率,我們嘗試從緩存角度解決當前大模型規?;詹渴鸬睦Ь?。類似傳統應用... 展開更多

收藏 2
0
置頂
程序員
發表了博客
11/09 13:29

如何選擇一個向量數據庫|Qdrant Cloud v.s. Zilliz Cloud

隨著向量數據庫的熱度不斷攀升,越來越多人開始關注到這一賽道,傳統數據庫和檢索系統也在快速集成專門的向量檢索插件方面展開角逐。Qdrant 因其易用性和用戶友好的開發者文檔,面世不久即獲得關注。 Qdrant 以 Rust 語言構建,提供 Rust、Python、Golang 等客戶端 API,能夠滿足當今主流開發人員的需求。不過, Qdrant 作為后起之秀,和其他競品仍然存在一定差距,例如界面及查詢功能不夠完善。 那么,Qdrant 和 Zilliz Cloud... 展開更多

收藏 0
0
置頂
程序員
發表了博客
11/07 15:17

在 LangChain 嘗試了 N 種可能后,我發現了分塊的奧義!

分塊(Chunking)是構建[檢索增強型生成(RAG)](https://zilliz.com.cn/use-cases/llm-retrieval-augmented-generation)應用程序中最具挑戰性的問題。分塊是指切分文本的過程,雖然聽起來非常簡單,但要處理的細節問題不少。根據文本內容的類型,需要采用不同的分塊策略。 在本教程中,我們將針對同一個文本采用不同的分塊策略,探索不同分塊策略的效果。[訪問鏈接](https://github.com/ytang07/llm-experimentation/blob/mai... 展開更多

收藏 1
0
置頂
程序員
發表了博客
11/03 18:18

從科幻走向現實,LLM Agent 做到哪一步了?

LLM 洪流滾滾,AI 浪潮席卷全球,在這不斷沖擊行業認知的一年中,Agent 以冉冉新星之態引起開發者側目。OpenAI 科學家 Andrej Karpathy 曾言“OpenAI 在大模型領域快人一步,但在 Agent 領域,卻是和大家處在同一起跑線上?!?在此背景下,AI 從業者堅信:基于 LLM 的 Agent 會是一個嶄新并且充滿著機會的藍海領域。 那么,究竟什么是 Agent?它的框架工作方式是什么?現階段存在哪些問題?未來有著怎樣的可能性?本文將分享一些... 展開更多

收藏 5
1
置頂
發表了博客
11/06 10:00

輕松理解 Transformers (3): Feed-Forward Layer部分

> 編者按:隨著人工智能技術的不斷發展Transformer架構已經成為了當今最為熱門的話題之一。前饋層作為Transformer架構中的重要組成部分,其作用和特點備受關注。本文通過淺顯易懂的語言和生活中的例子,幫助讀者逐步理解Transformers中的前饋層。 > > 本文是Transformers系列的第三篇。作者的觀點是:前饋層在Transformer架構中扮演著至關重要的角色,它能夠有效地提高計算效率,同時也是集體智慧的體現。 > > 文章作者首先介紹... 展開更多

收藏 3
0
置頂
程序員
發表了博客
11/02 17:26

接上回,如何用 LlamaIndex 搭建聊天機器人?

LlamaIndex 是領先的開源數據檢索框架,能夠在各種應用中發揮優勢,其中一個典型的應用就是在企業內部搭建聊天機器人。 對于企業而言,隨著文檔數量不斷增多,文檔管理會變得愈發困難。因此,許多企業會基于內部知識庫搭建聊天機器人。在搭建過程中,需要關注三個要點:如何切割數據、保存哪些元數據以及如何路由查詢。 ## 01.為什么要用 LlamaIndex 搭建聊天機器人? 在上一篇文章中,我們使用 Zilliz Cloud(全托管的 Milvus... 展開更多

收藏 0
0
置頂
程序員
發表了博客
10/31 15:48

用 Milvus 和 NVIDIA Merlin 搭建高效推薦系統

如何搭建一個高效的推薦系統? 簡單來說,現代推薦系統由訓練/推理流水線(pipeline)組成,涉及數據獲取、數據預處理、模型訓練和調整檢索、過濾、排名和評分相關的超參數等多個階段。走遍這些流程之后,推薦系統能夠給出高度個性化的推薦結果,從而提升產品的用戶體驗。 為了方便大家對此進行深入了解,我們邀請到 NVIDIA Merlin 團隊,他們將詳細介紹推薦系統的上述多個階段的工作流程,以及推薦系統在電商、流媒體、社交媒體... 展開更多

收藏 1
0
置頂
程序員
發表了博客
10/27 17:24

Hello, Vector DB | AIGC 時代,你需要一個真正的向量數據庫么?

AIGC 時代,開發者需要一個“真正的向量數據庫”嗎? 答案很簡單,這取決于開發者的應用場景。舉個例子,晚飯選擇去一家五星級餐廳用餐或是是快餐店,往往和你的胃口和期望有關。 如果只是想簡單解決一頓飯,一家快餐店就能滿足你。同理,如果想為自己的個人網站快速搭建一個問答機器人,或者為相冊里的十萬張照片建立一個索引,你可以選擇最熟悉和便捷的方法,無論是使用免費的向量檢索云服務,或者安裝基于 PostgreSQL 的開源... 展開更多

收藏 0
0
置頂
程序員
發表了博客
10/26 18:58

如何選擇向量數據庫|Weaviate Cloud v.s. Zilliz Cloud

隨著以 Milvus 為代表的向量數據庫在 AI 產業界越來越受歡迎,傳統數據庫和檢索系統也開始在快速集成專門的向量檢索插件方面展開角逐。 例如 Weaviate 推出開源向量數據庫,憑借其易用、開發者友好、上手快速、API 文檔齊全等特點脫穎而出。同樣,Zilliz Cloud/Milvus 向量數據庫因為能夠高性能、低時延處理海量數據而備受矚目。 二者都是專為向量數據打造,但適用于不同場景。Weaviate 更適合需要快速集成向量數據庫的開發人員... 展開更多

收藏 0
0
置頂
發表了博客
10/30 15:26

輕松理解 Transformers(2):Attention部分

> 編者按:隨著人工智能技術的不斷發展,Transformers 模型架構已成為自然語言處理領域的重要基石。然而,許多人對其內部工作機制仍然感到困惑。本文通過淺顯易懂的語言和生活中的例子,幫助讀者逐步理解 Transformers 中最核心的 Attention 機制。 > > 本文是Transformers系列的第二篇。作者的核心觀點是:Attention 機制是 Transformers 模型區分關鍵信息的關鍵所在。本文通過直觀的類比和數學公式,讓讀者對 Attention 的計算... 展開更多

收藏 3
0
置頂
程序員
發表了博客
10/25 17:32

Chat Towards Data Science|如何用個人數據知識庫構建 RAG 聊天機器人?(上)

生成式人工智能時代,開發者可以借助大語言模型(LLM)開發更智能的應用程序。然而,由于有限的知識,LLM 非常容易出現幻覺。檢索增強生成(RAG)[https://zilliz.com/use-cases/llm-retrieval-augmented-generation](https://zilliz.com/use-cases/llm-retrieval-augmented-generation) 通過為 LLM 補充外部知識,有效地解決了這一問題。 在 Chat Towards Data Science 博客系列中,我們將詳細介紹如何使用個人的數據知識庫構建... 展開更多

收藏 0
0
置頂
發表了博客
10/24 15:34

輕松理解 Transformers(1):Input部分

> 編者按:Transformers 是人工智能領域近年來最引人矚目的技術之一,它為語言生成模型的發展做出了巨大的貢獻。隨著大語言模型(LLM)的興起,公眾對其背后的技術原理也越來越感興趣。但是由于Transformers本身具有一定的復雜性,想要真正理解其中的原理并不容易。 > > 今天,我們開始為大家帶來了一系列以通俗易懂的語言解釋Transformers的好文章。作者Chen Margalit希望通過本系列文章,用最簡單的語言把Transformers的關鍵要... 展開更多

收藏 4
0
置頂
發表了博客
10/16 11:03

RAG (檢索增強生成)技術詳解:揭秘基于垂直領域專有數據的Chatbots是如何實現的

> 編者按:相信很多人都對Chatbots背后的技術原理很感興趣,其實Chatbots并非通過“魔法”與我們交流,而是依靠一種被稱為檢索增強生成(RAG)的技術。 > >文章詳細梳理了 RAG 技術的具體實現原理。首先,RAG 將用戶輸入的問題與知識庫中的私有數據進行匹配,獲取相關知識片段。然后,通過預訓練的大語言模型,用提取到的知識片段來增強對問題的回答生成過程。在知識提取步驟,借助詞向量的相似度找到與用戶提出的問題最匹配的內... 展開更多

收藏 1
0
置頂
發表了博客
10/07 10:44

Embedding技術與應用 (2) :神經網絡的發展及現代Embedding方法簡介

> 編者按:IDP開啟Embedding系列專欄,詳細介紹Embedding的發展史、主要技術和應用。 > > **本文是《Embedding技術與應用系列》的第二篇,重點介紹神經網絡的發展歷程及其技術架構,剖析了嵌入技術與這些神經網絡(Transformer、BERT和GPT等)的關系。** > > 正如OpenAI去年年底推出的ChatGPT在對話領域的重要地位,嵌入技術正在成為人工智能進步的重要基石。本文作者認為,嵌入技術與生成式方法以及基于人類反饋的強化學習相結合... 展開更多

收藏 0
0
置頂
程序員
發表了博客
09/27 13:38

手把手教你用 Milvus 和 Towhee 搭建一個 AI 聊天機器人!

作為向量數據庫的佼佼者,Milvus 適用于各種需要借助高效和可擴展向量搜索功能的 AI 應用。 舉個例子,如果想要搭建一個負責聊天機器人數據管理流程,Milvus 必然是首選向量數據庫。那么如何讓這個應用程序開發變得易于管理及更好理解,那就需要借助 Towhee([https://towhee.io/](https://towhee.io/))了。Towhee 是一個新興的機器學習(ML)框架,可以簡化了實現和編排復雜 ML 模型的過程。 接下來我將介紹如何通過 Python 使... 展開更多

收藏 1
0
置頂
發表了博客
06/26 08:27

關于語言大模型的八大論斷

近幾個月來,語言大模型(LLM)的廣泛公開部署引起了倡導者、政策制定者和許多領域學者們的新一輪關注和參與。Anthropic技術團隊成員、紐約大學助理教授Samuel R. Bowman總結了八個可能引發思考的觀點,并討論了LLM還存在的局限性。 即便沒有針對性的創新,LLM的能力也會隨著投資的增加而可預估地增強 LLM中的一些重要行為往往作為增加投資的“副產品”不可預測地出現 LLM經常學習并使用外部世界的表征 目前還沒有可靠的技術來引... 展開更多

收藏 0
0
沒有更多內容
加載失敗,請刷新頁面
點擊加載更多
加載中
下一頁
返回頂部
頂部
一本久久综合亚洲鲁鲁五月天,无翼乌口工全彩无遮挡H全彩,英语老师解开裙子坐我腿中间