自然語言處理,看這個就夠了

自然語言處理(NLP)是語言學、計算機科學和人工智能的一個子領域,涉及計算機和人類語言之間的互動,特別是如何為計算機編程以處理和分析大量的自然語言數據。其目標是使計算機能夠 “理解” 文件的內容,包括文件中語言的上下文細微差別。然后,該技術可以準確地提取文件中的信息和見解,并對文件本身進行分類和組織。自然語言處理的挑戰經常涉及語音識別、自然語言理解和自然語言生成。

加載中

Transformers TF-PT 用于?TF 2.0 和 PyTorch 的自然語言處理框架

Transformers 提供了數以千計的預訓練模型,支持 100 多種語言的文本分類、信息抽取、問答、摘要、翻譯、文本生成。它的宗旨讓最先進的 NLP 技術人人易用。Transformers 提供了便于快速下載和使用的API,讓你可以把預訓練模型用在給定文本、在你的數據集上微調然后通過 model hub 與社區共享。 同時,每個定義的 Python 模塊均完全獨立,方便修改和快速研究實驗。Transformers 支持三個最熱門的深度學習庫: Jax、PyTorch 和 TensorFlow — 并與之無縫整合。你可以直接使用一個框架訓練你的模型然后用另一個加載和推理。
更新于 2023/04/23 18:55

HanLP 自然語言處理

面向生產環境的多語種自然語言處理工具包,基于 PyTorch 和 TensorFlow 2.x 雙引擎,目標是普及落地最前沿的 NLP 技術。HanLP 具備功能完善、精度準確、性能高效、語料時新、架構清晰、可自定義的特點。 借助世界上最大的多語種語料庫,HanLP 2.1 支持包括簡繁中英日俄法德在內的 104 種語言上的 10 種聯合任務以及多種單任務。HanLP 預訓練了十幾種任務上的數十個模型并且正在持續迭代語料庫與模型。 HanLP 提供 RESTful 和 native 兩種 API,分別面向輕量級和海量級兩種場景。無論何種 API 何種語言,HanLP 接口在語義上保持一致,在代碼上堅持開源。
更新于 2023/04/14 16:37

Chinese BERT 中文預訓練語言模型

在自然語言處理領域中,預訓練語言模型(Pre-trained Language Models)已成為非常重要的基礎技術。為了進一步促進中文信息處理的研究發展,我們發布了基于全詞遮罩(Whole Word Masking)技術的中文預訓練模型 BERT-wwm,以及與此技術密切相關的模型:BERT-wwm-ext、RoBERTa-wwm-ext、RoBERTa-wwm-ext-large、RBT3、RBTL3。
更新于 2023/04/07 16:30

GPT-2 基于 transformer?的大型語言模型

Generative Pre-trained Transformer 2(GPT-2)是 OpenAI 在 2019 年 2 月創建的開源人工智能模型。GPT-2 翻譯文本、回答問題、總結段落,并生成文本輸出,其水平雖然有時與人類無異,但在生成長段落時可能變得重復或無意義。 它是一個通用的學習模型,沒有被專門訓練來完成這些任務。GPT-2 是作為 OpenAI 2018 年 GPT 模型的 "直接擴展" 而創建的,其參數數和訓練數據集的大小都增加了 10 倍。 GPT 架構實現了一個深度神經網絡,特別是一個轉化器模型,這個模型大大增加了并行化,并且超過了以前基于 RNN/CNN/LSTM 模型的基準。 OpenAI 在 2019 年 11 月發布了 GPT-2 語言模型的完整版本(有 15 億個參數)。GPT-2 之后是 1750 億個參數的 GPT-3,其源代碼從未被公開。
更新于 2023/10/12 15:45

Rasa 語音和文字聊天的機器學習框架

Rasa 是一個開源的機器學習框架,用于自動處理基于文本和語音的對話。通過 Rasa,你可以在以下基礎上創建聊天機器人和語音助手。Rasa 可以讓用戶對話完全保密,并保護用戶的 IP。 Rasa 允許開發者在自己的基礎架構上運行助手的操作,而無需將客戶消息發送到托管的第三方服務進行處理。
更新于 2023/03/27 08:47

PyText 基于 PyTorch 的 NLP 建??蚣?/span>

PyText 是一個基于深度學習的 NLP 建??蚣?,建立在 PyTorch 之上。PyText 解決了快速實驗和大規模服務模型這兩個經常沖突的要求。 它通過為模型組件提供簡單和可擴展的接口和抽象,以及利用 PyTorch 通過優化的 Caffe2 執行引擎輸出模型進行推理的能力來實現這一目的。PyText 需要 Python 3.6.1 或更高版本。
更新于 2023/04/10 16:56

NLP Architect 英特爾自然語言處理庫

NLP Architect 是一個開源的 Python 庫,用于探索最先進的深度學習拓撲結構和技術,以優化自然語言處理和自然語言理解神經網絡。該庫包括英特爾過去和正在進行的 NLP 研究和開發工作,是英特爾 AI 實驗室的一部分。 NLP Architect 基于 TensorFlow、PyTorch 和 Dynet 深度學習框架。包含 NLP/NLU 相關模型、不同的神經網絡拓撲結構、簡化庫中工作流程的程序、預定義的數據處理器和數據集加載器以及一些實用工具。
更新于 2023/03/10 17:59

AllenNLP 基于 PyTorch 的 NLP 研究庫

AllenNLP 是一個用于構建自然語言處理深度學習模型的開源庫,它建立在 PyTorch 之上,旨在支持研究人員、工程師、學生等希望輕松建立高質量深度 NLP 模型的群體。 它為現代 NLP 中的常見組件和模型提供了高級抽象和 API。它還提供了一個可擴展的框架,使其易于運行和管理 NLP 實驗。 AllenNLP 需要 Python 3.6.1 或更高版本以及 PyTorch,支持 Mac 和 Linux 環境,目前不支持 Windows。
更新于 2023/03/05 23:15
AllenNLP 基于 PyTorch 的 NLP 研究庫

Stanford CoreNLP Java 編寫的自然語言分析工具

Stanford CoreNLP 提供了一套用 Java 編寫的自然語言分析工具。它可以接受原始的人類語言文本輸入,并給出單詞的基本形式、詞性、它們是否是公司名稱、人名等,能夠以短語或單詞的依賴性來標記句子的結構,并指出哪些名詞短語是指同一實體。 它最初是為英語開發的,但現在也為阿拉伯語、中文、法語、德語和西班牙語提供不同程度的支持。Stanford CoreNLP 是一套穩定的、經過良好測試的自然語言處理工具,被學術界、工業界和政府的各種團體廣泛使用。
更新于 2023/02/27 00:16

Stanza 斯坦福自然語言處理 Python 庫

斯坦福大學 NLP 小組的官方 Python NLP 庫。它包含對在 60 多種語言上運行各種精確自然語言處理工具的支持,以及對從 Python 訪問 Java Stanford CoreNLP 軟件的支持。 現在 Stanza 有一個新的生物醫學和臨床英語模型包集合,為生物醫學文獻文本和臨床筆記的句法分析和命名實體識別(NER)提供無縫體驗。 Stanza 需要 Python 3.6 或更高版本。
更新于 2023/02/19 19:59
Stanza 斯坦福自然語言處理 Python 庫

spaCy NLP 自然語言文本處理庫

spaCy 是一個在 Python 和 Cython 中進行高級自然語言處理的庫。它建立在最新的研究之上,并且從設計之初就是為了在實際產品中使用。 spaCy 帶有預訓練的管線,目前支持 60 多種語言。它具有高速的特性,并且有用于標記,解析、命名實體識別、文本分類等功能的神經網絡模型。spaCy 還具有生產就緒的訓練系統和簡單的模型打包、部署和工作流程管理。
更新于 2023/02/10 17:18

沒有更多內容

加載失敗,請刷新頁面

沒有更多內容

返回頂部
頂部
一本久久综合亚洲鲁鲁五月天,无翼乌口工全彩无遮挡H全彩,英语老师解开裙子坐我腿中间