百度首席技術官王海峰在解讀文心大模型 4.0 背后的關鍵技術和最新進展時表示,文心大模型 4.0 的理解、生成、邏輯、記憶四大能力都有顯著提升。
文心大模型4.0在9月已開始小流量上線,過去一個多月效果又提升了近30%。訓練算法效率自3月以來已累計提升3.6倍,周均的訓練有效率超過98%。
8月31日文心一言面向全社會開放至今,用戶規模已經達到4500萬,開發者5.4萬,場景4300個,應用825個,插件超過500個。
王海峰指出,文心大模型4.0的理解和生成能力的提升幅度相近,而邏輯和記憶能力的提升則更大,邏輯的提升幅度達到理解的近3倍,記憶的提升幅度也達到了理解的2倍多。百度基于文心大模型研制了智能代碼助手Comate,從內部應用效果來看,整體的代碼采納率達到40%,高頻用戶的代碼采納率達到60%。
此外,文心大模型4.0在輸入和輸出階段都進行知識點增強。一方面,對用戶輸入的問題進行理解,并拆解出回答問題所需的知識點,然后在搜索引擎、知識圖譜、數據庫中查找準確知識,最后把這些找到的知識組裝進Prompt送入大模型,準確率好,效率也高;另一方面,對大模型的輸出進行反思,從生成結果中拆解出知識點,然后再利用搜索引擎、知識圖譜、數據庫,以及大模型本身進行確認,進而對有差錯的點進行修正。
王海峰還公布了百度人工智能人才培養的最新數據稱,百度在2020年提出5年為全社會培養500萬AI人才,截至目前已經培養了420萬AI人才。