COM:一文了解 ChatGPT 等 LLMs 得到明顯改進的 3 個變化

Author：

Time：1900/1/1 0:00:00

原文作者：TanyaMalhotra

來源：Marktechpost

近年來，大型語言模型在全世界受到了廣泛贊賞，并在自然語言處理領域備受歡迎。這使我們能夠使用比以往任何時候都更好、更清晰的語言理解來描述智能系統。

諸如GPT-3、T5、PaLM等LLMs的性能有了顯著提高，并且這些模型將繼續存在，因為它們可以完成從通過學習閱讀來模仿人類，到生成文本和總結長段落內容的所有工作。而根據一些深入的研究，如果LLM的規模很大，那么它的表現就會很好。通過在大量數據上訓練這些模型，它們可以理解人類語言的語法、語義和語用學。?

NFT足球游戲開發公司Goals完成2000萬美元A輪融資:4月29日消息，瑞典NTF足球游戲開發公司Goals宣布完成2000萬美元A輪融資，Reddit聯合創始人亞歷克西斯·奧哈尼安(Alexis Ohanian)旗下Seven Seven Six領投，Northzone、Moonfire和Cassius參投，截至目前該公司的融資總金額已達到3900萬美元。新資金將用于加速Goals目前處于pre-alpha階段的NFT足球視頻游戲產品開發，并加入Web3社交和游戲競爭元素，已取代傳統EA Sports FC等傳統足球游戲模式，此外該公司還打算將其團隊規模擴大到75人。（sportspromedia）[2023/4/29 14:34:06]

由OpenAI開發的流行的大型語言模型ChatGPT之所以發展得如此之快，正是因為采用了人類反饋強化學習等先進技術。通過RLHF，機器學習算法結合并使用人工輸入提高了模型的性能。它針對預訓練的LLM進行了微調，用于開發聊天機器人、虛擬助手等任務。

恒大高新：公司的業務目前還沒有web3.0相關技術的應用場景:11月15日消息，恒大高新在互動平臺表示，據悉，Web 3.0作為下一代互聯網技術,還處于應用場景探索階段，尚需建立完善且統一的技術標準與技術架構。

公司的業務目前還沒有web3.0相關技術的應用場景，公司將持續關注web3.0的技術發展。?（財聯社）[2022/11/15 13:06:26]

此外，ChatGPT等LLMs所基于的預訓練基礎模型也得到了明顯的改進。這主要是由于三個方面的變化：

Compound通過第130號提案：增加cCOMP借款上限，調整利率模型:10月23日消息，Compound官方稱，第130號提案已經達到法定投票數，將在2天內正式生效。該提案提高了cCOMP 借款上限并更改了 cCOMP 和 cUNI 的利率模型。cCOMP的借款上限從90,750增加到150,000 COMP，因為提高了借款上線，所以將cCOMP利率模型切換到目前用于cUNI的利率模型，導致整個利用率曲線的借款成本略高。cUNI 的利率模型轉換為 cAAVE/cMKR/cYFI/cSUSHI 目前使用的利率模型，將其與其他類似資產標準化，并導致整個利用率曲線上的借貸成本略低。[2022/10/23 16:36:18]

1.實踐證明，模型的擴展性對提高其性能很有幫助。以Pathways語言模型為例，該模型通過擴展小樣本學習大大影響了其性能，小樣本學習可以減少根據具體應用調整模型所需的特定任務訓練實例的數量。

通過使用Pathways語言模型在6144TPUv4芯片上擴展和訓練5400億個參數，PaLM展示了重復擴展的好處，其表現超過了各種傳統模型，并顯示出很大的進步。因此，深度和寬度的擴展都是提高基礎模型性能的一個重要因素。

2.另一個變化是在預訓練時增加標記數量的過程。像Chinchilla這樣的模型已經證明，通過增加預訓練數據，大型語言模型的表現會更好。

Chinchilla是一個計算最優模型。在相同的計算預算下，在70B參數和比Gopher模型多四倍的數據上進行訓練，Chinchilla的表現一致優于Gopher，它甚至比GPT-3、Jurassic-1和Megatron-TuringNLG等LLMs效果更好。這清楚地描述了對于每一個計算最優的訓練，標記的數量應該相應地縮放——即模型大小的兩倍，因此訓練標記的數量應該是兩倍。?

3.第三個變化是使用干凈和多樣化的預訓練數據。Galactica的性能證明了這一點，它是一種存儲、混合和推理科學知識的大型語言模型。經過幾篇科學論文文本的訓練，Galactica的表現優于GPT-3、Chinchilla等模型。另一個大型語言模型BioMedLM是一種針對生物醫學文本的特定領域LLM，在針對特定領域數據進行訓練時，它表現出了巨大的性能提升。它清楚地表明，在特定領域的數據上進行的預訓練勝過在通用數據上的訓練。

結論

LLMs的成功無疑歸功于多種因素的混合，包括RLHF的使用和預訓練基礎模型的發展。這三個變化極大地影響了LLMs的性能。此外，GLaM通過使用稀疏激活的混合專家架構，以更少的訓練成本擴展模型的容量，從而顯著提高了性能。因此，這些變化為更高級的語言模型開辟了道路，而這些模型將繼續讓我們的生活變得輕松。??

Tags：COM CHI OMP COMP Compendium.Fi KODACHI幣 comp幣價格今日行情 COMPLUS NETWORK