爲何用電腦生成的數據來訓練人工智慧模型

微軟、OpenAI和Cohere等公司正在嘗試使用「合成數據」來訓練自己的大語言模型，因爲人類創造的數據已經達到極限。

更新於2023年7月19日 16:15 馬杜米塔•穆爾賈

人工智慧公司正在探索一條新的途徑，以獲取開發強大的生成模型所需的大量數據：從零開始成立資訊。

微軟(Microsoft)、OpenAI和Cohere等公司正在測試使用所謂的「合成數據」——用於訓練人工智慧系統（即大語言模型，縮寫爲LLM）的電腦生成資訊——因爲可以進一步改進這項尖端技術的人工創造數據已經達到了極限。

微軟支持的OpenAI開發的ChatGPT於去年11月推出後，谷歌(Google)和Anthropic等公司今年紛紛公開推出了大量產品，這些產品可以根據簡單的提示生成可信的文字、影像或代碼。

您已閱讀10%（253字），剩餘90%（2181字）包含更多重要資訊，訂閱以繼續探索完整內容，並享受更多專屬服務。

人工智慧