FT商學院

爲何用電腦生成的數據來訓練人工智慧模型

微軟、OpenAI和Cohere等公司正在嘗試使用「合成數據」來訓練自己的大語言模型,因爲人類創造的數據已經達到極限。

人工智慧公司正在探索一條新的途徑,以獲取開發強大的生成模型所需的大量數據:從零開始成立資訊。

微軟(Microsoft)、OpenAI和Cohere等公司正在測試使用所謂的「合成數據」——用於訓練人工智慧系統(即大語言模型,縮寫爲LLM)的電腦生成資訊——因爲可以進一步改進這項尖端技術的人工創造數據已經達到了極限。

微軟支持的OpenAI開發的ChatGPT於去年11月推出後,谷歌(Google)和Anthropic等公司今年紛紛公開推出了大量產品,這些產品可以根據簡單的提示生成可信的文字、影像或代碼。

您已閱讀10%(253字),剩餘90%(2181字)包含更多重要資訊,訂閱以繼續探索完整內容,並享受更多專屬服務。
版權聲明:本文版權歸FT中文網所有,未經允許任何單位或個人不得轉載,複製或以任何其他方式使用本文全部或部分,侵權必究。
設置字型大小×
最小
較小
默認
較大
最大
分享×