FT商學院

AI企業正在加緊重新設計模型測試並成立新的基準

快速發展的技術正在超越當前評估和比較大型語言模型的方法。
OpenAI、微軟(Microsoft)、Meta和Anthropic都計劃構建能夠代表人類自主執行任務的AI代理人

科技集團正急於重新設計測試和評估人工智慧模型的方式,因爲快速發展的技術已經超越了當前的基準。

OpenAI、微軟、Meta和Anthropic最近都宣佈了計劃,構建能夠代表人類自主執行任務的AI代理人。爲了有效地實現這一目標,這些系統必須能夠使用推理和規劃來執行越來越複雜的操作。

您已閱讀10%(197字),剩餘90%(1815字)包含更多重要資訊,訂閱以繼續探索完整內容,並享受更多專屬服務。
版權聲明:本文版權歸FT中文網所有,未經允許任何單位或個人不得轉載,複製或以任何其他方式使用本文全部或部分,侵權必究。
設置字型大小×
最小
較小
默認
較大
最大
分享×