AI企業正在加緊重新設計模型測試並成立新的基準

快速發展的技術正在超越當前評估和比較大型語言模型的方法。

更新於2024年11月10日 09:13 克莉絲蒂娜•克里德爾

OpenAI、微軟(Microsoft)、Meta和Anthropic都計劃構建能夠代表人類自主執行任務的AI代理人

科技集團正急於重新設計測試和評估人工智慧模型的方式，因爲快速發展的技術已經超越了當前的基準。

OpenAI、微軟、Meta和Anthropic最近都宣佈了計劃，構建能夠代表人類自主執行任務的AI代理人。爲了有效地實現這一目標，這些系統必須能夠使用推理和規劃來執行越來越複雜的操作。

您已閱讀10%（197字），剩餘90%（1815字）包含更多重要資訊，訂閱以繼續探索完整內容，並享受更多專屬服務。

人工智慧