專欄中國經濟

DeepSeek的意義不僅止於改變AI遊戲規則

閆曼:當資本和算力的疊加不再是技術進步的唯一途徑,這對創業者和開發者們意味著什麼,科技圈的每個人應該都能預知到。

一年之前的國內春節假期期間,OpenAI在當地時間2024年2月15日發佈了文生影片大模型Sora,在幾段sora生成的影片中,絲滑的運鏡和幾可亂真的呈現效果,讓當時仍處於模仿和跟隨階段的國產大模型界陷入巨大的震驚和悲觀情緒中。一時之間「投降論」甚囂塵上,投資人和大廠們紛紛出來勸說創業者們放棄幻想,轉攻應用,大模型創業是「死路一條」。

誰又能想到,在短短一年之後的這個春節,大家討論的是一款名叫DeepSeek國產大模型。除了科技圈的討論和刷屏之外,其應用開始深入千家萬戶,有更多的普通人開始使用DeepSeek定製減肥食譜、編輯節日祝福、寫藏頭詩,甚至算命。

到現在爲止,DeepSeek一共推出了三代模型。去年5月,幻方量化旗下的DeepSeek發佈了DeepSeek-V2,能力號稱對標GPT-4,價格卻僅爲GPT-4的近1%,低廉的價格引發了國產大模型長達一整年的價格戰;到了12月,DeepSeek發佈了新大模型DeepSeek-V3,將訓練成本降到幾百萬美元,被譽爲「價格屠夫」;而這次發佈的DeepSeek-R1,直接對標OpenAI o1.其中「深度思考」和「聯網搜尋」功能的上線,讓DeepSeek成功登頂中美兩區免費榜第一。

您已閱讀32%(521字),剩餘68%(1109字)包含更多重要資訊,訂閱以繼續探索完整內容,並享受更多專屬服務。
版權聲明:本文版權歸FT中文網所有,未經允許任何單位或個人不得轉載,複製或以任何其他方式使用本文全部或部分,侵權必究。

科技曼談

閆曼,FT中文網科技與產業板塊主編,負責FT中文網科技板塊的策劃、專訪及編輯工作。香港浸會大學國際新聞碩士,近十年一線媒體採編經驗,深耕網路科技領域新聞多年。曾爲多家知名媒體特約撰稿人。本專欄旨在分享作者身在科技、創業和投資前線的觀察,就科技領域動態作出鮮活生動的第一時間解讀。 個人公衆號:科技曼談(ID:kejimantan)

相關文章

相關話題

設置字型大小×
最小
較小
默認
較大
最大
分享×