該文章 DeepSeek V4 傳聞在長上下文編程方面優於 ChatGPT 和 Claude 出現在 BitcoinEthereumNews.com 上。DeepSeek V4 傳聞優於 ChatGPT該文章 DeepSeek V4 傳聞在長上下文編程方面優於 ChatGPT 和 Claude 出現在 BitcoinEthereumNews.com 上。DeepSeek V4 傳聞優於 ChatGPT

DeepSeek V4 傳聞在長上下文編碼方面表現優於 ChatGPT 和 Claude

據傳 DeepSeek V4 在長文本編碼方面將超越 ChatGPT 和 Claude,目標是頂尖級編碼任務。知情人士稱,如果內部測試顯示其在二月中旬推出後的預期表現,矽谷的 AI 領域應該感到擔憂。

據報導,總部位於中國的 AI 新創公司 DeepSeek 計劃於2月17日發布其最新大型語言模型 DeepSeek V4。知情人士稱,該模型在處理長文本代碼提示和任務時,將對現有的大型語言模型(如 OpenAI 的 ChatGPT 和 Anthropic 的 Claude)構成威脅。

開發者對 DeepSeek V4 發布表達深切期待

截至撰寫本文時,這家中國公司尚未公開披露任何有關即將發布的資訊或證實這些傳聞。不同社交網路上的開發者表達了對發布的深切期待。AI 開發者兼 Hyperbolic Labs 聯合創辦人 Yuchen Jin 在 X 上寫道「據傳 DeepSeek V4 即將推出,編碼能力比 Claude 和 GPT 更強。」

Subreddit r/DeepSeek 也 熱烈討論,一位用戶解釋說,他們對 DeepSeek 即將推出的 V4 模型的癡迷程度不正常。該用戶表示,他們經常「查看新聞、可能的傳聞,甚至會到 DS 網站閱讀文件,尋找任何可能表明更新的變化或跡象。」

DeepSeek 之前的發布對全球市場產生了重大影響。這家中國 AI 新創公司 於2025年1月發布了其 R1 推理模型,導致了數萬億美元的拋售。該版本在數學和推理基準測試上與 OpenAI 的 01 模型相當,儘管成本遠低於這家美國 AI 新創公司在其 01 模型上的支出。 

據報導,這家中國公司在模型發布上僅花費了600萬美元。與此同時,全球競爭對手在相同產出上的支出幾乎是其70倍。其 V3 模型在 MATH-500 基準測試中也獲得了90.2%的分數,而 Claude 的分數為78.3%。DeepSeek 最近的 V3 升級版(V3.2 Speciale)進一步提升了其生產力。

其 V4 模型的賣點已從 V3 強調的純推理、形式證明和邏輯數學演變而來。新版本預計將是一個混合模型,結合推理和非推理任務。該模型旨在透過填補現有缺口來佔領開發者市場,滿足對高準確度和長文本代碼生成的需求。

Claude Opus 4.5 目前在 SWE 基準測試中佔據主導地位,準確率達到80.9%。V4 需要超越這一成績才能推翻 Claude Opus 4.5。根據以往的成功經驗,即將推出的模型可能會超越這個門檻,並在基準測試中佔據主導地位。

DeepSeek 率先採用 mHC 訓練大型語言模型

DeepSeek 的成功讓許多人深感難以置信。這樣一家小公司怎麼能取得如此成就?秘密可能深藏在其 於1月1日發表的研究論文中。該公司確定了一種新的訓練方法,使開發者能夠輕鬆擴展大型語言模型。DeepSeek 創辦人兼執行長梁文鋒在研究中寫道,該公司正在使用流形約束超連接(mHC)來訓練其 AI 模型。 

這位高管提議使用 mHC 來解決開發者在訓練大型語言模型時遇到的問題。根據文鋒的說法,mHC 是超連接(HC)的升級版,HC 是其他 AI 開發者用於訓練大型語言模型的框架。他解釋說,HC 和其他傳統 AI 架構會強制所有數據通過單一狹窄通道。與此同時,mHC 將該路徑擴展為多個通道,促進數據和資訊的傳輸,而不會導致訓練崩潰。 

Omdia 首席分析師 Lian Jye Su 讚揚執行長文鋒發表其研究。Su 強調,DeepSeek 決定發表其訓練方法,表明了中國 AI 領域重新獲得的信心。DeepSeek 已經 主導了發展中國家市場。Microsoft 週四發布的一份報告顯示,DeepSeek 佔據中國 AI 市場89%的份額,並在發展中國家持續獲得動能。

想讓您的專案呈現在加密貨幣界頂尖人士面前?在我們的下一份產業報告中展示它,讓數據創造影響力。

來源: https://www.cryptopolitan.com/deepseek-v4-chatgpt-and-claude/

市場機遇
Belong 圖標
Belong實時價格 (LONG)
$0.003241
$0.003241$0.003241
+3.54%
USD
Belong (LONG) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 [email protected] 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。