OpenAI 於週四推出 GPT-5.4 全新基礎模型,定位為當前最強大且兼顧效率的專業生產力工具。為了滿足不同領域的垂直需求,該系列細分為強調深度推理的 「GPT-5.4 Thinking」 與追求極致效能的 「GPT-5.4 Pro」。在技術指標方面,此版本的 API 支援高達 100 萬個 token 的上下文視窗,為 OpenAI 迄今提供的最大容量,這項規格提升使其在處理大規模企業數據與長篇文件時,具備更穩定的資訊保留能力。
在商務應用實務上,GPT-5.4 展現出顯著的跨領域競爭力,於法律分析、財務精算及長週期專案(如多頁面簡報開發)的基準測試中均取得領先地位。合作方 Mercor 執行長 Brendan Foody 指出,與現有其他前沿模型相比, GPT-5.4 在處理高複雜度邏輯任務時,不僅運行速度更快,且具備成本優勢,能有效因應專業人士處理龐雜數據時的效率挑戰。
OpenAI 透過「權杖效率優化」與新開發的「工具搜尋」(Tool Search)機制,徹底翻轉了過往 API 呼叫時需預載海量指令的資源浪費,新系統讓模型在需要時才查找工具定義,大幅減少了不必要的運算損耗,為建構更複雜、更敏捷的 AI 代理(AI Agents)系統掃平了障礙。
在減少「 AI 幻覺」與提升資訊可靠性方面,數據顯示 GPT-5.4 在單項事實主張的錯誤率較 GPT-5.2 降低了 33%,整體回覆的出錯率則下降 18%。對於金融與法務等低容錯率領域,這項進展顯著提升了生成式 AI 處理嚴謹專業內容的適用性。
在 AI 安全性與透明度方面, OpenAI 引入了針對「思維鏈」(Chain-of-Thought)的全新評估機制。研究顯示,GPT-5.4 Thinking 在執行任務時,其推論過程展現出高透明度,目前數據尚未發現該模型有能力隱藏或誤導其邏輯路徑。
以上這項評估結果初步緩解了學界對推理模型可能產生欺騙行為的擔憂,並顯示「思維鏈監控」在未來的 AI 監管架構中,仍是防範技術風險的關鍵工具。
責任編輯:Claire
核稿編輯:Sisley
本文初稿由 INSIDE 使用 AI 協助編撰,並經人工審校確認;加入 INSIDE 會員,獨享 INSIDE 科技趨勢電子報,點擊立刻成為會員!
延伸閱讀:


