微軟推出 Phi-4,一種新的生成式 AI 模型 - 這是軟件包

來源 Cryptopolitan

Phi-4:增強matic推理能力

微軟將 Phi-4 定位爲解決matic問題的領導者,並指出其性能比其前身和同類模型都有顯着提升。據報道 Phi-4 在多項標準化基準測試中取得最高分後,該公司對人工智能模型的能力dent。

微軟推出 Phi-4,一種新的生成式 AI 模型 - 這是軟件包
來源:微軟

在 GPQA 測試中,它的得分爲 56.1,超過了 GPT-4o 的 40.9 分和 Llama-3 的 49.1 分。在 MATH 基準測試中,Phi-4 取得了 80.4 分,體現了其解決複雜matic問題的先進能力。它還在編碼基準測試中表現出色,在 HumanEval 上獲得了 82.6 分。

此外,Phi-4 在現實場景中展示了其強大的能力,包括在美國matic協會的美國matic競賽 (AMC-10/12) 問題上獲得高分。這些結果表明了其在科學研究、工程和金融建模等matic準確性和推理至關重要的領域的潛在應用。

微軟推出 Phi-4,一種新的生成式 AI 模型 - 這是軟件包
來源:微軟

雖然 OpenAI 的 GPT-4o 和 Google 的 Gemini Ultra 等較大模型需要處理數千億甚至數萬億個參數,但 Phi-4 表明更小的、簡化的架構可以在專門任務中實現卓越的性能。

微軟將 Phi-4 的進步歸功於高質量合成數據與人類生成內容數據集的集成,以及訓練後未公開的改進。這些努力反映了人工智能行業更廣泛的趨勢,研究團隊越來越關注合成數據使用和訓練後優化方面的創新。

Scale AI 首席執行官 Alexandr Wang 最近強調了這一轉變,他表示該行業已經遇到了“預訓練數據牆”,並補充說公司現在將競相開發更高效的人工智能模型。