OpenAI開源HealthBench,60個國家合力開發5000段真實對話

來源 金色財經
金色財經報道,OpenAI開源了一個專門面向醫療大模型的測試評估集——HealthBench。與以往測試集不同的是,該測試集的5000段核心測試對話,全部由來自60個國家/地區的26個專業262名醫生打造,極大增強了該測試集的難度、真實性以及豐富度。並且採用了多輪對話測試,而不是簡單的答題或選擇題模式。根據測試數據顯示,大模型在醫療保健領域的表現有了顯著提升。例如,從之前的GPT-3.5Turbo的16%到GPT-4o的32%,再到o3的60%,整體性能有了顯著進步。尤其是小型模型的進步更爲突出,GPT-4.1nano不僅在性能上超越了GPT-4o,而且成本降低了25倍。
免責聲明:僅供參考。 過去的表現並不預示未來的結果。
placeholder
日幣匯率升破145!未來升至135?日幣過度升值風險加大 日幣和瑞郎成為關稅貿易戰下的重大贏家,摩根士丹利看漲日幣匯率至135。
作者  Alison Ho
4 月 09 日 週三
日幣和瑞郎成為關稅貿易戰下的重大贏家,摩根士丹利看漲日幣匯率至135。
placeholder
歐元和日幣匯率回檔在即?最準分析師:歐元將下跌5%!歐元和日幣兌美元匯率2025年已上漲10%,分析表示後續將回檔。
作者  Alison Ho
4 月 23 日 週三
歐元和日幣兌美元匯率2025年已上漲10%,分析表示後續將回檔。
placeholder
金價在貿易緊張局勢緩解的背景下進一步下跌至3300美元以下週五,金價(黃金/美元)吸引了一些後續賣盤,連續第三天走低,並在亞洲時段進一步跌破3300美元關口
作者  FXStreet
5 月 09 日 週五
週五,金價(黃金/美元)吸引了一些後續賣盤,連續第三天走低,並在亞洲時段進一步跌破3300美元關口
placeholder
日幣匯率跌破146!避險需求降溫,未來會繼續跌嗎?美元/日圓(USD/JPY)升至146.28,創一個多月新高。
作者  Alison Ho
昨日 04: 05
美元/日圓(USD/JPY)升至146.28,創一個多月新高。
placeholder
貿易戰緩和,歐元和日幣匯率大跌【外匯週報】貿易戰緩和,歐元/美元重回下行。避險情緒降溫,日幣匯率大跌破148。
作者  Alison Ho
17 小時前
貿易戰緩和,歐元/美元重回下行。避險情緒降溫,日幣匯率大跌破148。
goTop
quote