買幣

付款方式為

USD

買幣&賣幣

Hot

支援 Visa、Mastercard、SEPA 等多種支付方式

基礎交易

進階交易

打新

理財產品

推廣

在社交 App 中直接使用 Gate AI

GateClaw

Gate 藍龍蝦，開箱即用

Gate for AI Agent

AI 基礎設施，Gate MCP、Skills 與 CLI

Gate Skills Hub

萬級技能

從辦公到交易，一站式技能庫讓 AI 更好用

其他

2026-05-10 04:27:34

據 Beating 稱，微軟最近開源了 Phi-Ground 模型家族，旨在解決“AI 應該在計算機螢幕上點擊哪裡”的問題。該 40 億參數版本，並結合用於指令規劃的更大語言模型，在 Showdown 基準測試中超過了 OpenAI Operator 和 Claude Computer Use 的點擊準確率，並在包括 ScreenSpot-Pro 在內的五項評估中位列所有 100 億以下參數模型的第一名。團隊在超過 4000 萬個數據樣本上進行了訓練，並發現學術論文中使用的三種常見訓練技術在規模化時變得無效。關鍵思路證明很簡單：以常規數字輸出座標，例如“523, 417.” 先前的研究為座標發明了專門的位置詞彙，但這些方法無法規模化。團隊還發現，將文本指令放在圖像之前可以提升性能，因為模型在處理像素時能夠識別目標。此外，諸如 DPO 之類的強化學習方法在微調之後仍能提高準確率。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
回覆
轉發
分享

回覆

請輸入回覆內容

暫無回覆

熱門話題
查看更多
#
Gate廣場五月交易分享
123.29萬熱度
#
比特币波动
3.71萬熱度
#
Polymarket每日熱點
90.38萬熱度
#
山寨幣資金回流
445.07萬熱度
#
特朗普5月13日訪華
2586.8萬熱度

熱門話題

Gate廣場五月交易分享

比特币波动

Polymarket每日熱點

山寨幣資金回流

特朗普5月13日訪華

置頂