【jinnianhui科技消息】2月4日,深度研究智能體權威評測榜單DeepResearch Bench公布最新結果。百度千帆推出的深度研究智能體(Qianfan-DeepResearch Pro)憑借其卓越的端到端研究能力與極高的報告產出質量,在評測中脫穎而出,榮登榜單榜首。

當前,深度研究正被視為人工智能進化的關鍵分水嶺。它要求AI系統能夠模擬人類專家,自主執行從復雜需求理解、廣泛信息獲取到深度洞察產出的多步驟、可迭代認知全過程,遠超傳統文本生成的范疇。該技術已廣泛應用于學術綜述、金融投研、商業分析等領域,能將傳統耗時數日的手動研究工作壓縮至分鐘級完成。
作為衡量該領域能力的“金標準”,DeepResearch Bench填補了通用AI評測在端到端深度研究任務上的空白。其由領域專家設計了100個博士級別的研究任務,覆蓋22個學科,并引入嚴格的RACE報告質量評價框架與引文準確性評估,是目前全球最硬核、最真實的深度研究智能體生產力評價體系。
在此次評測中,百度千帆深度研究Agent在衡量報告含金量的四大核心維度——全面性、洞察力、指令遵循度和可讀性上,均實現了行業領先。

在架構方面,百度千帆采用“任務理解-規劃-執行”循環機制,實現端到端研究交付。信息處理能力方面,千帆依托百度搜索與RAG技術,保障信息獲取的廣度、可信度與相關性。執行控制方面,千帆通過“由粗到細”的研究路徑以及深度執行規劃與實時反思機制,動態評估進展、調整策略,有效避免“幻覺”與路徑偏離,確保復雜任務的高質量完成。
報告生成方面,百度千帆采用獨特的兩階段報告渲染機制,首先生成確保邏輯一致性與內容全面性的“pivot報告”,隨后可渲染輸出markdor:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫n、html、ppt等多形態最終報告,實現“一次研究,多形態交付”。
目前,該深度研究Agent已正式上線百度千帆平臺。用戶只需輸入復雜的調研需求,系統即可在十幾分鐘內生成附帶規范引用的專業級研究報告,真正實現“分鐘級”的深度洞察交付。
此次登頂榜首,也集中體現了百度千帆Agent Infra的強大支撐能力。該基礎設施提供模型、工具、Agent開發、數據及運行環境等一站式服務。據悉,千帆平臺已累計開發超過130萬個Agents,其中以“百度AI搜索”為代表的獨家工具日均調用量已達數千萬次,為AI智能體的高效、可靠運行提供了堅實基座。
版權所有,未經許可不得轉載
-金年會體育