【jinnianhui科技消息】2月4日,深度研究智能體DeepResearch Bench評測榜單正式揭曉,百度千帆深度研究Agent(Qianfan-DeepResearch Pro)憑借卓越的端到端研究能力和極高的報告產出質量,登上榜首。

據jinnianhui了解,該榜單針對當前AI評測體系在通用任務上的局限性,專門填補了“端到端深度研究”領域的空白。與以往僅測試單一能力的基準測試不同,DeepResearch Bench設置了100個博士級別的復雜任務,涵蓋22個學科,并引入RACE報告質量評價框架與引文準確性評估,以此作為衡量AI生產力水平的標準。

在此次評測中,千帆深度研究Agent憑借其卓越的技術設計脫穎而出。該系統采用了Agentic架構,能夠通過“任務理解-規劃-執行”的機制,利用百度強大的搜索與RAG技術,確保信息獲取的廣度與可信度。在任務執行過程中,該Agent采用“由粗到細”的研究路徑展開方式及實時反思機制,能夠在每個研究節點動態評估進展、調整策略,有效避免幻覺與路徑偏離。
不僅如此,千帆深度研究Agent在報告生成階段采用了兩階段渲染機制:首先產出邏輯嚴密的pivot報告,隨后基于該報告生成Markdor:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫n、HTML、PPT等多形態文檔,實現“一次研究,多形態報告”的交付。
目前,深度研究Agent已正式上線百度千帆平臺。用戶只需輸入復雜的調研需求,系統即可在十幾分鐘內生成帶有精準引用的專業級研究報告,顯著壓縮了傳統需數日完成的手動研究時間,實現了學術綜述、金融投研與商業分析等領域的“分鐘級”深度洞察交付。
版權所有,未經許可不得轉載
-金年會體育