微軟近日於自家雲端AI開發平臺Azure AI Foundry推出Deep Research SDK與API,以支援開發人員打造具備多步驟推理與分析能力的AI代理應用。
利用此SDK,開發人員可以快速將微軟企業級深度研究功能,整合到AI代理應用中。Azure的Deep Research功能,以Open AI的o3-deep-research模型為核心,由此模型調度不同模型和應用程式,來自動化完成多階段研究流程。
Deep Research研究流程第一階段是定義研究範圍。o3-deep-research模型會呼叫GPT-4.1與GPT-4o等模型,來分析使用者提示內容,以釐清查詢意圖、補充上下文,並劃定研究範圍。定義研究範圍
第二步是即時資料基礎蒐集,Deep Research會呼叫Bing Search等工具,從網路上搜尋各式資料,作為知識基礎(Grounding knowledge),以避免產生幻覺。第三步,o3-deep-research模型會綜合這些資料,來整合、分析與推論。微軟強調,推論過程中,模型會情境改變或獲得新洞察,來動態調整研究方向。推論結果,還會考慮到資料中的各種細節、趨勢、或潛在衝突情況。
第四步,模型會將推論結果輸出為結構化報告,記錄模型得出的答案,同時詳載模型推理過程、引用來源,以及研究過程中對使用者提出澄清請求。微軟希望,這能使企業更容易驗證AI研究結果,使Deep Research功能可用於關鍵任務場景,或高度監管產業。
開發者能透過API串接Deep Research到自建商業應用、內部入口網站、RPA工具,或其他AI代理。例如,將Deep Research代理串接到簡報製作代理,再串接到Email代理,就能自動化完成從研究、報告製作到通知主管的不同任務環節。
Deep Research採按Token計價模式。o3-deep-research模型每百萬次Token輸入為10美元、快取輸入(Cached Input)每百萬Token2.5美元、每百萬Token輸出則為40美元。呼叫Bing搜尋與用來進行較簡單任務的其他GPT模型呼叫費用另計。
目前,Deep Research處於公開預覽階段,開發者可至Azure AI Foundry平臺申請早鳥體驗。