微軟周一(5/19)透過GitHub開源了NLWeb專案,它的全名為Natural Language Web,導入NLWeb的網站將可讓使用者以自然語言查詢網站資料。簡單地說,啟動NLWeb服務之後,網站便可接上如同ChatGPT般的對話介面。
NLWeb是由曾發明內容訂閱協定RSS、網頁內容標註標準Schema.org,以及資源描述框架RDF的R.V. Guha所構思及開發,已擔任十多年Google院士的Guha最近加入了微軟,成為微軟院士暨企業副總裁。
根據微軟的說明,NLWeb是利用包括Schema.org與RSS等半結構化的格式,以及網站已發布的其它資料,再透過基於大型語言模型(LLM)的各種工作,來建立可同時供人類及AI代理使用的自然語言介面。
每一個NLWeb實例都是一個模型脈絡協定(Model Context Protocol,MCP)伺服器,讓網站得以開放自己的內容,以供其它代理或MCP生態系統的參與者發現及存取。微軟期望NLWeb最終可在新興的代理網頁(Agentic Web)中扮演類似HTML的基礎角色。上述的MCP是由Claude模型開發商Anthropic所開源的標準,讓AI助理得以透過該協定存取所有資料來源。
NLWeb系統可藉由整合底層LLM的外部知識來強化此一結構化的資料,例如在餐廳的查詢中加上地理資訊,以帶來更豐富的使用者經驗。
微軟亦強調,作為一個開源專案,NLWeb將保持技術中立,支援所有主流作業系統,也允許開發者自由選擇最適合的元件,涵蓋各種模型與向量資料庫。