Google釋出Data Commons平臺全新Python函式庫正式版,並同步升級資料查詢介面至V2 REST API。新版本函式庫在功能性、彈性與整合性上較前代提升,供資料科學家、開發人員與分析師能更有效率地查詢、比對並運用龐大的公開統計資料集,加速資料驅動專案開發與決策流程。
Data Commons由Google主導,是開放且持續擴充的知識圖譜平臺,彙整來自全球各地的公開統計資料。平臺目前涵蓋超過20萬項統計變數,資料範疇涵蓋人口、經濟、教育、能源、環境、健康、住宅等。這些資料來源多元,包括國際組織、各國政府機構、研究單位與非營利組織。
Google本次推出的V2 Python函式庫,不僅回應技術社群對更高效資料處理能力的要求,更整合了Pandas Dataframe模組,使查詢結果能直接以開發者熟悉的資料框架操作。開發者安裝單一套件後,便可在同一程式流程中進行資料擷取、轉換、分析與視覺化,大幅簡化跨平臺應用與工具鏈整合技術門檻。函式庫同時支援多種資料回應格式,包括JSON、Python字典與清單,方便整合各類分析及人工智慧模型訓練環境。
V2版本強調型別安全與驗證,內建Pydantic驗證框架,強化資料序列化與結構一致性,也進一步提升API金鑰管理等狀態操作的彈性。新函式庫也針對常見查詢情境設計多種方便的方法,像是指定統計變數後即可一鍵擷取全球或區域性資料,查詢特定指標隨時間的變動趨勢,以及資料實體之間的映射,適合跨資料集比對或資料串接應用。
官方建議原本已使用V1 API的現有用戶儘速升級,V1版本之後將進入淘汰流程,不再支援新功能或安全性更新。
此次升級也特別強化自訂Data Commons實例的能力,各組織如聯合國、ONE Campaign等,能在自有基礎設施上架設專屬的Data Commons節點,並無縫整合組織內專有資料以及全球公開知識圖譜,且同時保有資料自主權與存取控管。新函式庫支援對公有或私有實例的程式化查詢,適用於混合雲、地端部署或多方資料交換需求。