以Magentic-UI为例，简单聊一聊，跑一跑，测一测，比一比，多智能体的能力

聊一聊

微软最近开源了一个名为Magentic-UI的智能体研究项目，这是一套基于多Agent、以人为中心设计的人机交互界面系统。它特别擅长处理网络上的任务，如填写表单、定制视频内容等，并能够生成及执行代码与文件。不同于其他浏览器代理工具，Magentic-UI提供了透明且可控的操作环境，促进了更加高效的人机协作。该平台依托于AutoGen技术构建而成，具备多项特色功能：支持人类协作规划与任务合作；实施行动保护机制确保安全；具备计划学习与检索能力以提升自动化效率；还支持并行任务执行来提高工作效率。简而言之，Magentic-UI开启了一种新颖的人机互动模式，极大地简化了复杂的网络操作流程。

更多关于Magentic-UI的介绍，可以浏览他们的项目主页：github.com/microsoft/m…

跑一跑

官方文档里已经有详细的部署流程了，但主要是基于OpenAI API的方式，众所周知，这种方式对国内大部分用户来说是有困难的。我这里就以官方介绍的另外一种方式来部署，也就是Azure OpenAI API的方式。当然官方也提供了包括OpenRouter和本地Ollama的方式这不是本篇重点，我们不在赘述。

前置要求

Azure

Docker

Azure CLI

部署

创建python虚拟环境

python3 -m venv .venvsource .venv/bin/active

或者

uv venv --python=3.11 .venv. .venv/bin/activate

安装Magentic-UI

pip install magentic-ui# 或者uv pip install magentic-ui

等待一段时间

启动

magentic ui --port 8081

第一次启动的话，这个要等挺长时间的，因为要构建容器镜像，安装一堆依赖等等，倒是不用一直看着它，官方文档里也说了，你可以去做杯咖啡喝。

但是后续启动就快了。

下图是启动后的样子和docker desktop里额容器状态

注意

在启动之前，或者启动之后，在另开一个终端窗口，登录你的azure账号。

az login

该步骤仅Azure OpenAI的方式需要，这是基于微软的认证授权机制，比起API Key的方式更加安全，但代价就是流程稍微多一点。

验证结果

完成上述步骤后，就可以打开浏览器，看到Magentic-UI的庐山真面目了

测一测

完善配置

成功启动之后，需要先调整一下配置，调整成Azure OpenAI 的方式，当然如果你有OpenAI的key，就用自己的就好。

点击界面右上角的⚙️图标，进入配置页，可以看到他这里支持OpenAI，Azure，OpenRouter，Ollama（也就是本地）几个方向，OpenRouter的方式我没试过，看着应该和国内硅基流动那种平台的方式很像，大家也可以自己试试，Ollama的话，我本地电脑配置有限也忽略了，这里就以Azure的方式进行配置。

这里，可以导入Yaml文件，也可以用它的模版，然后把关键参数改成自己的就好