去年,当我为一家公司做一款解析求职者简历的系统,但是经过实测,我们遇到了一个令人沮丧的问题——我们的系统能够完美解析求职者简历,却无法获取最新的职位市场数据。系统推荐的"热门职位"实际上是三个月前就已下架的岗位,而所谓的紧缺技能早已市场饱和,这是十分难受的。
上面的经历正是当前AI应用面临的普遍困境。其中实时数据获取困难是最主要的瓶颈。传统的数据采集方式(如网络爬虫)不仅开发周期长,还需要持续维护以应对网站改版,尤其是各种反p技术,实在令人头疼不已!本节我将介绍一款工具,更高效更便捷的解决这一痛点!
一、MCP深度解析
1.1、什么是MCP?
Model Context Protocol(MCP)是一种提供的开放协议,它充当AI模型与外部数据源/工具间的标准化桥梁。简单来说,MCP定义了一套通用语言,使得任何支持该协议的AI应用都能无缝接入各种数据服务,而无需关心底层实现细节。
MCP采用客户端-服务器架构,核心包含三个角色:
- MCP主机(Host) :发起请求的AI应用(如我们即将构建的AI职位推荐助手)MCP客户端(Client) :负责通信转发的中间层MCP服务器(Server) :提供实际数据和工具的服务端
1.2、MCP支持的行业与数据类型
本节介绍的BrightData MCP覆盖了广泛的行业领域,例如下面几个
- 职业推荐与职业发展
- LinkedIn职位数据(职位名称、公司、薪资范围、技能要求等)Indeed招聘信息Glassdoor公司评价与薪资数据
- 企业信息
- Crunchbase公司资料(融资情况、规模、行业)企业官网数据新闻与媒体报道
- 技能与教育
- 在线课程平台数据(如Coursera、Udemy)技术认证数据库行业技能需求趋势
这些数据通过MCP接口提供时,已经过标准化处理,省去了繁琐的数据清洗步骤。例如,不同平台对"Python编程"技能可能有多种表述方式(Python3、Python开发等),MCP会统一为标准化技能标识,极大提高了后续匹配的准确性。
1.3、MCP的五大核心优势
相比传统数据获取方式,BrightData MCP在构建AI职位推荐智能体时展现出显著优势:
- 开箱即用的结构化数据实时性保障绕过技术限制统一接口,降低复杂度弹性扩展能力
特性 | 传统爬虫 | BrightData MCP |
---|---|---|
开发周期 | 数周至数月 | 数小时至数天 |
维护成本 | 高(需持续适应网站改版) | 低(由BrightData维护) |
数据质量 | 需要大量清洗 | 开箱即用的结构化数据 |
实时性 | 难以保障 | 高(专业代理网络) |
扩展性 | 有限 | 近乎无限 |
合规风险 | 高 | 低(专业法律团队保障) |
二、实战:构建AI职位推荐助手
现如今AI崛起,我们在求职找工作的时候,难免会遇到求助大模型的时候,下图为一段求助文心一言的问答,结果不是很如意,他仅仅能根据网络搜索给你一个大概的答案,但是无法获取实时的数据,这是一大痛点:
接下来我将实测一款能实时获取数据的工具,BrightData MCP,具体效果请看下文
2.1、设置BrightData MCP环境
首先,我们需要配置对BrightData MCP的访问:
注册BrightData账号并获取API密钥,获取完密钥后,接下来我们需要在https://github.com/brightdata/brightdata-mcp?tab=readme-ov-file
的官方示例中添加config到Claude Desktop,没有Claude的小伙伴可以自行去下载安装,不会科学上网的小伙伴也可以使用ChatboxAI,都是可以集成BrightData MCP的。
对于Claude Desktop的用户,我们可以跟着官方文档的步骤,找到配置文件:Go to Claude > Settings > Developer > Edit Config > claude_desktop_config.json to include the following:
将下方的内容粘贴过去,注意修改自己的密钥:
{ "mcpServers": { "Bright Data": { "command": "npx", "args": ["@brightdata/mcp"], "env": { "API_TOKEN": "<insert-your-api-token-here>", "WEB_UNLOCKER_ZONE": "<optional if you want to override the default mcp_unlocker zone name>", "BROWSER_ZONE": "<optional browser zone name, defaults to mcp_browser>" "RATE_LIMIT": "<optional rate limit format: limit/time+unit, e.g., 100/1h, 50/30m, 10/5s>" } } }}
成功之后我们重启Claude Desktop,不报错且有下面的样例代表成功了。
温馨提示:在配置Claude Desktop的时候 Node.js LTS 版本(v18.x/v20.x)别太高
对于ChatboxAI的用户同上,在设置里面找到MCP:
添加一下自定义的MCP服务器,配置文件同上也是json格式的:
我们点击Just chat界面,点击下面的小锤子,开启Bright Data即可
2.3、系统架构设计
本节我将设计一个AI职位推荐助手的智能体,下图是一个完整的系统架构设计:
在这里,我们通过对话框输入自然语言后,交给大语言模型进行处理,这一过程是理解用户意图,也是方便交给BrightData MCP进行采集数据,经过采集到的数据要和用户输入的关键参数相匹配,进行过滤排序,最后返回的结果呈现到用户界面。
2.3、系统角色设定
我这边设计了一个Prompt,这是确保AI职位推荐助手专业性的关键。以下是完整的系统角色设定Prompt模板,你可以选择直接调用:
基础角色设定:
AI猎头专家,专注于通过 LinkedIn、Indeed、Glassdoor 的实时招聘数据,为科技从业者提供精准职位匹配。具备 技能解码、市场趋势分析、职业路径规划 三大核心能力,确保推荐职位符合用户技能、薪资预期、公司文化偏好。
2.4、职位匹配演示
接下来我来问问我构建的这个智能体
我是一位资深的Python开发从业者,现在我想要找工作,地点不限,月薪10k以上,技术不限
可以看到现在Agent调用MCP获取符合的工作:
下图是部分工作,这里附上了职业链接,还是蛮贴心的哈
现在我想要缩小地区,我只想要寻找深圳的相关工作,我们等待片刻,下方展示了部分数据,包含多个平台
接下来我们增大检索参数,我想汇总一下深圳目前什么岗位薪资最高,下图可以清楚的看到薪资高的几个方向,感兴趣的小伙伴可以放心冲了!
三、BrightData MCP优势
通过上述案例我总结了BrightData MCP的几点优势:
效率高:首先是开发效率提升了,之前采集数据,需要了解网页结构,应对反p技术,现在交给MCP就可以了
维护低:当目标URL页面更改的时候,换做之前,我们可以还需要大改程序,现在这些烂摊子交给专业团队即可,维护成本趋近于零
保障强:作为专业的数据平台,合理合法,降低采集过程的法律风险
扩展强:平台可以轻松应对流量高峰期,再也不用担心采集不到数据了
四、总结
随着MCP生态系统的成熟,AI职位推荐助手可以进一步扩展以下能力:
- 多平台数据融合:结合LinkedIn公司官网数据,提供更全面的职位视图,帮你更快找到心仪的工作职业路径规划 :分析技能差距,推荐培训课程和认证,帮助用户提升竞争力,打败你的竞争对手薪资谈判支持 :基于实时市场数据,提供个性化的薪资谈判建议,让新人也能拿高薪,这点我喜欢!企业端应用 :反向帮助HR筛选候选人,实现双向智能匹配,便捷你我他~
对于想要尝试BrightData MCP的开发者,请看下面操作:
- 注册BrightData账号
访问BrightData官网获取免费试用额度探索MCP文档
学习如何使用各种预构建的MCP服务器BrightData MCP github仓库:github.com/brightdata/…教你如何快速搭建~
AI职位推荐助手只是MCP技术的应用场景之一,同样的模式可以复制到电商推荐、金融分析、市场研究等领域。随着MCP生态的丰富,开发者将能够像搭积木一样,快速构建各种数据驱动的智能应用,真正释放AI的商业价值。