#TRAE2.0SOLO出道
写在前面
至今还记得当年校招的时候,海投简历,每次投简历都需要填写一大堆的个人信息,之后还有做不完的测评,当时每天都要花费几个小时去处理这些事情。于是想着使用trae solo模式去试试能否解决这个问题。使用gemini research模式生成技术方案,然后自己整理语言输入给trae2.0,一步一步修改并输出结果。
(其实在当年秋招的时候就想过这些了,但是当时不了解AI,尝试用规则匹配HTML标签去匹配数据,但是发现各大网站的标签数据各不相同,就搁置了)
工作流程
- 📖 读取简历:从YAML文件读取你的个人信息🌐 打开网站:自动打开招聘网站的申请页面👁️ 分析页面:AI"看"页面,识别各种输入框✍️ 自动填写:把你的信息填到对应的地方🔍 检查结果:对比填写前后的截图,确保正确📊 生成报告:告诉你哪些填成功了,哪些需要手动处理
思路
其实思路并不复杂,主要是实现起来可能略有困难,就是通过LLM识别招聘网站的截图信息,确认好元素的相关信息,之后再通过prompt让LLM返回适当的内容,最后使用playwright、selenium自动化工具进行填写。
第一步:基本配置
- 生成yaml文件这个文件主要是写入一些简历信息,便于之后的数据读取
2.各种配置包括deepseek、浏览器配置、文件路径、ai参数等等
- prompt提示因为使用LLM去识别表单填写,所以需要返回特定的内容
- 映射策略使用传统选择器的正则匹配与AI识别相结合
第二步:AI能力
- 多模态处理数据
- 识别元素,找到目标,填写内容
- 页面截图与标注
第三步:集成deepseek
(目前为了省事只用了deepseek,但是发现deepseek对于图像识别能力好像弱了一些)
- 客户端封装
- 字段映射
第四步:表单自动填写
输入框
下拉框
上传文件
第五步:截图与对比分析
截图
截图分析
演示
写到最后
其实当前项目存在很多问题,目前静态网站的一些数据填写相对会比较准确,单页面应用还是有点困难的,很多项内容会填写失败。但是目前已经用了solo的90+对话轮次了,接下来要先学习下代码在继续更新了,后续会持续更新本帖,也会尝试更多简历网站,争取能够实现一个完全可用的自动化工具!