掘金 人工智能 05月30日 11:58
手把手教你自研澎湃新闻 Coze 插件,打造智能体新境界
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文详细介绍了如何利用Coze平台构建一个能够自动发布新闻的智能体。首先,文章将智能体任务拆解为获取新闻标题、清洗标题、添加微语和保存新闻到数据库等步骤。重点在于第一步,即通过自定义插件从澎湃网获取新闻数据。文章详细分析了澎湃网的接口,并指导读者如何编写Coze插件,包括新建插件、创建工具、编写代码、设置输出参数以及测试和发布插件。最终,读者能够掌握从数据源获取新闻标题的关键技术,为构建完整的新闻智能体打下基础。

📰 智能体构建的起点:文章首先将构建新闻智能体的任务分解为多个子任务,重点关注从新闻网站获取新闻标题。

🌐 数据源的选择与分析:作者选择了澎湃网作为新闻数据来源,并深入分析了其API接口,为后续插件开发做准备。

🛠️ Coze插件的开发流程:详细介绍了在Coze平台上创建插件、添加工具、编写代码、设置输出参数,以及测试和发布插件的完整流程。

🔑 核心技术:通过分析API接口和编写代码,实现了从澎湃网获取新闻标题的功能,为构建完整的新闻智能体奠定了基础。

不知道大家有没有看过下面的这种新闻,主打的是一分钟知天下事

上面的内容是来自某微信公众号的,公众号的数据还很好

那能不能利用 Coze 平台搭建一个智能体?每日自动发布这种新闻呢?答案是肯定的,下面就一步步的来搭建这个智能体。

拆解智能体

搭建智能体前先对智能体要做的任务做一个拆解,这个新闻的智能体可以拆解为以下几部分:

本篇就先来完成第一部分——到各大网站获取新闻。

经过前面文章的学习,已经知道要完成某个功能,可以在工作流种加入具体的插件,这里要获取每天的新闻,那就看下插件市场有没有符合我们需求的插件。

新闻类的插件有 37 个,我选择了几个看了下,这些获取新闻的插件有的是需要输入特定的关键词获取指定关键词的新闻,有的直接就是获取某方面的新闻,如 AI 类的新闻。

我们需要的是综合类的新闻,如国际、财经、科技等,显然目前的插件满足不了需求。那怎么办呢?这就需要我们自己去找符合我们需求的新闻网站,我搜索了几个新闻类的网站,最后发现澎湃网比较符合需求,看下它的首页

它首页的数据就比较综合,像“国际“、“财经“,这种新闻都有。现在又有问题了,如何在 Coze 工作流种获取这个网站的数据呢?这时就需要本篇的重点出场了——自定义插件,可以写一个 Coze 插件来获取澎湃网首页的新闻数据。

编写Coze插件

那怎么获取这些首页数据呢?有网页开发基础的人应该都知道,可以F12 打开浏览器的开发者工具 来分析这个界面

这里的数据是通过接口返回给网页的,有的网页的数据是直接在返回网页的标签里面,不同的返回方式提取数据的方法也不一样:

接口数据解析

数据是通过接口返回的,那就需要发起接口请求,可以复制请求这个接口curl进行分析:

下面是复制出来的curl内容

curl ^"https://api.thepaper.cn/contentapi/wwwIndex/recommendNewsRadicalChannelsPage^" ^  -H ^"accept: application/json^" ^  -H ^"accept-language: zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7^" ^  -H ^"client-type: 1^" ^  -H ^"content-type: application/json^" ^  -b ^"Hm_lvt_94a1e06bbce219d29285cee2e37d1d26=1743249122; Hm_lpvt_94a1e06bbce219d29285cee2e37d1d26=1743249122; HMACCOUNT=7266706C3BD311EA; ariaDefaultTheme=undefined; tfstk=gNTxtUq5IYDcUbQnoqiuSiU_9wGotFd4iKRQSOX0fLpJOBycfOYgWC9M1nfM1x-9eZ8kmPXm3Nd6KNHnK20HgISF5vDnZkc6DN1sSOilcoCwFKMnK20uXOc6qvvDr2JSy1W5G1sffbB5_67_hs91Fg1Ct-_15dGRP6fgc-11c_65tT615N96NbCiNDhAUq1UWHM7i8gjTT4_5UCAV0AfFl6yysIAdITY5PONMiBBGTHe5crVVCS975zOXIteQ69bhvj213pRMN3ucwOJfpCyl22AanAWtTOL_PRVk1IC5gF_5QQVFMT5R2wRa3ODfEJY6P12oejOLgh_7GbW-MtBH5leNZ16QM8iLrWX1B8exw3ucwOJfpKO49YHJHSUKa64cbh8blSfaX4OpPbWMMT1w9cfclrNvU5RKbh8blSfg_BnGzrabgVA.^" ^  -H ^"origin: https://www.thepaper.cn^" ^  -H ^"priority: u=1, i^" ^  -H ^"referer: https://www.thepaper.cn/^" ^  -H ^"sec-ch-ua: ^\^"Chromium^\^";v=^\^"134^\^", ^\^"Not:A-Brand^\^";v=^\^"24^\^", ^\^"Google Chrome^\^";v=^\^"134^\^"^" ^  -H ^"sec-ch-ua-mobile: ?0^" ^  -H ^"sec-ch-ua-platform: ^\^"Windows^\^"^" ^  -H ^"sec-fetch-dest: empty^" ^  -H ^"sec-fetch-mode: cors^" ^  -H ^"sec-fetch-site: same-site^" ^  -H ^"user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Safari/537.36^" ^  --data-raw ^"^{^\^"filterIds^\^":^[30523667,30522994,30522261,30522805,30523093,30522904,30523679,30523141,30523079,30522791,30523591,30522249,30523081,30523080,30523436,30522799,30523118^],^\^"nodeIds^\^":^[143064,26916^]^}^"

请求参数有两个字段,filterIdsnodeIds**nodeIds**** 就是新闻类型“实事” “国际”这种**,filterIds不知道是什么,那就先把这个请求字段删了,看下接口是否会返回数据,试了一下可以返回数据

接下来还要确定nodeIds 字段里的内容是哪里来的?经过分析是另外一个接口getWwwAllNodes返回的

好了,现在就清晰了,首先要请求getWwwAllNodes 接口获取有哪些新闻数据类型,然后再把这些类型数据作为recommendNewsRadicalChannelsPage 接口请求的参数获取具体的新闻标题。已经知道了怎么获取新闻数据,接下来就是写插件了。

新建插件

新建插件和新建工作流一样,到Coze 的“工作空间“,点一下右上角的“资源“按钮,选择插件就行。

上面是新建插件,插件要完成具体功能还需要新建工具,它们的关系如下

插件创建了之后,还需要创建插件里的工具

点击按钮之后,就到了下面的页面

再点击“添加工具”按钮,添加工具,输入名称和描述即可

完成后,就到了编写工具的界面,如下

可以看到这个界面有三部分,左边的是显示工具列表和添加运行代码需要的依赖包,中间的是写代码的区域,右边的是调试代码用的,可以设置输入来查看输出是否正确。接下来就要在代码编辑区编写代码了。

插件编写

有了大模型,现在写代码已经不是问题了,把复制出来的 curl 内容发给deepseek,让他来完成代码的编写

把写出来的代码放到coze插件的代码区里面就可以了

然后在元数据里面新增输出参数

最后,将处理后的新闻标题赋值给新建的输出参数,代码如下

代码编写完成后,可以在“测试代码区“运行下,看下输出的结果是否符合预期

运行没问题之后,将插件发布,就可以在工作流中引入插件了。

总结

本篇首先对要做的新闻智能体进行拆解,拆解后发现需要获取新闻的插件,现在Coze 插件市场里的插件不能满足我们的需求,通过搜索后选择了澎湃网作为新闻的数据源,最后,自己动手实现了获取澎湃网新闻的插件。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Coze平台 智能体 新闻爬取 自定义插件
相关文章