V2EX 前天 17:23
[分享创造] 如何为导航站获取干净的截图和内容?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

作者在开发Next.js导航站时,遇到了使用Puppeteer进行网页截图的难题,特别是处理隐私弹窗、广告干扰以及获取网站图标和干净网页内容等问题。为解决这些痛点,作者抽离相关功能,开发了screenshotapi.online服务。该服务专注于提供高质量的网页截图API,支持多种图片格式、设备模拟、自定义截图参数,并能移除广告和隐私弹窗。此外,它还能提取网页图标,并提供markdown或原始格式的网页内容提取功能,内置Playground方便用户调试。

🚀 **高质量网页截图API:** screenshotapi.online 旨在解决开发者在Next.js等框架下使用Puppeteer截图时遇到的挑战,提供稳定、高质量的截图服务,支持PNG、JPEG、WebP等多种格式,并具备压缩功能。

📱 **强大的截图定制能力:** 该API支持设备模拟,可随机生成UserAgent,自定义视口(viewport)大小,以及控制加载和等待时机,还能注入JavaScript和CSS,实现全屏截图,并能移除广告和隐私政策弹框,确保截图的干净与准确。

✨ **便捷的网页信息提取:** 除了截图,该服务还提供提取网页图标的功能,方便网站集成。同时,它能够提取网页的干净内容,并支持输出为Markdown格式或原始HTML格式,为AI分析等应用提供便利。

💡 **内置调试与开发助手:** 为方便用户快速上手和调试,screenshotapi.online 内置了一个Playground,允许用户直接测试API请求并生成相应的请求代码,极大地提升了开发效率。

大家好。

在之前我开发了两个导航站,一个开源的aigotools 和一个闭源的similarlabs。两个产品都是基于 nextjs 开发的,nextjs 部署在 vercel 或者 cf 上就有一个问题,它不方便使用 puppeteer 截图。为了截图我把截图服务单独提了出来,部署在一台服务器上,后面又发现了些问题:

    这个服务不常用但是需要保证稳定有部分网站首页会有隐私政策弹框和广告,会影响截图质量如何获取网站图标如何获取干净的网页内容供 ai 分析

在做了两个导航站后,我想着把这些功能抽离出来,单独做成一个服务,于是就有了 https://www.screenshotapi.online 这个网站。一个支持高质量截图、获取网页图标、网页内容的 api 工具。

核心功能

截图

    支持 png 、jpeg 、webp 多种图片格式、自带压缩功能支持设备模拟,内置随机 useragent ,支持自定义 viewport 、加载/等待时机支持注入 JavaScript 和 css支持全屏截图支持广告移除、隐私政策弹框移除等 gonna

网站图标

    从网页中提取网站图标

内容提取

    支持获取 markdown 格式或原始格式的网页内容

Playground

产品内置了一个 Playground ,用于调试请求和直接生成请求代码。

产品地址

https://www.screenshotapi.online

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

截图API 网页截图 Puppeteer 内容提取 网站图标
相关文章