V2EX 9小时前
[分享创造] 如何为导航站获取干净的截图和内容?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了一款名为screenshotapi.online的API工具,它专注于解决基于Next.js部署的服务在截图时遇到的问题,如不便使用Puppeteer、部分网站存在隐私弹窗和广告影响截图质量、以及如何获取网站图标和干净的网页内容进行AI分析等。该工具整合了这些功能,提供高质量截图服务,支持多种图片格式、设备模拟、自定义截图设置,并能移除广告和弹窗。此外,它还能从网页中提取网站图标,并以Markdown或原始格式获取网页内容,同时内置Playground方便用户调试和生成代码。

🚀 **高质量截图与灵活配置**:screenshotapi.online提供高质量的截图服务,支持PNG、JPEG、WebP等多种图片格式,并具备压缩功能。它允许用户模拟设备,内置随机User-Agent,并支持自定义视口(viewport)、加载/等待时机,甚至可以注入JavaScript和CSS,实现全屏截图,有效解决了传统截图方式中可能遇到的弹窗和广告干扰问题。

🌟 **网站图标提取**:该工具能够直接从网页中提取网站的图标(favicon),这对于需要展示网站标识或进行网站分类的用户来说非常实用,简化了获取网站图标的流程。

📄 **网页内容提取与格式化**:screenshotapi.online支持获取网页的干净内容,并能将其转换为Markdown格式或保留原始格式。这为后续的AI分析或内容处理提供了便利,确保了输入数据的质量和可用性。

🎮 **内置Playground方便调试**:产品内置了一个Playground功能,用户可以在此直接调试API请求,并生成相应的请求代码,极大地提高了开发效率和用户体验,使得API的集成和使用更加便捷。

大家好。

在之前我开发了两个导航站,一个开源的aigotools 和一个闭源的similarlabs。两个产品都是基于 nextjs 开发的,nextjs 部署在 vercel 或者 cf 上就有一个问题,它不方便使用 puppeteer 截图。为了截图我把截图服务单独提了出来,部署在一台服务器上,后面又发现了些问题:

    这个服务不常用但是需要保证稳定有部分网站首页会有隐私政策弹框和广告,会影响截图质量如何获取网站图标如何获取干净的网页内容供 ai 分析

在做了两个导航站后,我想着把这些功能抽离出来,单独做成一个服务,于是就有了 https://www.screenshotapi.online 这个网站。一个支持高质量截图、获取网页图标、网页内容的 api 工具。

核心功能

截图

    支持 png 、jpeg 、webp 多种图片格式、自带压缩功能支持设备模拟,内置随机 useragent ,支持自定义 viewport 、加载/等待时机支持注入 JavaScript 和 css支持全屏截图支持广告移除、隐私政策弹框移除等 gonna

网站图标

    从网页中提取网站图标

内容提取

    支持获取 markdown 格式或原始格式的网页内容

Playground

产品内置了一个 Playground ,用于调试请求和直接生成请求代码。

产品地址

https://www.screenshotapi.online

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

截图API 网页内容提取 网站图标 Puppeteer替代 ScreenshotAPI
相关文章