最近开发了一个浏览器插件 Table Detection & Extraction,专门解决网页表格数据提取的痛点,想和大家分享一下。
平时工作中经常需要从各种网页上复制表格数据,比如 API 文档、数据统计页面等。传统的复制粘贴要么格式乱掉,要么需要手动整理,特别麻烦。
插件功能
- 智能识别:自动检测网页中的表格( 2 行 2 列以上的数据表)一键提取:鼠标悬停即可看到提取按钮,点击即可获取数据多格式导出:支持 30+ 种格式转换,包括 JSON 、Excel 、CSV 、Markdown 、SQL 、LaTeX 、HTML 、XML 、PDF 等跨浏览器:支持 Chrome 、Firefox 、Edge (插件审核中,通过后会在官网展示链接)
实际使用场景
就拿咱们 V2EX 来说,大家可以安装后试试这两个页面:
API 文档页面: https://www.v2ex.com/help/api
可以一键提取 API 接口表格,直接转换成 JSON 或 Markdown 格式用于文档
IPv4 子网查询页面: https://www.v2ex.com/tools/ipv4
子网信息表格可以直接导出为 Excel 或 CSV ,方便后续分析
安装方式
访问 https://tableconvert.com/ 页面,在 Data Source 区域可以看到 Chrome Extension 和 Firefox Add-ons 的下载按钮。
Product Hunt 发布:插件刚刚在 Product Hunt 上线: https://www.producthunt.com/products/table-detection-extraction欢迎大家去支持一下,谢谢!
为什么开发这个插件:作为程序员,经常需要处理各种数据格式转换。市面上虽然有一些工具,但大多需要手动复制粘贴,效率不高。这个插件的核心理念就是"所见即所得",看到表格就能直接提取,大大提升工作效率。
适用人群:
- 数据分析师:快速提取网页数据进行分析开发者:提取 API 文档、配置表格等产品经理:收集竞品数据、功能对比表学生/研究者:整理网上的数据资料
有兴趣的朋友可以试试,如果觉得好用的话,希望能给个好评支持一下!也欢迎大家提出改进建议。