index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html
![]()
文章探讨了IP库建设中骨干网络数据的重要性,以及其在网络排障、优化跨运营商及跨国网络中的作用。文章指出,维护高质量的IP库需要全球部署节点进行探测、进行Traceroute路径分析,并结合延迟、rDNS等数据进行综合判断。作者还分享了IP库建设的经验,并解释了为何不提供离线方案的原因,强调了数据准确性和动态更新的重要性,同时揭示了行业内IP库质量参差不齐的现状。
🌐 IP库在网络中的应用广泛,包括家庭宽带、服务器和网络设备。骨干网络是支撑互联网流量转发的关键基础设施,但常被忽视。
🔍 骨干网络数据对网络排障和优化至关重要。通过Traceroute等工具,可以分析网络路径,解决访问速度慢、跨运营商访问等问题。
💡 建立高质量的IP库需要全球部署监测节点,并进行Traceroute路径分析。结合延迟和rDNS等数据,可以提高IP地理位置的准确性。
🛡️ 作者解释了为何IP库数据采用API解析而非离线方案的原因,强调了数据动态性、维护成本以及防止数据被抄袭的重要性。
⚠️ 行业内IP库质量参差不齐,一些同行的数据准确性存在问题。公开监测点和Traceroute工具能帮助用户验证数据的可靠性。
原创 高春辉 2025-03-27 11:41 中国台湾
IP 在使用上,我们一般分为人在使用,比如家庭宽带、基站网络等等,还有就是给机器用的,比如服务器,当然还有一个小分支就是给网络设备使用,比如路由器、交换机等等,这些设备支撑了整个互联网流量的转发。我们在应用场景数据里的对应标签叫基础设施。

最近,陆续有客户来问骨干网络相关的问题,这个数据除了优化网络路径,我相信跟三大运营商都在做跨省结算以及跨市结算的事情也有一定关系吧。一般而言,IP 在使用上,我们一般分为人在使用,比如家庭宽带、基站网络等等,还有就是给机器用的,比如服务器,当然还有一个小分支就是给网络设备使用,比如路由器、交换机等等,这些设备支撑了整个互联网流量的转发。我们在应用场景数据里的对应标签叫基础设施。而平时大家通常只会关心人在用的部分和服务器在用的部分,骨干网络或者基础设施这块 IP 其实大家并不太关心。只有当要做网络排障或者网络优化的时候,才会想起它,比如下面的例子:众所周知 8.8.8.8 的用途,但是从你的使用网络要途径那些地理位置以及运营商才能访问到,可能很多人在正常的情况下并不知道,也并不关心,但是一旦出现异常情况,比如不能访问或者使用体验变慢不能接受,往往都会去看看路径关系以方便排查故障。这张图里中间部分所展示的 IP 就是中国移动的骨干网络专用。对于经常看 Traceroute 数据的人来说,这些 IP 段应该可以倒背如流了。还有一种需求就是网络优化,尤其是跨运营商以及跨国网络进行优化,由于都是通过 BGP 协议进行互联,上游网络一旦有抖动或者故障,或者因为成本问题要更换上游,都可能会导致你的访问体验变慢,这也是为啥很多 VPS 商很多会强调回国优化或者提供比如 Looking Glass 等工具或者测试 IP、测试文件下载来让你进行事先体验网络质量了,比如你要买一个洛杉矶的 VPS 节点,买完了才发现访问慢,即使能保证退款,你的时间精力也浪费掉了,沉没成本啊。就现在已经是 2025 年了,你从国内三大运营商去访问香港的 IP,很多时候也会绕道美西或者日本东京或者新加坡的情况还是非常常见的。而想做好 IP 库,你最起码要在全球部署足够的节点进行探测,我们目前公开的节点就有以下这么多:其中大部分是 VPS,少部分是实体服务器,大部分是自行购买,少部分是赞助使用。基本上在 VPS 领域你知道的我们都知道,还有一大堆你不知道的,论 VPS 的熟悉程度,估计我们称第二,那就没有第一了。现在的状态是好容易找到一个 VPS 网站,注册之后发工单询问,要么只支持本国支付方式,要么不卖给国外的人。。。

还要说一句,除了公开的监测点,我们还有未公开的监测点,数量嘛,你猜。。。

而且为了把 IP 库数据做好,还有一个重要的环节,就是我们上面提到 Traceroute 路径分析,严格来说可以算是把数据做对前提下的可视化,再基于访问延迟 / rDNS 等数据,也包括基于 Traceroute 上下游路径的预测,方便我们自己分析我们 IP 标注的对不对。比如,拿一个 61 打头的中国联通的 IP 举例,就在本月初已经从一个直辖市更换到了另外一个南方省份,看 Traceroute 路径情况就可以知道已经换地方了,而到目前为止,我们的国内外所有同行标注的都是错误的位置:说起监测点来,我们同行要么只在网页上写有多少多少个,却并没有公开让大家使用,毕竟 VPS 再低的配置给的流量,也足够探测使用之外还有富裕度去公开使用,不然放在哪里也是浪费资源,公开的好处一方面是当宣传吸引有需求的潜在客户,同时也是让大家可以自行验证的好方式,你说你做的好,为什么不能公开让大家自行做验证呢?要么类似我们这个同行目前网页上号称有 200 多个,但是之前公开的也只有 20 多个吧,现在这个时间点我过去看了一下,好嘛,空白了,一个都没了,这是公司降本增效的结果吗?当然,即使你有监测点,毕竟这个花钱买就行,你的数据能不能做到位才是核心问题,比如中间的 IP 给的地理位置乱七八糟,根本没法让人相信,那就会进一步被质疑数据质量有问题。比如我们海外这个同行提供的 Traceroute 网页版的结果:明明给的服务器节点是意大利,但是第二跳 0.79 毫秒标注的却是罗马尼亚布加勒斯特,而第三跳根据 rDNS 的结果应该是瑞士苏黎世州苏黎世,他们依然标注罗马尼亚布加勒斯特,而第四跳第六跳明明只有 20 毫秒左右的延迟,却标注成了美国加利福尼亚州山景城,一共展示了四跳,没一跳是对的,我也不是故意找的,随意搞一个就是如此。。。顺便说一句,这家公司的 IP 库 的业界评价是比较烂的,经常有朋友吐槽说反馈了正确位置之后,改正过来之后,下一个月版的本,又被改成错误位置的了的奇葩经历。所以你知道国内公司除了我们,我们的那几个同行都不提供公开监测点以及 Ping / Traceroute 工具的原因了吧?工具做的好的价值就在于很多东西解释起来比较简单,比如前几天有客户在支持群里问,为什么这个 IP 我们只有我们标注在巴西?我直接用 BestTrace 执行 Traceroute 操作,然后截图就不用再仔细解释了。大家都省事。综上,最后再总结解释下这个骨干网络数据只能用 API 提供解析却不能提供离线方案的原因:1、这部分数据会采用延迟以及 Traceroute 上下文预测以及 rDNS 解析(也有数目巨大的黑名单)进行综合判断输出,并未完全依赖 IP 数据库,而且变化很快,量级不低,而且写入到 IP 库内的意义不如用目前这种动态执行的方案更好。2、我们这么多年下来,被同行们抄袭的非常难受,而这个作为制作高质量 IP 库的核心数据不想因为客户的不负责任或者其它各种原因导致流出到同行那里,又让他们宣称自己也行了,我们只会更难受。你看他们可以宣称很多对标我们的东西,检测点啦,数据量啦,人员数量啦,更新量啦,哦,最近又开始吹 AI 制作了,都可以不负责任的任意编造,主打的就是事事都要压我们一头。但是属于数据制作上有严重强依赖的监测点公开和 Traceroute 可视化为啥不能拿来拼命吹呢?因为一方面成本要变高了,利润就变少了,因为真买那么多节点是要花很多钱的,第二都不是认真做数据,都是拼凑而来的数据,自己都不知道自己的数据啥情况,如果都跟我们国外同行展示的结果那样错误百出,怎么跟客户吹自己的数据是 100% 正确呢?以上,还有疑问请留言。至于前面提到的三大运营商都在做跨省结算以及跨市结算的事情,后面再单开文章吧。
阅读原文
跳转微信打开