老高的互联网杂谈 04月05日 01:21
有关骨干网络的杂谈~
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文探讨了IP库建设的关键要素和面临的挑战,特别关注了骨干网络IP数据的准确性和维护。文章强调了IP库在网络排障、优化以及跨运营商结算中的重要性,并揭示了IP库建设中数据质量、监测点部署、Traceroute分析等方面的问题。作者分享了其在IP库建设方面的经验,并解释了为何其数据不能提供离线方案,以及如何应对同行竞争。文章还提到了跨省和跨市结算的趋势,并祝贺作者生日快乐。

🌐 IP地址使用场景多样:IP地址的应用涵盖家庭宽带、服务器、网络设备等,其中骨干网络IP在网络排障和优化中尤为关键,但往往被忽视。

🔍 数据准确性至关重要:高质量的IP库需要依赖全球部署的监测节点、Traceroute路径分析、延迟和rDNS数据,以及黑名单等多种因素综合判断,以确保IP地理位置的准确性。

💡 监测点公开与工具价值:公开监测点和提供Ping/Traceroute工具能方便用户验证数据,并简化问题解释。但一些同行因成本或数据质量问题,选择不公开监测点。

🛡️ 动态数据与保护:骨干网络数据依赖延迟、Traceroute上下文预测等动态因素,且变化迅速。为防止数据被抄袭,作者选择不提供离线方案,并持续优化数据质量。

原创 高春辉 2025-03-27 11:41 中国台湾

IP 在使用上,我们一般分为人在使用,比如家庭宽带、基站网络等等,还有就是给机器用的,比如服务器,当然还有一个小分支就是给网络设备使用,比如路由器、交换机等等,这些设备支撑了整个互联网流量的转发。我们在应用场景数据里的对应标签叫基础设施。

最近,陆续有客户来问骨干网络相关的问题,这个数据除了优化网络路径,我相信跟三大运营商都在做跨省结算以及跨市结算的事情也有一定关系吧。
一般而言,IP 在使用上,我们一般分为人在使用,比如家庭宽带、基站网络等等,还有就是给机器用的,比如服务器,当然还有一个小分支就是给网络设备使用,比如路由器、交换机等等,这些设备支撑了整个互联网流量的转发。我们在应用场景数据里的对应标签叫基础设施。
而平时大家通常只会关心人在用的部分和服务器在用的部分,骨干网络或者基础设施这块 IP 其实大家并不太关心。只有当要做网络排障或者网络优化的时候,才会想起它,比如下面的例子:
众所周知 8.8.8.8 的用途,但是从你的使用网络要途径那些地理位置以及运营商才能访问到,可能很多人在正常的情况下并不知道,也并不关心,但是一旦出现异常情况,比如不能访问或者使用体验变慢不能接受,往往都会去看看路径关系以方便排查故障。这张图里中间部分所展示的 IP 就是中国移动的骨干网络专用。对于经常看 Traceroute 数据的人来说,这些 IP 段应该可以倒背如流了。
还有一种需求就是网络优化,尤其是跨运营商以及跨国网络进行优化,由于都是通过 BGP 协议进行互联,上游网络一旦有抖动或者故障,或者因为成本问题要更换上游,都可能会导致你的访问体验变慢,这也是为啥很多 VPS 商很多会强调回国优化或者提供比如 Looking Glass 等工具或者测试 IP、测试文件下载来让你进行事先体验网络质量了,比如你要买一个洛杉矶的 VPS 节点,买完了才发现访问慢,即使能保证退款,你的时间精力也浪费掉了,沉没成本啊。就现在已经是 2025 年了,你从国内三大运营商去访问香港的 IP,很多时候也会绕道美西或者日本东京或者新加坡的情况还是非常常见的。
而想做好 IP 库,你最起码要在全球部署足够的节点进行探测,我们目前公开的节点就有以下这么多:
其中大部分是 VPS,少部分是实体服务器,大部分是自行购买,少部分是赞助使用。基本上在 VPS 领域你知道的我们都知道,还有一大堆你不知道的,论 VPS 的熟悉程度,估计我们称第二,那就没有第一了。现在的状态是好容易找到一个 VPS 网站,注册之后发工单询问,要么只支持本国支付方式,要么不卖给国外的人。。。
还要说一句,除了公开的监测点,我们还有未公开的监测点,数量嘛,你猜。。。
而且为了把 IP 库数据做好,还有一个重要的环节,就是我们上面提到 Traceroute 路径分析,严格来说可以算是把数据做对前提下的可视化,再基于访问延迟 / rDNS 等数据,也包括基于 Traceroute 上下游路径的预测,方便我们自己分析我们 IP 标注的对不对。
比如,拿一个 61 打头的中国联通的 IP 举例,就在本月初已经从一个直辖市更换到了另外一个南方省份,看 Traceroute 路径情况就可以知道已经换地方了,而到目前为止,我们的国内外所有同行标注的都是错误的位置:
说起监测点来,我们同行要么只在网页上写有多少多少个,却并没有公开让大家使用,毕竟 VPS 再低的配置给的流量,也足够探测使用之外还有富裕度去公开使用,不然放在哪里也是浪费资源,公开的好处一方面是当宣传吸引有需求的潜在客户,同时也是让大家可以自行验证的好方式,你说你做的好,为什么不能公开让大家自行做验证呢?要么类似我们这个同行目前网页上号称有 200 多个,但是之前公开的也只有 20 多个吧,现在这个时间点我过去看了一下,好嘛,空白了,一个都没了,这是公司降本增效的结果吗?
当然,即使你有监测点,毕竟这个花钱买就行,你的数据能不能做到位才是核心问题,比如中间的 IP 给的地理位置乱七八糟,根本没法让人相信,那就会进一步被质疑数据质量有问题。
比如我们海外这个同行提供的 Traceroute 网页版的结果:
明明给的服务器节点是意大利,但是第二跳 0.79 毫秒标注的却是罗马尼亚布加勒斯特,而第三跳根据 rDNS 的结果应该是瑞士苏黎世州苏黎世,他们依然标注罗马尼亚布加勒斯特,而第四跳第六跳明明只有 20 毫秒左右的延迟,却标注成了美国加利福尼亚州山景城,一共展示了四跳,没一跳是对的,我也不是故意找的,随意搞一个就是如此。。。
顺便说一句,这家公司的 IP 库 的业界评价是比较烂的,经常有朋友吐槽说反馈了正确位置之后,改正过来之后,下一个月版的本,又被改成错误位置的了的奇葩经历。
所以你知道国内公司除了我们,我们的那几个同行都不提供公开监测点以及 Ping / Traceroute 工具的原因了吧?
工具做的好的价值就在于很多东西解释起来比较简单,比如前几天有客户在支持群里问,为什么这个 IP 我们只有我们标注在巴西?我直接用 BestTrace 执行 Traceroute 操作,然后截图就不用再仔细解释了。大家都省事。
综上,最后再总结解释下这个骨干网络数据只能用 API 提供解析却不能提供离线方案的原因:
1、这部分数据会采用延迟以及 Traceroute 上下文预测以及 rDNS 解析(也有数目巨大的黑名单)进行综合判断输出,并未完全依赖 IP 数据库,而且变化很快,量级不低,而且写入到 IP 库内的意义不如用目前这种动态执行的方案更好。
2、我们这么多年下来,被同行们抄袭的非常难受,而这个作为制作高质量 IP 库的核心数据不想因为客户的不负责任或者其它各种原因导致流出到同行那里,又让他们宣称自己也行了,我们只会更难受。你看他们可以宣称很多对标我们的东西,检测点啦,数据量啦,人员数量啦,更新量啦,哦,最近又开始吹 AI 制作了,都可以不负责任的任意编造,主打的就是事事都要压我们一头。但是属于数据制作上有严重强依赖的监测点公开和 Traceroute 可视化为啥不能拿来拼命吹呢?因为一方面成本要变高了,利润就变少了,因为真买那么多节点是要花很多钱的,第二都不是认真做数据,都是拼凑而来的数据,自己都不知道自己的数据啥情况,如果都跟我们国外同行展示的结果那样错误百出,怎么跟客户吹自己的数据是 100% 正确呢?
以上,还有疑问请留言。至于前面提到的三大运营商都在做跨省结算以及跨市结算的事情,后面再单开文章吧。
最后,祝自己生日快乐,知天命了。。。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

IP库 骨干网络 Traceroute 网络优化
相关文章