dbaplus社群 07月16日 19:22
这个没落的编程语言,无意间改变了全球程序员的命运!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文讲述了CPAN作为首个集中式代码共享平台的诞生与发展,以及它对后续编程语言包管理系统的深远影响。文章追溯了CPAN的起源,Perl语言的特性,以及CPAN如何促进了代码共享和生态系统的建立。此外,文章还探讨了CPAN对Python、Ruby、Java等语言包管理系统的影响,并分析了C/C++为何至今未能形成统一包管理系统的原因。

💡CPAN的诞生源于Perl语言,旨在方便Perl脚本的共享。CPAN通过提供一个集中化的代码库,极大地简化了Perl模块的查找、下载和安装过程,促进了Perl生态系统的繁荣。

📦CPAN借鉴了CTAN的经验,初期通过邮件列表和FTP站点共享Perl脚本,随着脚本数量的增加,逐渐演变为集中式的CPAN,并引入了PAUSE系统,方便开发者上传和管理模块。

🌐CPAN的成功经验被其他编程语言借鉴,Python的PyPI、Ruby的RubyGems、Java的Maven以及JavaScript的npm等包管理系统都受到了CPAN的启发,促进了代码共享和软件开发效率的提升。

⚙️C/C++至今没有统一的包管理系统,这与其语言特性有关。C/C++强调底层控制、编译独立性和平台适配性,以及二进制兼容性问题,导致构建和分发复杂,标准化包管理器难以统一。

liuxin 2025-07-13 08:04 广东

毫不夸张地说,整个编程世界的生态,全球程序员的工作方式,都被它永久地改写了……

2016年,一个叫 left-pad 的小工具被删除,整个 JavaScript 生态瞬间瘫痪。

你能想象吗?这场“网络灾难”的源头,能一直追溯到 1995 年,那个被遗忘的编程语言——Perl,以及它发明的包管理系统CPAN。



一、CPAN的诞生

Perl是一门古老的编程语言。

Larry Wall发明Perl的时候,目的非常单纯,帮助自己做“报告生成和日志分析”。


所以他赋予了Perl无以伦比的文本处理能力,特别适合处理正则表达式、日志文件、配置文本等。

Perl也不是为了优雅,而是为了“快速地搞定事情”,所以它的表达能力、信息压缩能力非常强。

Larry说:“做一件事不止一种方法”,鼓励程序员用自己舒服的方式写代码。

于是有些Perl大师就写出了这样的代码:

    #!/bin/perl -s-- -export-a-crypto-system-sig -RSA-3-lines-PERL
    $m=unpack(H.$w,$m."\0"x$w),$_=`echo "16do$w 2+4Oi0$d*-^1[d2%Sa
    2/d0<X+d*La1=z\U$n%0]SX$k"[$m*]\EszlXx++p|dc`,s/^.|\W//g,print
    pack('H*',$_)while read(STDIN,$m,($w=2*$d-1+length$n&~1)/2)

    短短的几行代码就实现了RSA算法!

    当时美国政府有严格的加密技术出口管制,有人将这几行代码印到了T恤上,于是T恤衫就变成了禁止出口的“军火”。

    如果穿着它离开美国,将被处以高额罚款和10年监禁。


    1993年,Marc Andreessen发明了Mosaic浏览器,网页开始真正流行起来。


    为了增加网页的动态性,有人提出了CGI脚本,可以在服务器端执行,根据用户的输入产生动态内容。

    例如留言板,还有访问计数器:


    CGI程序员可以用各种语言编写,最早是用C语言,但很快大家就发现Perl更合适,因为CGI主要在处理HTML文本,正好是Perl擅长的领域。

    早期的互联网是免费分享的天堂,大家建立了邮件列表,通过邮件的方式分享各种各样的Perl脚本。

    Perl脚本多了以后,邮件分享就不方便了,有些“囤积者”就把自己收集的代码放到个人FTP站点上让大家下载。

    FTP站点多了以后,有人就想:大家应该合并资源啊!要不然重复代码很多,找起来很麻烦。

    最初,大家整理了一个列表,列出Perl模块的名称和下载地址,像这样:

    张大胖写的计数器:ftp://xxx.xxx.xxx

    赵铁蛋写的留言板:ftp://xxx.xxx.xxx

    ......

    叫什么名称呢?有人提议“CPAN”(Comprehensive Perl Archive Network),灵感来自CTAN,即TeX和LaTex的代码库。(嗯,看来这才是真正的老祖宗)。


    后来大家觉得用个人的FTP服务器不好,万一down机了,就无法下载了,干脆集中到一起吧。

    有两个人Andreas J. König 和 Jarkko Hietaniemi,建立了一个叫PAUSE(Perl Author’s Upload Server)的东西,即Perl作者上传服务器。

    每个人都可以在这个服务器上注册,上传自己的Perl模块。

    系统建立了一棵分类树,从原先按人名和文件简单分组,变成了“数据库模块”、“用户界面模块”、“文件处理模块”等等,这样大家找代码更方便了。

    从此以后,用Perl做事,大家第一想到的是CPAN,因为那里有所有模块。如果找不到,也许你可以做一个再上传。

    Perl 5发布以后,CPAN上的代码和模块激增。

    到 1999 年,每个月大约有 200 个包发布到 CPAN。到了 2001 年,这个数字超过了 500 个。

    Perl成了首个拥有超大集中开源代码库的语言,CPAN成了一个强大的生态系统。

    不过,还有一个问题还没有解决:每个月都有这么多的新模块上传,还有成千上万的模块更新,怎么才能确定它们没有问题呢?

    一般的Perl模块都包含测试代码,用户把模块下载以后可以测试,并且反馈是“通过”还是“失败”。

    但是不可能让每个用户都这么干,于是CPAN设计了一个自动化的方案:志愿者可以贡献机器,这些机器会自动下载模块,运行测试,然后把结果传到一个叫CPAN Testers的网站。

    用户只需要到网站上一看,就知道哪个模块在哪些系统上运行正常。

    这其实就是一个全球分布式的持续集成系统(CI),如今CI很常见,但是很少有包管理系统像CPAN Tester那样,能利用志愿者的电脑,分布式地完成Perl代码跨版本、跨环境的测试。

    Perl社区确实太了不起了!

    从CPAN的发展历史来看,是自然而然,水到渠成的事情,Perl适合写CGI脚本,后来又是LAMP的重要一员,在互联网早期非常流行,用户众多,随着分享代码需求的出现,CPAN这这么一步步地成熟了。



    二、"感染"其他语言

    Perl语法灵活,Perl社区黑客精神非常浓厚,这些都是好事儿,但是对很多人来说,门槛就有点高了。

    2000年左右,有着更清晰语法,更现代面向对象的Python和Ruby崛起,Perl终于让出了王者宝座。

    很多Perl程序员转入Python和Ruby阵营,也把Perl的优秀理念给带来过来。

    2003年,Python的包管理器PyPI对外发布。


    2004年,Ruby的包管理器RubyGems对外发布。


    而Java经过了10年发展以后,也通过Maven在2004年建立了自己的中央仓库。


    随后,CPAN就像病毒一样,感染了各个编程语言,JavaScript、Go、PHP、Rust都有了自己的包管理系统。

    它甚至入侵了微软,.NET,也建立了NuGet作为包管理系统。

    这其中以JavaScript的npm最吓人,我看到2023年的一个数据,说npm有300多万个软件包!

    JavaScript特别自由奔放,特别推崇“一包一事”,鼓励将功能高度拆分为独立模块,哪怕只是几个字符的功能。

    这导致了很多“微型”“极简”的软件包,其中只有几行甚至一行代码。

    例如判断一个数字是否是偶数:is-even

      module.exports = function(n) {
         return n % 2 === 0;
      };

      还有最为知名的,让真个互联网都颤抖的left-pad:


      它的作者Azer不但写了left-pad,还写了其他273个软件包,是npm一个相当大的贡献者。

      这273个软件包中有一个叫做kik,这个名称和加拿大一家叫做Kik Interactive的公司相同,这家公司要求Azer Koçulu放弃对kik的控制权,因为该公司拥有Kik商标。

      Azer当然不愿意放弃,回复了一个 fuck you 的邮件就不搭理他了。

      没想到Kik公司找到了npm的CEO,也是创始人 Isaac Schlueter ,注意,npm和CPAN不同,这是一家商业实体,是要盈利的。

      Kik威胁说要起诉npm,Isaac Schlueter怕了,就把所有权给了Kik公司。

      Azer Koçulu看到npm竟然站在对方那一边,一气之下把自己的273个软件包都删除了,其中就包括left-pad。

      这一下子捅了马蜂窝,因为别看left-pad很简单,却是JavaScript的一个核心包。

      Babel在用它,Webpack在用它,React也在用它,left-pad被下载使用了1500万次!

      left-pad被删除,“整个互联网被摧毁了”!

      所以你看,集中式软件包管理给程序员们带来了无数的便利,但一旦出事儿,就是大事儿。


      三、缺席的C和C++

      有意思的是,C/C++一直没有流行的包管理系统。

      2008 年,Linux内核开发者Rusty Russell在开源开发者大会 和CPAN 管理员Adam Kennedy偶然相遇,相谈甚欢,回去以后就创建了CPAN的C语言版本 :CCAN(Comprehensive C Archive Network)。


      但是CCAN从来没有流行起来,倒是微软,在2016年创建了vcpkg这个C和C++的包管理系统,收录了2613个知名软件包,还有JFrog创建的Conan,也有几千个,这规模完全无法和 npm 或 pip 那种“几百万包、全民使用”的盛况相比。

      C/C++ 是现在这个状况,我觉得可能有这么两个原因:


      1、语言设计哲学不同

      C 和 C++ 强调底层控制、编译独立性和平台适配性,给了程序员最大程度的控制权。

      它们不是“一站式生态”,而是允许开发者自由决定怎么构建和链接依赖。

      所以大家都是手动下载源码包、makefile、自定义构建。


      2、二进制兼容性难以统一

      脚本语言(如 Python、JavaScript)模块多为纯文本,天然跨平台。

      而 C/C++ 的模块多是静态链接库(.a/.lib)和动态链接库(.so/.dll),这意味着编译器(gcc、clang、MSVC)不一致会导致兼容性问题,不同平台、架构、选项会生成不同的二进制文件,即使源代码一致,也可能因构建参数不一而行为不同。

      这极大增加了构建和分发的复杂性,也使得标准化包管理器难以一统江湖。

      C/C++ 没有统一包管理器,可能不是一种“现代开发者习惯”的友好体验,但却是一种“系统编程者文化”的真实写照。


      四、总结

      Perl 可能早已退出了主流舞台,但它无意间种下的种子——CPAN,首次定义了“集中式代码共享”的范式,让程序员们不再孤军奋战,而是能够站在彼此的肩膀上协作创新。

      它激发了Python的 PyPI,启发了 RubyGems,影响了Java的 Maven,甚至在JavaScript中演化成了如今世界最大的软件仓库 npm。

      毫不夸张地说,整个编程世界的生态,全球程序员的工作方式,被Perl永久地改写了。


      本文作者

      刘欣著有畅销书《码农翻身》,《半小时漫画计算机》,前IBM架构师,领导过多个企业应用架构设计和开发工作;洞察技术本质,擅长用故事去讲解复杂技术。


      来源丨公众号:码农翻身(ID:coderising)

      dbaplus社群欢迎广大技术人员投稿,投稿邮箱:editor@dbaplus.cn

      阅读原文

      跳转微信打开

      Fish AI Reader

      Fish AI Reader

      AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

      FishAI

      FishAI

      鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

      联系邮箱 441953276@qq.com

      相关标签

      CPAN Perl 包管理 npm C/C++
      相关文章