神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:四年AI实战者揭穿AI课程泡沫:Python核心+PyTorch手撸GPT+MLOps部署——这三本书构建的能力护城河,胜过87%速成课,文章来自编译。
在人工智能与机器学习领域深耕四年后,我想分享所有助我成长的资源。
由于内容较多,我将它们分为以下几类:
编程与软件工程
数学与统计学
机器学习
深度学习与大语言模型
人工智能工程
编程与软件工程
想进入AI领域,编程能力与软件工程技能是必备基础。
OpenAI首席技术官Greg Brockman也支持我的观点!
除少数特例外,AI领域最具影响力的人往往是软件与机器学习都精通的专家。
跟大众的认知相反,掌握机器学习其实比精通软件工程快得多。
因此优秀软件工程师在AI领域往往潜力非凡
由于AI领域较新,其主流语言尚未定型,但Python凭借易用性和完善生态仍是首选。
当前AI岗位多由机器学习领域衍生,而Python是该领域通用语言,短期不会改变。
但最热门的AI工程师岗位更接近软件工程而非机器学习工程,因此可能需要掌握Java/GO/Rust等后端语言。
建议从Python入门(更易掌握核心工程原理),但未来可能需要转向其他语言。
尽管课程书籍众多,持续实践才是最佳导师。资源仅能带你入门,真正掌握Python(或任何语言)必须通过创造与实践。
我的Python与软件工程基础推荐:
数学与统计学
虽然多数AI工作只需部署基础模型,但想成为顶尖从业者,至少要懂模型底层原理。
以下资源足以满足数学需求,无需另寻他处:
机器学习
当前主流AI其实指的是生成式AI(GenAI),属于机器学习分支。顾名思义,GenAI指生成文本/图像/音频/代码的算法。
但AI概念早在上世纪50年代神经网络诞生时就已存在。
甚至可追溯至二战时期——艾伦·图灵在计算机与思维机器研究中提出了"图灵测试"。
总之我想强调:AI远比当今大众的认知更加广阔,要想成为优秀的AI从业者,机器学习与传统AI的扎实基础不可或缺。
下列资源覆盖了机器学习的核心知识(若需时间序列预测/强化学习/优化算法/计算机视觉等进阶内容,可另行推荐):
《Scikit-Learn、Keras与TensorFlow机器学习实战》(Hands-On ML with Scikit-Learn, Keras, and TensorFlow)——如果只能推荐一本书,必选此本。内容惊艳,覆盖全面,末尾还谈到了大语言模型、强化学习与计算机视觉
机器学习专项课(Machine Learning Specialization)——2020年我的机器学习启蒙课,堪称史上最佳的机器学习课程。当初我是用Octave学习的,现已升级为Python教学并新增推荐系统/强化学习等前沿内容
《百页机器学习宝典》(The Hundred-Page ML Book)——百页浓缩的机器学习精华!轻量级工具书,助你快速查阅核心概念,基础讲解尤为出色
《统计学习导论》(The Elements of Statistical Learning)——掌握机器学习(本质即统计学习)根基的绝佳教材,真正传授学科精髓
深度学习与大语言模型
如上图所示,深度学习是AI大类中的子集,属于机器学习分支。
当前所有生成式AI算法皆源于此,你会在这个领域深入理解大语言模型、扩散模型、Transformer等基础架构的运作原理。
PyTorch官方教程(PyTorch Tutorials)——深度学习框架必选其一,目前的行业双雄为PyTorch与TensorFlow。建议主攻PyTorch(近年势头更劲):2021年约77%研究论文采用这一框架,HuggingFace平台92%模型为其专属
深度学习专项课(Deep Learning Specialization)——机器学习专项课的进阶篇。学习卷积神经网络/循环神经网络的优质课程,含大语言模型导论,可谓深度学习最佳入门
Andrej Karpathy的(特斯拉前AI总监)《大语言模型入门》——1小时科普视频讲解LLM原理与应用。强烈推荐给所有人(包括非技术背景者),内容宏观易懂
《神经网络:从零进阶》(Neural Networks: Zero to Hero,作者也是Andrej Karpathy)——从零搭建神经网络,起步节奏平缓,但最终视频将带你亲手构建GPT模型!AI从业者必修课
《动手学大语言模型:语言理解与生成》(Hands-On Large Language Models: Language Understanding and Generation)——LLM教材稀缺(近年才成主流),但此书广受好评。合著者Jay Alammar曾撰Transformer最佳科普博文,获吴恩达背书
人工智能工程
至此你已全面掌握了AI(特别是LLM与GenAI)的理论与实践版图。
真正的价值在于将AI模型转化为产品,因此需学习算法产品化部署技能,让技术为企业与客户创造价值。
多数AI岗位其实是"AI工程师",其工作性质更接近传统软件工程而非机器学习工程。
核心工作是运用Llama/GPT-4/Claude等基础GenAI模型开发产品,极少涉及模型开发——主要是因为训练成本过高,且现有的基础模型已足够强大!
《实用MLOps指南》(Practical MLOps)——模型部署领域唯一的必备书。我主要用作工具书,内容覆盖容器化/脚本编写/云系统/模型监控等全流程
《人工智能工程实践》(AI Engineering)——当红教材。作者Chip Huyen是生产环境ML/AI系统权威专家,斯坦福课程主讲人,品质保证
学习资源浩如烟海,关键要化繁为简,即刻行动。核心知识体系大同小异,选任何资源都不会错。
谨以AI领域顶尖研究者Andrej Karpathy的推文祝你征程顺利:
成为领域专家的秘诀:
纵向深挖:通过具体项目实践"按需学习"(拒绝填鸭式横向学习)
知识反刍:用自己的语言总结/传授所学
自我超越:只与昨天的自己比较,永远不跟他人攀比
译者:boxi。