原创 日报组 2024-06-25 23:59 北京
日报关键词:?Anthropic发布Claude Artifacts;?全球AI模型数据可视化;?750名工程师透露的AI真相;GenAI不能也不应该取代初级程序员;?写给美国创企Founder的执行手册……点击阅读全文
ShowMeAI
专业◎洞察◎清晰◎实用
用知识加速每一次技术进步!
推荐语
需要加入 ShowMeAI 社群的,可以先添加微信 AhaNanQiao
Claude Artifacts 真的很不错!喊话 DeepSeek 加油啊!追上并超过它 ?
P.S. ShowMeAI知识星球更新了〖把英文PDF完整翻译成中文的14种常见解决方案〗,应该是目前最全面&最清晰的整理啦!
链接 ? https://t.zsxq.com/L34d9
Anthropic 发布 Claude Artifacts,大模型从「聊天」正式迈入「工作流」
上周,Anthropic 公司发布了最新的大模型 Claude 3.5 Sonnet,随后几天陆续斩获各榜单的一二名。
以 LMSys Chatbot Arena Leaderboard 来说, Claude 3.5 Sonnet 在「Overall (全部)」榜单中排名全球第二,在「Coding (编程)」榜单中位列全球第一。
榜单网址 → https://chat.lmsys.org/?leaderboard
这次发布更应引起关注的,是官方在 Claude Chat 中增加的一项新功能「Artifact」。
简单说就是,用户要求 Claude 生成代码片段、文本文档、网站设计等内容时,屏幕右侧会自动弹出 Artifact 空间 (? 如上图所示,需要在个人账号 → Feature Preview → 打开 Artifact 设置),可以展示代码,其中前端编程语言的代码还可以查看呈现样式。
↑ 这是我实际操作的示例截图
要求「Create an HTML animation to demonstrate the working principle of "A Simple Neural Network"」,即创建一个 HTML 动画演示简单的神经网络的运行原理。
Claude 对问题进行了分析 (上图左侧),并生成了 HTML 代码段并支持预览最终的动画效果 (上图右侧)。
从 X 和 Youtube 等社交媒体的反馈来看,用户们相当欣喜啊!纷纷尝试生成各种小游戏,然后越来越复杂:贪吃蛇、计数器、倒计时、声音效果生成器、用 CSS 编写简历、生成网页…
↑ 这是国产大模型 DeepSeek 同样提示词的 HTML 运行结果
国产大模型 DeepSeek 也支持类似功能哦!登录后左侧选择「代码助手」,输入任务提示词,生成 HTML 代码后点击右下角「运行HTML」,就可以在弹框里预览生成效果了!
相较于 Claude Artifact,DeepSeek 目前还有很多局限:例如代码能力弱了一点 (Coding 排行榜第5),仅支持运行 HTML 代码,不支持上传图片和文件 (这点影响很大)…… 综合起来就有了明显的体验差异。
↑ DeepSeek 随机生成的交互小游戏,还不错!
除了超越的编程能力 & 动态预览交互带来的眼前一亮,Claude Artifact 最重要的是把大模型集成进了更多用户的工作流,摆脱了「聊天助手」的尴尬定位。
这类功能目前支持的编程语言、协作方式还很有限。非常期待这个功能的进一步拓展,支持运行更多编程语言 (例如 Python ?),或者成为团队协作工作流的重要组件 (甚至平台)。
一份还不错的中文讲解和试验视频 ?Claude 3.5 Artifacts 功能测试
“Anthropic Claude Chat (需要魔法) → https://claude.ai/chat
DeepSeek Chat (左侧选代码工具) → https://chat.deepseek.com
全球AI模型 ● 数据可视化:60年踽踽前行,近10年突飞猛进
Epoch AI 在其网站更新了全球 800+ AI模型的详细信息 (数据截至本月19号),并制作了一个可交互的数据图 ? 如上图所示。
AI 模型的起源要追溯到遥远的1951年。然后,一代代科学家和工程师的不断努力,将AI带入深度学习时代,并最终于2022年末爆发出巨大的能量,引发了新一轮的科技革命。
Notable AI Models
这张可交互的数据图表名为「Notable AI Models」,即知名AI模型 (页面下方有入选标准)。X轴和Y轴的含义可以在下方参数中进行选择:
训练计算量(FLOP)
可训练参数数量
训练数据集大小(datapoints)
训练计算成本(2023 USD)
发布日期
根据这份数据和可视化图,我们可以得到以下 4 个结论:
知名AI模型的训练计算量,大约每6个月翻一番。
最大的AI模型的训练计算成本,大约每9个月翻一番。
与视觉模型相比,语言模型的训练计算量增长更快。
用于训练语言模型的数据集大小,大约每8个月翻一番。
“Notable AI Models → https://epochai.org/data/notable-ai-models
Large-Scale AI Models
这是 Epoch AI 网站同期公布的另一份可交互数据图「Large-Scale AI Models」,即大规模AI模型,共有 180 多个模型入选。入选标准也很明确,FLOP>10^23,这个参考数据大致相当于 GPT-3 大模型的计算规模。
既然是动态可交互的数据图,那么X轴和Y轴的含义也可以选择:
训练计算量(FLOP)
可训练参数数量
训练数据集大小(datapoints)
发布日期
从这份数据中,我们可以观察到以下规律:
大规模模型发布的速度在加快。
语言模型构成了大部分的AI大模型。
大多数的大模型是由美国公司开发的。
几乎一半的大模型有公开发布的、可下载的权重。
“Large-Scale AI Models → https://epochai.org/data/large-scale-ai-models
值得注意的是,将鼠标放在网站图中的圆点上方,可以看到该模型的主要信息!? 如上图左侧所示
而且!网站支持下载数据文件:点击页面「Download this data」按钮,就可以下载 .csv 格式的数据文档~
是时候知道「AI真相」了:750名AI工程师,深度参与的2024调研报告
Retool 去年就发布了一份「技术从业者」为主的 AI 调研。前几天,今年的 AI 技术调研问卷的结果&解读都正式发布了。报告回应了很多棘手&尖锐的话题,并且给出了比较客观的统计和分析。
以下是报告提到的话题,看看有你感兴趣的嘛:
AI采用率激增是真的吗?
领导层呼吁AI投资多多益善!
产品经理与工程师已经成为AI深度用户
AI真的能显著提升生产力!
光明正大 VS 偷偷摸摸
编程基础岗位受到最大威胁!但没有基层何来中高层?
最活跃最真实的AI应用场景
你想得到、想不到的领域,都在用AI
2B or 2C
AI应用程序即将爆发
OpenAI占据市场大半壁江山
模型定制化技术深受欢迎
大量公司在构建自己的模型
向量数据库的兴起
推理平台尚未普及
开发者工具的重要性
公司如何分配GPU资源?
对AI技术栈的综合评价
我们选择3个有意思的话题,对图文进行整理和解读:
与半年前相比,使用AI可以提升工作效率成为越来越多公司的共识。但是!仍然有超过 1/4 的人在偷偷摸摸使用AI??
仔细看看,这部分人中只有 8.8% 的人直接违反了公司政策。其他更多是在纠结对AI的看发,或者缺乏明确的政策支持使用AI。
这是今年统计的最高频的AI应用场景。尤其值得注意的是,与去年相比,变化趋势似乎也在告诉我们一些故事:
↓ 编程或查询从 47.5% 下降到 42.1%,文案写作也从 32.9% 下降到了 28%
↑ 聊天机器人从 28.9% 上升到 33.9%,自动化工作流从 12.9% 跃升至 17.8%
各种大模型的市场采用占比 (仅就这次调研)。
“原文 → https://retool.com/blog/state-of-ai-h1-2024
GenAI 将取代初级程序员?NO!这个观点荒诞且危险!
这篇文章最近在外网很火,原文标题「Generative AI Is Not Going To Build Your Engineering Team For You」,直翻就是GenAI不会为你构建工程团队。
文章的核心思想是说,一个完整的、运转良好的工程团队,依旧是以人为核心的。GenAI可能在某些环节提供帮助,但「替代初级工程师」这个观点既不可行,也不可取。
文章作者 Charity 是 honeycomb.io 的联合创始人兼首席技术官 ,还曾经在 Parse、Facebook、Linden Lab 等公司担任运营工程师和工程经理。
她回顾自己十几年的技术从业生涯,有感于当下 GenAI 对行业的冲击和挑战,写下了当下的思考:
软件行业正在成熟:软件行业早期门槛低、不规范,但已经慢慢发展成为了一个标准更高、专业化更强的领域,因此提升了入行门槛。Charity 也在庆幸自己入行早……
软件行业本质上是师徒制行业:软件行业重视实践学习和经验积累,项目中的实际操作、编码、审查、部署代码以及与资深工程师的合作,才是学习和成长的主要途径。
"高级工程师"的真正含义:成为高级工程师不仅意味着编写代码的能力,更包括对大型软件系统的深入理解、维护、解释和管理,以及将业务需求转化为技术解决方案的能力。
必须停止损害自己的未来:有观点认为AI可能取代初级工程师。但行业必须认识到初级工程师的重要性,并加大对他们的招聘和培养,毕竟未来不可能把代码的运维、理解和扩展这些繁重的工作交给AI。
编程其实不是最难的部分:编程本身是软件工程中相对简单的部分。真正的挑战在于代码的运维、理解、扩展和整个生命周期的管理。GenAI 工具虽然使编写代码变得更容易,但并不能帮助更好地管理、理解或操作代码,有时甚至增加了难度。
生成代码容易,生成优秀代码难:尽管AI使代码生成变得容易,但生成符合实际需求和编码标准的优质代码仍是挑战。AI生成的代码看似合理,但常需人工审查和调整,以确保其可靠性和一致性,这在实际开发中可能并不节省时间。
工程师实际上如何使用GenAI:GenAI在生成示例代码、编写繁琐代码片段或在不熟悉的语言中生成小功能时非常有用。但使用时必须谨慎,需手动验证AI生成的代码。
GenAI有点像初级工程师:GenAI在快速生成代码方面像初级工程师,当然我们需要像对待新手代码一样仔细理解和测试这些生成的代码。
但GenAI并非你团队的一员:尽管GenAI能快速生成代码,但它不能取代团队成员的角色,缺乏人类互动、学习和文化适应能力,也没有促进成长的反馈机制,不会对团队氛围产生积极影响。
我们往往低估了聘请高级别人才的成本,高估了聘请初级别人才的成本:初级工程师在执行任务和成长方面有巨大潜力,而且招聘任何级别的工程师都需要时间来适应团队环境。
并非只有高级工程师才能为团队增值:中级工程师由于能够专注于编写代码,没有被会议和其他管理职责所拖累,往往在开发和发布功能方面表现出极高的效率和创造力,对团队贡献巨大。
招聘初级工程师的长远考量:团队需要培养更多高级工程师、降低成本、增加团队多样性、提高员工忠诚度等。这些道理大家都知道,但是公司通畅因为一些短期利益而选择忽视。
招聘初级工程师的短期优势:初级工程师能为团队带来新的视角和活力。
一个健康、高效的团队应包含不同级别的成员:健康且高效的团队应包含不同技能水平和经验的成员,这样的多样性确保团队能应对各种挑战。
我们面临的难题在于招聘,而非培训:软件行业的主要障碍是为初级工程师提供首份工作的机会,公司应将初级工程师视为投资而非成本。
是否每家公司都需要招聘初级工程师:当然不是。
没人会自动来解决我们的问题:改变初级工程师招聘和培养的现状,需要工程师和工程经理的主动参与,而不是被动等待外部的介。
“原文 → https://stackoverflow.blog/2024/06/10/generative-ai-is-not-going-to-build-your-engineering-team-for-you/
写给美国创企 Founders 的执行手册:两位资深律师带你穿越法律迷雾
这是一份由资深律师执笔的创业指导手册,面向美国本土科技初创公司的创始人,告诉他们在创业初期应该做哪些事情,以及有哪些注意事项。更重要的是,作者们列出了常见的「误区」,并进行了一一解释。
如果你正在计划「出海」,设立一家美国公司并将产品推出到海外,或者也有招聘和融资等相关计划,不妨看看这篇手册,对目的地有个大致的了解。
文章提到的「Startup Incorporation」可以粗浅地理解为公司注册,即将自己的业务变成一个法律实体,需要向州提交文件。
以下是手册详细解释过的话题,感兴趣可以前往阅读原文:
初创公司为何要进行公司注册?
有限责任
股权分配能力
简化招聘流程
降低联合创始人风险
便于筹资
有限责任公司(LLC)又如何?
税务考量
灵活性与定制性
运营的便捷与成本
股权补偿
转换可能性
投资者偏好
我应在何时成立初创公司?
多位创始人的情况
筹资需求
招聘活动
拥有客户
签订合同
不寻常的责任风险
公司名称的可用性
现有雇佣状况
资本收益
我应在何地成立初创公司?
初创公司的法律生态
投资者的偏好
文件提交的便利度
特许经营税
注册代理费用
董事会的灵活性
匿名性与隐私保护
责任保护
加密货币/区块链考量
公司章程是什么?
制定公司章程
提交公司章程
盖章副本与认证副本的区别
提交后的操作
初创公司章程中通常包含哪些内容?
公司名称
创立人
生效日期
注册代理
公司类型
股票种类
授权股份总数
面值
“原文 → https://handbooks.clerky.com/startup-incorporation
THE END
转载原创文章请添加微信 AhaNanQiao
↓ 分享·收藏·在看·点赞