AIGC Weekly #132

封面提示词：Chinese ancient Xianxia period movie still, medium shot, eye-level or slightly low angle, using centered composition. A beautiful 25-year-old woman, hair tied up, wearing a tattered white ancient robe, stands firmly inside the alchemy room. Extremely powerful golden magical energy continuously bursts and releases from her entire body, swirling around her. The woman crosses her hands over her chest, her gaze resolute and confident. Her beautiful face has wiped away previous pain and endurance. Her black hair slightly floats in the energy airflow. Her tattered white robe, though simple, looks extraordinary under the golden energy's glow.

AIGC 周刊 132 藏师傅语音 AI 播客版本：https://listenhub.ai/episode/u/68865669d04c2500d01dc528/68865669d04c2500d01dc528

上周精选✦

《人工智能全球治理行动计划》是中国在2025世界人工智能大会上发布的全球性倡议，旨在引导人工智能（AI）健康有序发展，确保其造福全人类。该计划围绕“向善为民、尊重主权、发展导向、安全可控、公平普惠、开放合作”的原则，提出了十三项具体行动：

共同把握AI机遇：各方协作推动AI普及与创新，助力全球可持续发展。促进AI创新发展：搭建国际合作平台，降低壁垒，推动技术持续突破。推动AI赋能各行业：推动AI在各行各业深度应用，促进实体经济发展。加快数字基础设施建设：加快全球智能基础设施建设，实现AI包容普惠。营造多元开放创新生态：打造开放共享的创新生态，降低创新门槛。推进优质数据供给：推动高质量数据流动与共享，保障隐私和多样性。应对能源环境问题：倡导绿色AI发展，推动能效标准和环保技术应用。促进标准及规范共识：推动国际标准制定，平衡技术进步与伦理风险。公共部门率先应用：公共部门优先部署AI，提升公共服务与治理水平。开展AI安全治理：建立风险评估和应急机制，提升AI安全与可控性。落实《全球数字契约》：支持联合国主导全球数字治理，弥合数字鸿沟。加强国际能力建设合作：加强国际合作，提升全球AI创新与治理能力。构建多方参与的包容治理模式：支持多方参与，推动AI治理交流与合作。

美国的人工智能行动计划（America's AI Action Plan），题为《赢得竞赛》（Winning the Race），由白宫于2025年7月发布，旨在确保美国在人工智能领域的全球主导地位。该计划将AI视为科学发现的新前沿，有潜力重塑全球力量平衡、催生新产业并彻底改变生活和工作方式。美国将其视为一项国家安全要务，以实现并保持无可置疑和无法挑战的全球技术主导地位。

该计划的核心目标是赢得AI竞赛，从而为美国人民开启一个人类繁荣、经济竞争力和国家安全的新黄金时代。AI有望带来一场工业革命（发现新材料、合成新化学品、制造新药物、开发新能源方法）、一场信息革命（彻底改变教育、媒体和通信形式），以及一场文艺复兴（解读古老卷轴、在科学和数学理论上取得突破、创造新型数字和实体艺术）。该行动计划围绕三大支柱展开：创新、基础设施以及国际外交和安全。这里有我在 NotebookLM 里面建的笔记本，可以针对性提问。

Runway 这个模型相当于把 FLUX Kontext 的图像编辑能力作用到了视频上，而且只需要视频和文本就行，比 Luma 前段时间那个半成品好操作的多，但是鉴于 Runway 最近的表现，没用到的时候还是先质疑再说。模型的核心能力有：

阿里上周疯狂发力，发布了一堆东西，包括 Qwen3-235B-A22B-2507、Qwen3-Coder-480B-A35B-Instruct、Qwen3-MT 三个模型和从 Gemini CLI 上分叉的开源命令行代码工具 Qwen Code。

首先是 Qwen3-235B-A22B 的升级版 Qwen3-235B-A22B-2507 ，主要的优化方向是去掉了混合推理方式，还是拆分了推理和非推理模型，只是做了这一个操作测试集分数就大幅提高，感觉混合推理和非推理只有 Anthropic 做的还行。

然后是 Qwen3-Coder-480B-A35B-Instruct ，一个专门的代码模型，我简单试了一下跟 K2 差不多，但是很多人反应非常贵，阿里云后面也推出了限时五折和通义灵码的限时免费使用，可以去试试。还推出了一个从 Gemini CLI 分支而来的命令行编码工具。

然后是不开源的 Qwen3-MT 一个基于 Qwen 3 微调的翻译模型，支持 92 种以上语言——覆盖全球超过 95% 的人口。新版本还提供了术语干预、领域提示和翻译记忆等高级翻译功能。Qwen-MT 实现了高翻译性能，响应速度更快，API 成本显著降低（低至每百万输出标记 0.5 美元）

Hedra 推出了 Hedra Live Avatars，一种低成本、超低延迟、灵活且风格多样的实时 AI 头像生成服务。主要是相对开放，支持各种输入和自定义，价格也便宜，终于在虚拟头像上有跟 Heygen 掰手腕的了，而且这玩意还支持实时通话。

低成本：仅需 0.05 美元/分钟——比现有解决方案便宜 15 倍超低延迟：由 LiveKit 的全球基础设施支持，响应时间低于 100 毫秒灵活：支持外接任何 LLMs 或 TTS 模型，如 Gemini 或 OpenAI风格无关：从单张起始图像创建逼真、动画或风格化的头像

上周精选✦

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签