AIGC Weekly 07月28日 01:03
AIGC Weekly #132
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本周AI领域动态聚焦,中国发布《人工智能全球治理行动计划》,强调AI向善、安全可控与开放合作。美国则推出《赢得竞赛》计划,旨在巩固其AI全球主导地位,并将其视为国家安全要务,计划围绕创新、基础设施和国际外交三大支柱展开。在模型层面,阿里云发布了Qwen3系列新模型,包括优化推理的Qwen3-235B-A22B-2507、专门的代码模型Qwen3-Coder-480B-A35B-Instruct以及支持92种语言的翻译模型Qwen3-MT,并推出了开源命令行编码工具Qwen Code。此外,Runway在视频生成领域展现出强大的图像编辑能力,能够实现新视角生成、风格迁移、元素增减与替换等功能。Hedra也推出了低成本、超低延迟的实时AI头像生成服务Hedra Live Avatars,为虚拟化身领域带来新选择。

🇨🇳 中国发布《人工智能全球治理行动计划》,以“向善为民、尊重主权、发展导向、安全可控、公平普惠、开放合作”为原则,提出十三项具体行动,旨在引导AI健康有序发展,造福全人类,并推动AI在各行业应用、加快数字基础设施建设、促进标准共识等。

🇺🇸 美国发布《赢得竞赛》人工智能行动计划,将AI视为科学发现新前沿和国家安全要务,目标是实现并保持全球技术主导地位,以开启人类繁荣、经济竞争力和国家安全的新黄金时代,计划聚焦创新、基础设施和国际外交三大支柱。

🚀 阿里云近期密集发布多款AI模型和工具,包括优化后的Qwen3-235B-A22B-2507、专注于代码生成的Qwen3-Coder-480B-A35B-Instruct、支持92种语言的Qwen3-MT翻译模型,以及开源命令行编码工具Qwen Code,旨在推动AI技术在多个领域的应用和发展。

🎬 Runway在视频生成领域展现出强大能力,能够实现新视角生成、下一个镜头预测、风格迁移、环境变化、元素添加与移除、物体替换、动作迁移、角色外观与场景重着色/重打光,以及精准绿幕抠像,为视频创作带来更多可能性。

💡 Hedra推出了Hedra Live Avatars,一项低成本(0.05美元/分钟)、超低延迟(低于100毫秒)且灵活的实时AI头像生成服务,支持外接LLMs或TTS模型,并能生成多种风格的虚拟化身,为虚拟形象互动提供了高性价比的解决方案。

封面提示词:Chinese ancient Xianxia period movie still, medium shot, eye-level or slightly low angle, using centered composition. A beautiful 25-year-old woman, hair tied up, wearing a tattered white ancient robe, stands firmly inside the alchemy room. Extremely powerful golden magical energy continuously bursts and releases from her entire body, swirling around her. The woman crosses her hands over her chest, her gaze resolute and confident. Her beautiful face has wiped away previous pain and endurance. Her black hair slightly floats in the energy airflow. Her tattered white robe, though simple, looks extraordinary under the golden energy's glow.

AIGC 周刊 132 藏师傅语音 AI 播客版本:https://listenhub.ai/episode/u/68865669d04c2500d01dc528/68865669d04c2500d01dc528

上周精选✦

《人工智能全球治理行动计划》是中国在2025世界人工智能大会上发布的全球性倡议,旨在引导人工智能(AI)健康有序发展,确保其造福全人类。该计划围绕“向善为民、尊重主权、发展导向、安全可控、公平普惠、开放合作”的原则,提出了十三项具体行动:

    共同把握AI机遇:各方协作推动AI普及与创新,助力全球可持续发展。促进AI创新发展:搭建国际合作平台,降低壁垒,推动技术持续突破。推动AI赋能各行业:推动AI在各行各业深度应用,促进实体经济发展。加快数字基础设施建设:加快全球智能基础设施建设,实现AI包容普惠。营造多元开放创新生态:打造开放共享的创新生态,降低创新门槛。推进优质数据供给:推动高质量数据流动与共享,保障隐私和多样性。应对能源环境问题:倡导绿色AI发展,推动能效标准和环保技术应用。促进标准及规范共识:推动国际标准制定,平衡技术进步与伦理风险。公共部门率先应用:公共部门优先部署AI,提升公共服务与治理水平。开展AI安全治理:建立风险评估和应急机制,提升AI安全与可控性。落实《全球数字契约》:支持联合国主导全球数字治理,弥合数字鸿沟。加强国际能力建设合作:加强国际合作,提升全球AI创新与治理能力。构建多方参与的包容治理模式:支持多方参与,推动AI治理交流与合作。

美国的人工智能行动计划(America's AI Action Plan),题为《赢得竞赛》(Winning the Race),由白宫于2025年7月发布,旨在确保美国在人工智能领域的全球主导地位。该计划将AI视为科学发现的新前沿,有潜力重塑全球力量平衡、催生新产业并彻底改变生活和工作方式。美国将其视为一项国家安全要务,以实现并保持无可置疑和无法挑战的全球技术主导地位。

该计划的核心目标是赢得AI竞赛,从而为美国人民开启一个人类繁荣、经济竞争力和国家安全的新黄金时代。AI有望带来一场工业革命(发现新材料、合成新化学品、制造新药物、开发新能源方法)、一场信息革命(彻底改变教育、媒体和通信形式),以及一场文艺复兴(解读古老卷轴、在科学和数学理论上取得突破、创造新型数字和实体艺术)。该行动计划围绕三大支柱展开:创新、基础设施以及国际外交和安全。这里有我在 NotebookLM 里面建的笔记本,可以针对性提问。

Runway 这个模型相当于把 FLUX Kontext 的图像编辑能力作用到了视频上,而且只需要视频和文本就行,比 Luma 前段时间那个半成品好操作的多,但是鉴于 Runway 最近的表现,没用到的时候还是先质疑再说。模型的核心能力有:

    生成新视角:可以通过简单的提示词,生成现有场景的全新视角(如反打、低角度等),实现镜头自由切换。生成下一个镜头:只需描述需求,即可自动生成故事的下一个镜头,实现镜头无缝衔接。风格迁移:可将任意风格应用到视频上,只需一句话即可完成风格转换。环境、地点、季节与时间变化:能够改变视频中的环境、地点、季节和时间(如添加雨、沙尘暴、冰雪、城市、沙漠等),并可灵活保留或替换原始画面内容。向场景中添加元素:可根据描述或参考图片,向视频中自然地添加新元素(如人群、烟花、道具等),并自动匹配光影和透视。移除场景中的元素:可以轻松移除视频中不需要的物体或元素(如烟雾、人物、反光等)。替换或变换场景中的物体:支持对视频中的物体进行材质更换或整体替换(如将汽车变成马车),可用文本或参考图片指定替换内容。视频动作迁移:可将任意视频的运动轨迹应用到新的首帧图片,实现精细的镜头运动控制。角色外观变化:通过简单提示即可改变演员的年龄和外貌(如老人变年轻、成人变儿童等),无需复杂化妆或昂贵特效。场景元素重着色:可根据色卡或描述,快速更改场景中物体的颜色(如将房子变成红色)。场景重打光:可完全改变场景的光照氛围(如将中午光线变为黄昏、提亮曝光不足的画面、营造日落氛围等),自动调整阴影、反光和色温。绿幕抠像:可精准抠出视频中的任意人物或物体,保留细节(如发丝、透明布料等),并导出为绿幕、透明或任意纯色背景,方便后期合成。

阿里上周疯狂发力,发布了一堆东西,包括 Qwen3-235B-A22B-2507、Qwen3-Coder-480B-A35B-Instruct、Qwen3-MT 三个模型和从 Gemini CLI 上分叉的开源命令行代码工具 Qwen Code。

首先是 Qwen3-235B-A22B 的升级版 Qwen3-235B-A22B-2507 ,主要的优化方向是去掉了混合推理方式,还是拆分了推理和非推理模型,只是做了这一个操作测试集分数就大幅提高,感觉混合推理和非推理只有 Anthropic 做的还行。

然后是 Qwen3-Coder-480B-A35B-Instruct ,一个专门的代码模型,我简单试了一下跟 K2 差不多,但是很多人反应非常贵,阿里云后面也推出了限时五折和通义灵码的限时免费使用,可以去试试。还推出了一个从 Gemini CLI 分支而来的命令行编码工具。

然后是不开源的 Qwen3-MT 一个基于 Qwen 3 微调的翻译模型,支持 92 种以上语言——覆盖全球超过 95% 的人口。新版本还提供了术语干预、领域提示和翻译记忆等高级翻译功能。Qwen-MT 实现了高翻译性能,响应速度更快,API 成本显著降低(低至每百万输出标记 0.5 美元)

Hedra 推出了 Hedra Live Avatars,一种低成本、超低延迟、灵活且风格多样的实时 AI 头像生成服务。主要是相对开放,支持各种输入和自定义,价格也便宜,终于在虚拟头像上有跟 Heygen 掰手腕的了,而且这玩意还支持实时通话。

    低成本:仅需 0.05 美元/分钟——比现有解决方案便宜 15 倍超低延迟:由 LiveKit 的全球基础设施支持,响应时间低于 100 毫秒灵活:支持外接任何 LLMs 或 TTS 模型,如 Gemini 或 OpenAI风格无关:从单张起始图像创建逼真、动画或风格化的头像

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

人工智能 AI治理 AI模型 视频生成 虚拟化身
相关文章