原创 小茸茸 2024-12-16 09:36 重庆
Grok 免费开放,马斯克送圣诞大礼;PIKA AI 发布 Pika 2.0;Meta Motivo:开源人体动作生成模型;EasyVolcap:开源 4D 视频重建技术;Gazelle:开源的多人注视检测技术
Grok 免费开放,马斯克送圣诞大礼
Grok[1] 现在对所有人免费,包括新推出的 Grok2 模型和新的图像生成模型,全部免费提供。当然,付费用户可以享受更多的用量。
此外,现在可以通过 API 来调用 grok-2-1212
和 grok-2-vision-1212
,价格比 GPT-4 便宜,每月还提供 25 美元的额度,真是太良心了。
对比隔壁的 OpenAI,这才是圣诞礼物,马斯克牛逼。
PIKA AI 发布 Pika 2.0
Pika AI 发布了Pika 2.0[2]视频生成模型,支持上传多张参考图片,AI 会自动将其无缝组合。
例如,上传两个人的照片可以轻松实现合影;上传商品或衣服照片可以实现试穿试用;上传背景图片可以实现背景穿越。这个更新非常牛逼,你甚至可以组合上传场景、角色、商品,直接生成广告宣传片。
Meta Motivo:开源人体动作生成模型
Meta Motivo[3] 是一个开源的人体动作生成模型,能够生成符合自然物理规律的复杂人体动作,如奔跑、翻滚、跳跃、瑜伽等各种精通和运动姿势。
官方还提供了一个交互演示[4],强烈推荐你们玩一下,可以用来调整世界的重力、风,角色的姿势、动作,或者编程动作。
EasyVolcap:开源 4D 视频重建技术
EasyVolcap[5] 是一个开源技术,能够从多视角视频中重建为 4D 视频,支持处理长视频。
例如,通过输入多个视角的瑜伽教学视频,就能生成 4D 场景,学习者可以从不同角度观察老师的动作。这个技术有点意思,非常适合各种教学、体育等领域。
Gazelle:开源的多人注视检测技术
Gazelle[6] 是一个开源的多人注视检测技术,能够精准地检测人们的目光方向和注视对象。
感觉主要就适用于监控场景,快进到资本家们用来监控员工。
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!
Reference
[1]
Grok2 模型博客: https://x.ai/blog/grok-1212
[2]Pika 2.0 模型发布: https://x.com/pika_labs/status/1867651381840040304
[3]Meta Motivo官网: https://metamotivo.metademolab.com
[4]Meta Motivo交互演示: https://metamotivo.metademolab.com/demo
[5]EasyVolcap 技术官网: https://zju3dv.github.io/longvolcap/
[6]Gazelle 开源项目: https://github.com/fkryan/gazelle