热点
"音频理解" 相关文章
MECAT: A Multi-Experts Constructed Benchmark for Fine-Grained Audio Understanding Tasks
cs.AI updates on arXiv.org 2025-08-01T04:08:24.000000Z
GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题
智源社区 2024-12-12T15:47:34.000000Z
摩尔线程正式开源音频理解大模型MooER
界面快报 2024-08-23T23:49:47.000000Z
摩尔线程开源音频理解大模型MooER:38小时训练5000小时数据
快科技资讯 2024-08-23T12:01:32.000000Z
摩尔线程开源音频理解大模型 MooER:基于国产全功能 GPU 训练和推理
IT之家 2024-08-23T10:37:29.000000Z
VideoLLaMA 2 Released: A Set of Video Large Language Models Designed to Advance Multimodal Research in the Arena of Video-Language Modeling
MarkTechPost@AI 2024-08-15T08:19:57.000000Z
阿里通义开源音频语言模型Qwen2-Audio,相关论文入选顶会ACL 2024
ReadHub 2024-08-13T03:38:05.000000Z
阿里通义开源音频语言模型Qwen2-Audio 相关论文入选顶会ACL 2024
格隆汇快讯 2024-08-13T03:35:30.000000Z