Video-MME: 首个全面评估多模态大型语言模型在视频分析中的性能基准。

Video-MME

多模态

视频分析

国外精选

Video-MME是一个专注于多模态大型语言模型（MLLMs）在视频分析领域性能评估的基准测试。它填补了现有评估方法中对MLLMs处理连续视觉数据能力的空白，为研究者提供了一个高质量和全面的评估平台。该基准测试覆盖了不同长度的视频，并针对MLLMs的核心能力进行了评估。

需求人群：

"Video-MME的目标受众是人工智能领域的研究者和开发者，特别是那些专注于视频理解和多模态交互的专业人士。它为这些用户提供了一个标准化的测试平台，帮助他们评估和改进自己的MLLMs模型。"

使用场景示例：

Gemini 1.5 Pro在不同视频长度和子类别中的准确度评分

GPT-4o和GPT-4V在视频分析任务中的表现对比

LLaVA-NeXT-Video模型在不同视频任务中的评分结果

浏览量：26

打开站点

类似应用