简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

苹果FastVLM视觉语言模型开放试用:视频字幕生成速度可提升85倍

2025-09-02 11:26

来源:环球网

【环球网科技综合报道】9月2日消息,据外媒9to5Mac报道,苹果此前发布了视觉语言模型FastVLM,现在用户已可以在Hugging Face平台上找到该项目。

据悉,FastVLM能够提供近乎即时的高分辨率图像处理,可将视频字幕生成速度提高 85 倍,同时体积比同类模型小 3 倍以上。

外媒称,现在在 Hugging Face 上,用户可以直接在浏览器内加载更轻量级的 FastVLM-0.5B 版本。根据9to5Mac实测,其在16GB M2 Pro MacBook Pro 上加载需要几分钟,加载完成后,模型就开始准确地描述用户的外貌、身后的房间、周围物体等。

外媒表示,因为它在浏览器本地运行,这意味着数据永远不会离开设备,甚至可以离线运行。这会在可穿戴设备和辅助技术场景展现潜力,因为轻便性和低延迟对于上述应用场景至关重要。(思瀚)

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。