2024-06-10 21:12 来源:本站编辑
韩国的一个团队开发了一种搜索视频内容的新方法。该系统发表在《国际计算视觉与机器人杂志》(International Journal of Computational Vision and Robotics)上,从视频录音中提取口语,将其转换为文本,然后使文本可搜索。重要的是,该系统因此不依赖于嵌入的关键字,也不依赖于策划标签或标签来与视频内容相关联。
显然,这种方法依赖于与用户可能希望搜索的视频场景相关联的物品的对话或口头评论。当然,如果视频已经内置了字幕,这是多余的。尽管如此,对于希望搜索数据库、流媒体服务和互联网其他地方的数百万小时视频的用户来说,这将是一个福音,可以用来帮助编目视频。
首尔韩城大学计算机工程学院的Kitae Hwang、In Hwan Jung和Jae Moon Lee开发了一款适用于智能手机的安卓应用程序。然而,值得注意的是,至少还有一个其他应用程序具有相同的名称,所以如果这款应用程序在Google Play商店中为Android应用程序提供,它可能需要更改名称。
这款新应用的工作原理是使用FFmpeg代码从视频中提取音频,并以10秒的增量将其转换为文本。该团队解释说,这为视频创建了一个可搜索的时间轴。然后,先进的语音识别技术生成这些音频片段的转录,并在视频时间轴上索引。
对于一个20分钟的视频,这个过程只需要两到三分钟就可以完成,并且在视频播放时在后台运行。该团队指出,用户可以搜索特定的术语,并找到视频中提到的所有内容。
该应用程序将应用于教育、新闻分析和其他需要快速访问特定信息的信息密集视频。例如,学生回顾讲座录音或记者在采访中搜索特定的陈述可以使用这款应用程序。在更多的场景中,能够以这种方式搜索视频将是有用的。
更多信息:Kitae Hwang等,一种可搜索视频播放器的实现,国际计算视觉与机器人学报(2024)。引文:系统从视频记录中提取口语,将其转换为可搜索的文本(2024,5月23日),检索于2024年5月28日https://techxplore.com/news/2024-05-spoken-language-video-searchable-text.html此文档受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。