可以从这种媒体中提取什么样的语义信息?任何事情都可以,无论是音乐和口语文本之间的区别,检测不同的声音(如枪声或鸟或汽车),检测室内/室外拍摄或相机运动的强度。音频/视频内容提示
我知道有many,many,many,manymanymany研究这一类的话题,但我没有找到任何这些的任何应用程序。是否有人链接到应用程序/库/工作原型/有关这些主题即将推出的产品的新闻?
可以从这种媒体中提取什么样的语义信息?任何事情都可以,无论是音乐和口语文本之间的区别,检测不同的声音(如枪声或鸟或汽车),检测室内/室外拍摄或相机运动的强度。音频/视频内容提示
我知道有many,many,many,manymanymany研究这一类的话题,但我没有找到任何这些的任何应用程序。是否有人链接到应用程序/库/工作原型/有关这些主题即将推出的产品的新闻?
寻找的这个应用程序的最佳话题是,你可能想看看“基于视频检索的内容和索引”的研究课题
除此之外:
这是一个应用程序商业移除。商业删除者通常采用聚类方法来消除电视视频中的部分广告。
你与能够应用这些技术的图书馆有任何联系? – soulmerge 2009-11-02 09:22:05
查看MP4REG,它是“MP4 Family”文件中代码点的注册机构。短片:在QuickTime世界中,媒体的基本物理构建块被称为“Atom”。原子不仅可以包含实际的音频和视频,还可以包含技术和非技术元数据。最后一个听起来很有趣。
如:
albm
:专辑名称和曲目编号(用户数据)jp2i
:知识产权信息我只在这个东西仔细看一次,尊重元数据,我的印象是这是一个快速而宽松的世界。您可能需要查看一些低级别的MP4解析工具,这些工具可以让您检查真实世界媒体文件的各个原子。我认为甚至有非官方的(未注册的)定制原子在特定系统中使用。
这些天音乐特征分析是一个巨大的话题。想象一下可能性! http://en.wikipedia.org/wiki/Music_information_retrieval
此外,检查出的CONET项目:http://www.archive.org/details/ird059
你的意思是像JPEG图片的EXIF信息? – 2009-07-29 11:11:06
不是,不是关于媒体的技术信息,而是像这样的:'这张照片是户外拍摄的'或'这张照片中有人'或'这个音轨包含口语文本'或'这个音轨包含音乐' – soulmerge 2009-07-29 11:26:29