2013-02-20 133 views
0

我正在做一个关于听觉和视觉感知(人类)之间关系的研究项目。我最终想要获得的将是帮助开发一种算法的知识,该算法将采用音频信号并将其转换为“感知匹配”可视化。Windows Media Player Music Visualiser算法

目前,我正在研究当前存在的可视化以及它们的工作方式。我想知道是否有人知道有关Windows Media Player Music Visualizer算法如何工作(或任何其他商业算法)的信息,它基于什么,音频信号的特征是什么,以及这些特征是否基于人类感知系统的模型?

任何帮助将不胜感激!

克里斯

回答

2

我看着Windows媒体播放器的Windows 7下我不知道它可以做可视化,但一些挖后,我发现的选项。默认情况下,我看到3类即插件:

  • 炼金术
  • 酒吧和波
  • 电池

这第二个是最简单的讨论。音频可视化器通常在时域(简单地可视化为线图)或频域(简单地可视化为条形图)中操作。大多数算法都是这些主题的变体(或组合),但通常有许多修饰。

在“酒吧和波浪”下,还有4个选项。 “示波器”是一个简单的示波器。数字音频由一系列随时间变化的幅度水平组成。 o范围只是将这些级别绘制为线图,其中时间为X轴,振幅为Y轴。

“Bars and Waves”下的其他3个选项是带有各种皮肤的频率直方图。最直接的是“酒吧”。另外两个(“海洋迷雾”和“火焰风暴”)大部分是相同的,但具有不同的颜色。这些图表是通过使用傅立叶变换(通常是快速傅里叶变换或FFT)变换时域信号的块而获得的。结果是一个条形图,X轴有频率,Y轴代表强度。

当你认识到邻范围和FFT的范围是如何运作的,你会认识到,所有其他的即algorthms大多只是与2个主题播放。例如,我看到炼金插件喜欢绘制出的时域信号和旋转它们,螺旋他们等

在兵工厂即另一种常见的诀窍是计算最大功率。这有助于获得随着节拍脉动的特定跳动效果。