-1

我很好奇“框架阻塞”,这是我在网站上看到的特征提取的第一步。它说,这些步骤应遵循的音频特征提取:“帧阻塞”是什么意思?

  1. 帧中的块
  2. 窗口
  3. FFT
  4. 梅尔频率翘曲

是什么“帧封锁”是什么意思?任何人都可以给出一个算法或代码(C#)?

顺便说一句,这是特征提取的步骤顺序吗?

我应该如何在特征提取之前对aduio进行“预过滤”?

谢谢。

+0

你有没有发现哪个网站上这个词? – 2013-03-23 22:27:24

回答

2

这是我从谷歌搜索找到的术语“帧阻塞” - 谷歌自动完成到“帧语音信号的帧阻塞”。

http://books.google.com/books?id=B9VuCBBYzJ4C&pg=PA21&lpg=PA21&dq=frame+blocking+of+speech+signal&source=bl&ots=FCzp86g8F0&sig=P5aolL4OAAyPwxZ2nMd-Ye_5M_I&hl=en&sa=X&ei=oLM3UeK3DsTfrQHyvYD4DQ&sqi=2&ved=0CC4Q6AEwAA#v=onepage&q=frame%20blocking%20of%20speech%20signal&f=false

相关的文字:

中speach信号处理最普通的方法是基于短时间分析。预占信号被阻断成N样本的帧。帧持续时间通常介于10 - 30 mxec之间。此范围内的值表示频谱变化率与系统复杂度之间的折衷。适当的帧持续时间最终取决于语音制作系统中咬合器的速度。一些声音(例如,停止辅音)表现出尖锐的频谱转换,这可能导致频谱峰移动高达80Hz/msec(Mar76)。图2.3说明了将一个单词阻挡到帧的重叠量,一定程度上控制如何快速参数可以从帧改变。

我们您的问题是,你有什么话就试图帧中的块?