如何在视频文件上使用语音识别？

如何编码语音识别引擎（使用Microsoft Speech SDK）“侦听”视频文件并将检测结果保存到文件中？如何在视频文件上使用语音识别？

2009-11-09 Yusuke

这与this question非常相似，并且有非常相似的答案。您需要分离出音频部分，将其转换为WAV格式，并将其发送到inproc识别器。

但是，它有与我之前描述的相同的问题（需要训练，假定单个语音，并且假定麦克风靠近扬声器）。如果是这样的话，那么你可能会得到相当好的结果。如果情况并非如此（例如，您试图抄录电视节目，或者更糟糕的是某种摄像机音频），那么结果可能不令人满意。

2009-11-10 23:18:22

回答