3
如何编码语音识别引擎(使用Microsoft Speech SDK)“侦听”视频文件并将检测结果保存到文件中?如何在视频文件上使用语音识别?
如何编码语音识别引擎(使用Microsoft Speech SDK)“侦听”视频文件并将检测结果保存到文件中?如何在视频文件上使用语音识别?
这与this question非常相似,并且有非常相似的答案。您需要分离出音频部分,将其转换为WAV格式,并将其发送到inproc识别器。
但是,它有与我之前描述的相同的问题(需要训练,假定单个语音,并且假定麦克风靠近扬声器)。如果是这样的话,那么你可能会得到相当好的结果。如果情况并非如此(例如,您试图抄录电视节目,或者更糟糕的是某种摄像机音频),那么结果可能不令人满意。