2009-11-09 73 views

回答

2

这与this question非常相似,并且有非常相似的答案。您需要分离出音频部分,将其转换为WAV格式,并将其发送到inproc识别器。

但是,它有与我之前描述的相同的问题(需要训练,假定单个语音,并且假定麦克风靠近扬声器)。如果是这样的话,那么你可能会得到相当好的结果。如果情况并非如此(例如,您试图抄录电视节目,或者更糟糕的是某种摄像机音频),那么结果可能不令人满意。