我想在C#窗口应用程序中创建一个Windows应用程序,应用程序应使用IBM Watson服务执行语音到文本转换。C# - 沃森 - 语音到文本API
我们应该如何实现IBM Watson Speech to Text API服务 https://stream.watsonplatform.net/speech-to-text/api应该听用户的声音并编写输出文本。
我搜索了很多文章,在所有这些例子中,.wav(音频)文件作为输入传递并输出文本。
我试图执行此语音更实时,而不是传递现有或存储的音频(.wav)文件。
使用Microsoft.Speech可以使用类似于 的代码Recognizer.SetInputToDefaultAudioDevice()来完成相同的功能。这里的缺点是,我们必须喂养DictationGrammer。这样应用程序就可以识别语音并转换为文本。
是否有可能通过Watson API服务来完成类似的任务?