C＃ - 沃森 - 语音到文本API

-1

我想在C＃窗口应用程序中创建一个Windows应用程序，应用程序应使用IBM Watson服务执行语音到文本转换。C＃ - 沃森 - 语音到文本API

我们应该如何实现IBM Watson Speech to Text API服务 https://stream.watsonplatform.net/speech-to-text/api应该听用户的声音并编写输出文本。

我搜索了很多文章，在所有这些例子中，.wav（音频）文件作为输入传递并输出文本。

我试图执行此语音更实时，而不是传递现有或存储的音频（.wav）文件。

使用Microsoft.Speech可以使用类似于的代码Recognizer.SetInputToDefaultAudioDevice（）来完成相同的功能。这里的缺点是，我们必须喂养DictationGrammer。这样应用程序就可以识别语音并转换为文本。

是否有可能通过Watson API服务来完成类似的任务？

IBM的沃森SDK用于.NET对WebSockets的支持，将满足更多转录实时上传与音频文件的您的要求：

的WebSockets包括建立与持久连接单个呼叫服务通过WebSocket协议。

该SDK可以找到here和SDK中的Speech to Text的具体细节可以找到here。

2017-06-19 16:33:15 tmarkiewicz

回答