可以将Microsoft Bing Speech API配置为仅返回数字和字母,而不是全部单词? 该用例正在翻译加拿大邮政编码。防爆。 M 1 B 0 R 3.微软可能会返回“Em 1 Be 0 Are 3” 我们的音频文件是8000hz,并用“M-ULAW”编码。我们在改变采样率或编码方面没有灵活性。我们正在使用“SMD”方案,但我无法找到有关此功能的任何文档。基地请求URI: https://
我正在使用Text to Speech API的Azure代码示例(https://github.com/Azure-Samples/Cognitive-Speech-TTS/tree/master/Samples-Http/PHP),它返回音频,但我不明白如何捕获流在浏览器中播放? 我试图建立文本到语音演示这里https://azure.microsoft.com/en-us/services/