2017-10-12 98 views
0

我想转换音频文件到文本使用节点js,我有一个参考链接https://github.com/GoogleCloudPlatform/nodejs-docs-samples/tree/master/speech,通过使用此链接我能够转换其中包含的示例文件(即, ,audio.raw,gs://gcs-test-data/vr.flac)从音频到文本无法隐藏音频到文本nodejs

但是,当我使用这个link音频文件我无法将音频转换为文本,它显示一个空响应。响应是{ results: [] }

而且我知道使用这些命令

node recognize.js sync ./resources/audio.raw -e LINEAR16 -r 16000 
node recognize.js async-gcs gs://gcs-test-data/vr.flac -e FLAC -r 16000 
node recognize.js stream ./resources/audio.raw -e LINEAR16 -r 16000 

的,但是,我不知道如何使用从链接的音频文件转换成音频文本

+0

Aravindh,你能否将你的代码完全添加到问题中? 您给出的三个示例中的哪一个不起作用?你如何“喂”你的音频流? – Koen

+0

肯定Koen,现在我试图使用https://developers.google.com/apis-explorer/#search/speech/speech/v1beta1/speech.speech.syncrecognize我能够将一个特定的示例文件(“几个龙卷风着陆是周日在科罗拉多州遭受严重雷暴的线路,我不知道如何插入音频文件的计算器),但是当我尝试使用不同的文件时,它显示一个空的响应 – Aravindh

+0

我认为你应该存储您的音频文件放在云存储桶中,然后在异步请求中使用该文件的链接? – Koen

回答

0

当使用Google Speech API确保您的音频格式正确非常重要。该API不能与像mp3这样的格式一起使用。

为了使用API​​,您可以像使用SOX或ffmpeg的工具转换为后手: *红袜:sox input_file.mp3 output.flac * ffmpeg的:ffmpeg -i input_file.mp3 ./output.flac

当使用错误的格式,在谷歌语音API是回来一个空的答案。

{ results: [] }