如何在Python中分割音频文件

我正在研究客户关怀数据的语音情感分析。我有一个音频文件，客户服务人员询问问题并且客户已经给出了他的评论。如何在Python中分割音频文件

我需要拆分这个音频，并且只有客户的评论部分才能进行情感分析，无论客户是开心，悲伤还是中立。

请让我知道，如何分割音频文件，以获得客户的音频。音频格式为“.AAC”

到目前为止，这是我做了什么：

from os import path 
AUDIO_FILE = path.join(path.dirname(path.realpath('C:\\Users\\anagha\\Documents\\Python Scripts')),"Python Scripts\\audioa.aac") 

halfway_point = len(AUDIO_FILE)/2

来源

2017-04-04 Anagha

如果您只是想根据大小或静音进行分割你可以看看http://stackoverflow.com/questions/37725416/pydub-combine-split-on-silence-with-minimum-length-file-size 但是，我相信你需要做的第一个决定你将如何区分客户和客户音频。也许，语音识别工具将会有所帮助。 –

谢谢，有关如何区分客户和客户音频的建议？ – Anagha

，因为你使用的pydub标签，这里是如何与pydub

from pydub import AudioSegment 
sound = AudioSegment.from_file(AUDIO_FILE) 

halfway_point = len(sound) // 2 
first_half = sound[:halfway_point] 

# create a new file "first_half.mp3": 
first_half.export("/path/to/first_half.mp3", format="mp3")

来源

2017-04-06 02:31:19 Jiaaro

谢谢。但是如何得到输出结果并看看它是否被削减？或者我如何导出输出？ – Anagha

@Anagha更新了出口线路的答案 – Jiaaro

做

我认为它太晚回答原来的问题，但有人绊倒这个问题可能会发现有用的程序

- >使用工具来diarize数据。我已经使用LIUM（http://www-lium.univ-lemans.fr/diarization/doku.php）

- >解释在此基础上巧妙的简单输出，使后（Parsing LIUM Speaker Diarization Output）

，最后用从上面获得的时序拼接音频文件！将语音转换为文本虽然是完全不同的挑战，但要么需要深入研究（数据量巨大），要么依赖API提供商（如谷歌）

来源

2018-01-15 09:53:05

如何在Python中分割音频文件

回答

相关问题