2017-04-04 365 views
1

我正在研究客户关怀数据的语音情感分析。我有一个音频文件,客户服务人员询问问题并且客户已经给出了他的评论。如何在Python中分割音频文件

我需要拆分这个音频,并且只有客户的评论部分才能进行情感分析,无论客户是开心,悲伤还是中立。

请让我知道,如何分割音频文件,以获得客户的音频。音频格式为“.AAC”

到目前为止,这是我做了什么:

from os import path 
AUDIO_FILE = path.join(path.dirname(path.realpath('C:\\Users\\anagha\\Documents\\Python Scripts')),"Python Scripts\\audioa.aac") 

halfway_point = len(AUDIO_FILE)/2 
+0

如果您只是想根据大小或静音进行分割你可以看看http://stackoverflow.com/questions/37725416/pydub-combine-split-on-silence-with-minimum-length-file-size 但是,我相信你需要做的第一个决定你将如何区分客户和客户音频。也许,语音识别工具将会有所帮助。 –

+0

谢谢,有关如何区分客户和客户音频的建议? – Anagha

回答

2

,因为你使用的pydub标签,这里是如何与pydub

from pydub import AudioSegment 
sound = AudioSegment.from_file(AUDIO_FILE) 

halfway_point = len(sound) // 2 
first_half = sound[:halfway_point] 

# create a new file "first_half.mp3": 
first_half.export("/path/to/first_half.mp3", format="mp3") 
+0

谢谢。但是如何得到输出结果并看看它是否被削减?或者我如何导出输出? – Anagha

+0

@Anagha更新了出口线路的答案 – Jiaaro

0

我认为它太晚回答原来的问题,但有人绊倒这个问题可能会发现有用的程序

- >使用工具来diarize数据。我已经使用LIUM(http://www-lium.univ-lemans.fr/diarization/doku.php

- >解释在此基础上巧妙的简单输出,使后(Parsing LIUM Speaker Diarization Output

,最后用从上面获得的时序拼接音频文件!将语音转换为文本虽然是完全不同的挑战,但要么需要深入研究(数据量巨大),要么依赖API提供商(如谷歌)