我正在iOS上使用简单的网络电台应用程序进行简单的语音/音乐辨别。主要想法是一个收音机,它从url播放一个信号,同时它检查正在播放的是什么类型的信号。当它检测到语音时,它会更改频道等。iOS将URL中的音频分为帧
我写了一个简单的iOS应用程序,使用故事板和AVFoundation播放器。我在执行语音检测时遇到问题。我为算法编写了一个Matlab代码,但我不确定如何在Xcode中完成此操作。
clear all
close all
[s, fs] = audioread('nagranie.wav');
length = length(s)/fs;
lengthofframe20ms = 0.2*fs;
numberofframes20ms = round(length(s)/lengthofframe20ms);
s1 = zeros(lengthofframe20ms*numberofframes20ms,1);
for i=1:1:length(s(:,1))
s1(i,1)=s(i,1);
end
frame20ms=zeros(numberofframes20ms,lengthofframe20ms);
for i=1:1:numberofframes20ms
for j=1:1:lengthofframe20ms
frame20ms(i,j)=s1(j+3200*(i-1),1);
end
end
lengthofframe260ms = 2.6*fs;
numberofframes260ms = round(length(s)/lengthofframe260ms);
s2 = zeros(lengthofframe260ms*numberofframes260ms,1);
for i=1:1:length(s(:,1))
s2(i,1)=s(i,1);
end
frame260ms=zeros(numberofframes260ms,lengthofframe260ms);
for i=1:1:numberofframes260ms
for j=1:1:lengthofframe20ms
frame260ms(i,j)=s1(j+41600*(i-1),1);
end
end
En = zeros(numberofframes20ms,1);
for i=1:1:numberofframes20ms
L=length(frame20ms(i,:));
En(i)=(norm(frame20ms(i,:))^2)/L;
end
Ek = zeros(numberofframes260ms,1);
for i=1:1:numberofframes260ms
L=length(frame260ms(i,:));
Ek(i)=(norm(frame260ms(i,:))^2)/L;
end
sumN = 0;
for i=1:1:length(En)
sumN=sumN+En(i);
end
sumK = 0;
for i=1:1:length(Ek)
sumK=sumK+Ek(i);
end
EnP = zeros(numberofframes20ms,1);
for i=1:1:numberofframes20ms
EnP(i)=((En(i))/sumK);
end
treshold = 0.5;
lambda=treshold*sumN;
M=numberofframes20ms/numberofframes260ms;
coff=zeros(numberofframes20ms,1);
for i=1:1:numberofframes20ms
if (En(i)<lambda)
for k=1:1:numberofframes260ms
if (((k-1)*M+1)<i) && (i<k*M)
coff(i)=1;
end
end
end
end
正如你可以首先我们来划分信号见成20ms的帧和更大的260个毫秒帧,然后我们计算每20ms的帧的能量,做一些更多的数学,并在最后一点上,我们检查条件,当它适合它的语音,当它不帧时被排序为音乐。
我不知道如何开始做歧视部分。我应该使用哪种框架?我认为它不是很难,因为它花了我20分钟才写在MatLab中。 :)
这是怎么了我的应用程序播放的电台:
{
RadioInfo *sharedRadio = [RadioInfo sharedRadio];
NSString *program = [NSString stringWithFormat:@"%@",sharedRadio.list[value]];
NSURL *url = [NSURL URLWithString:program];
AVPlayerItem *playerItem = [AVPlayerItem playerItemWithURL:url];
self.playerItem = [AVPlayerItem playerItemWithURL:url];
self.player = [AVPlayer playerWithPlayerItem:playerItem];
self.player = [AVPlayer playerWithURL:url];
[self.player pause];
[self.player play];
}
这是我的第一篇文章在这里,所以请善待。我会感激和帮助。我被困在这一部分。
我正在处理连续的.mp3文件。也许你知道如何创建* soundData只有一部分文件?如果我可以创建一个只有约250 ms来自URL的信号的NSData文件,那将是非常好的。 – 2014-11-16 15:16:27
您必须使用音频转换器将mp3数据转换为原始数据。阅读https://developer.apple.com/library/mac/Documentation/MusicAudio/Reference/ExtendedAudioFileServicesReference/index.html以供参考,这里也有许多例子讨论它。 – 2014-11-16 20:13:15