htk

    0热度

    2回答

    我正在用HTK工具包进行音乐检索 特别是,我想让歌手识别。 我觉得我想要做的就是接近说话人识别。 所以我研究了一些样本和红色的红色HTK书。 但仍然无法找到很好的参考 是否有歌手识别或说话人识别任何很好的参考?

    4热度

    5回答

    我有一个结构,其中包含一些字符串。 struct item { string item_name; int item_property_1; double item_property_2; } 后来我对它们进行初始化: item item1; item1.item_name = "Name of Item"; item1.item_property_1 =

    0热度

    2回答

    大家好日子, 我是新来的语音识别。 现在,我正在与HTK一起处理语音识别。 我有55%的准确性结果。 我想问一下: 我可以集成HTK的结果,使它从实时识别器? 我应该怎么处理才能做出实时识别器? 任何帮助将不胜感激。谢谢。

    1热度

    2回答

    我在更改语法并添加了几个新句子后运行julius,并在步骤10中得到此错误。 AU fulllist Creating HMMset using trees to add unseen triphones ERROR [+2662] FindProtoModel: no proto for ei in hSet FATAL ERROR - Terminating program C:

    0热度

    2回答

    我在voxforge julius教程中提供的示例教程中添加了一些单词,如水果名称。我认为语法和voca文件是正确的,并且在最后这个错误中我被困在最后一步。 我检查了我的monophones0文件,我没有做任何更改,我只是复制它,因为它是在教程中使用perl命令创建树。我不知道为什么我现在有这个错误。 TB 350.00 ST_a_2_ {} 树基于聚类 错误[2640] TreeBuildCom

    0热度

    2回答

    我现在使用HTK的时间已经很长一段时间了,它用来完美地工作。迟到(可能在此期间改变了一些环境变量,但不记得哪些变量!),所有的HTK命令都是“不可找到的”。执行HCompV例如给予了 庆典:在/ usr/local/bin目录/ HCompV:没有这样的文件或目录 即使HCompV是在/ usr/local/bin目录可见。 重新编译和安装HTK是徒劳的。 从编译后的HTK的bin文件夹中运行HC

    1热度

    1回答

    继我的其他post之后,我对wondernig是否有可能在解码音频数据包上执行一些类似MFCC提取的过程进行了说明。我使用ffmpeg从mpeg-2文件中解码音频和视频的代码。视频处理是使用opencv完成的,因为该库允许通过一个帧来抓取帧。我需要在同一时间处理相应的音频样本。 谢谢。

    0热度

    1回答

    由于我最后的帖子不受欢迎here和here,我会尝试别的。 我有相应的音频(.wav)和视频文件(.mpg)。让我们考虑那些同步记录的两个流。我想同时处理流和图像的opencv,以及“我不知道哪个音频库”(你告诉我?)音频,我想在线处理这些流并保持同步。 请注意,视频的长度少于2分钟。 感谢您的帮助!

    0热度

    1回答

    Request.referer即将进入Facebook,twitter,linkedin等所有其他社交媒体,但在Tumblr的情况下即将到来零。那么我们怎么能从tumblr那里知道请求是从哪里来的。我正在创建我们存储来自不同社交媒体的查看次数的页面。对于其他社交媒体,一切工作都很完美。

    0热度

    1回答

    我一直在使用sphinx-4作为语音识别工具,我仍然在试着学习这个工具。 我有一个使用HTK开发的阿拉伯语声学模型。我想知道如何在Sphinx-4中使用这种声学模型。