named-entity-recognition

    1热度

    2回答

    我知道这是一种普通的开放式问题。我基本上是在寻找帮助来决定前进的方向,也许还有一些阅读材料。 我正在研究一种非结构化文本挖掘算法,并试图从该文本中提取特定的乐队名称(单个艺术家,乐队等)。文本本身没有可预测的结构,但相对较小(1,2行文本)。 一些例子可能是(不是真实的事件): Concert Green Day At Wembley Stadium Extraordinary represen

    1热度

    1回答

    如何解析自由格式文本字符串以根据位置和名称字典检测位置和名称等内容?在我的特定应用程序中,如果我的字典中没有更多的条目,那么将会有数万个条目,所以我很确定只是通过它们来完成所有的事情都是不可能的。此外,是否有任何方法添加“模糊”匹配,以便您还可以检测字典单词的编辑中的子字符串?如果我没有弄错,它属于自然语言处理领域,更具体地说是命名实体识别(NER);然而,我试图找到关于NER背后的算法和流程的信

    0热度

    2回答

    我的一个函数返回一个'msg'对象......它仅仅是一个字符串。 我在函数中进入了2个循环。 msg='' for e in example: msg+= "some crap" msg+= "some crap1" for sl in somelist msg+= v.somevalue msg+="-------------"

    0热度

    3回答

    我查了一下,我试了一切,但没有任何工作。我的'价格'列从sql server获取数据的值为“4.9900”或“3.5000”。最后总是有一个00,我试过甚至没有放入任何defaultCellstyle格式,但它仍然是#。## 00。有什么建议么? dataGridView1.Columns[1].DefaultCellStyle.Format = "N2"; //doesn't work d

    0热度

    1回答

    我想在Ubuntu 14.04上编译wxWidgets(3.0.0)的最新稳定版本。当我confiugure --with-gtk=2,一切正常,但是当我配置with-gtk=3,我得到以下错误上执行make: ../src/gtk/toplevel.cpp: In member function ‘bool wxTopLevelWindowGTK::Create(wxWindow*, wxWin

    9热度

    1回答

    好吧,我有下面的代码从OpenNLP FileReader fileReader = new FileReader("train.txt"); ObjectStream fileStream = new PlainTextByLineStream(fileReader); ObjectStream sampleStream = new NameSampleDataStream(fileStre

    4热度

    2回答

    我正试图在我的C++应用程序中安装外部驱动器。我本来试图用支架(2),但这个失败: int ret = mount(deviceName.c_str(), mountPoint.c_str(), fsType.c_str(), 0, NULL); 错误号是19,ENODEV(文件系统的类型在内核中未配置) 但是,如果我切换到使用安装(8)它的工作原理好: std::string cmd = "

    0热度

    2回答

    假设我有一个使用jQuery的Web组件,并且我想将它作为打包组件分发。 我需要一种方法来确保jQuery库在页面加载时或之后可用,但我也想检查包含html页面或其他可能引用jQuery的未知组件是否已经添加了库到页面。 目前我见过的最好的例子是这样的 http://www.squidoo.com/load-jQuery-dynamically 这将需要一些调整,但我想知道是否有任何其他最佳做法。

    0热度

    2回答

    我正在通过有关此问题的stackoverflow阅读,但我仍未找到解决方案。有时我的应用程序面临这个问题这是我的错误日志, 12-31 10:58:28.025: E/AndroidRuntime(16322): FATAL EXCEPTION: Timer-0 12-31 10:58:28.025: E/AndroidRuntime(16322): java.lang.IllegalState

    0热度

    1回答

    我给出了两个32位整数,其中有一个固定长度的八字符ASCII字符串。 例如,字符串“HEYTHERE”被分割为“HEYT”和“HERE”,每个分割为四个字节分别给出0x48455954和0x48455245或1212504404和1212502597。 将这两个数字转换回Javascript中的字符串的最有效方法是什么? 到目前为止,我有以下的,但我不知道是否有更快/更少的笨拙方式: let xx