site-mining

    0热度

    2回答

    我们假设,我正在访问大学网页。那里有许多教师资料。尽管这些页面在语法上没有关联,但它们在语义上是相关的。我如何衡量这种关系?其实我应该关注哪个参数来找到关系?

    2热度

    4回答

    这里提出的许多问题都与我正在做的研究有关。这些问题和答案分布广泛,并不总是很容易找到,做手动浏览,有时在无关的主题中也会出现有见地的答案或评论。 我想自动找到这些相关的Q's & A,根据关键词集合,然后使用这些信息作为进一步深入研究的指针。 我可以使用哪些工具,最好是开源的,可以用于这种类型的网站挖掘?我不是一个web大师&我尝试开发他们需要很长的时间,并在时间,我可以在我的[R花& D.影响

    0热度

    2回答

    我试图建立一个搜索引擎,通过在线汽车分类,如Oodle,eBay电机和craigslist。我还有一个关于它们的标准车辆名称和规格的大型数据库。我想要做的是对于通过分类网站找到的每条记录,能够确切地确定它的车型(从我的数据库)。例如,我的db中的福特卡车的标准名称是: 2003福特F150。 但是在分类网站上,人们可能会提到的是:“2003 Ford F 150”或“2003 Ford f-150