2011-04-08 100 views
2

我正在做一个Java应用程序,在那里我需要确定什么是通过Twitter搜索获得的特定推文集合中的趋势主题。在网络搜索过程中,我发现算法定义了一个主题趋势,当它在特定时间内提到大量提及时,即在确切的时刻。所以必须进行衰减计算,以便话题经常变化。但是,我还有一个疑问:在特定的推文集合中定义趋势的主题

Twitter如何确定推文中的哪些特定条款应该是TT?例如,我发现大多数TT都是标签或专有名词。这有意义吗?还是他们分析所有单词并确定频率?

我希望有人能帮助我!谢谢!

回答

1

我不认为任何人都知道除了Twitter,但是看起来hashtags确实起到了很大的作用,但还有其他因素在起作用。我认为挖掘整个文本需要的时间比所需的时间多,并且会导致太多的误报。

下面是来自Mashable感兴趣的文章:

http://www.sparkmediasolutions.com/pdfs/SMS_Twitter_Trending.pdf

-Ralph温特斯

+0

非常感谢您的帮助!但是我真的很喜欢专有名词的部分。你有这方面的任何信息吗?也许他们做了一些提振! – 2011-04-08 19:04:41

+0

要考虑的另一件事是字符串相似性比较。如果热门话题是“哈利波特”,你可以看到“哈利波特”,“哈利是波特”,以及热门话题中的大量类似搜索结果。我在搜索过程中发现了一个[趋势科技惠普](http://www.scribd.com/doc/48665388/Trends-in-Social-Media-Persistence-and-Decay)。这是一个有点数学,但你可能想给它一个 – emrahgunduz 2011-04-09 10:37:56

+0

@Lais - 没有关于这方面的信息。然而,正如文章所表明的那样,新闻中最近的名字被认为是非常热门的话题,所以我不会为这些类型的名词的推动而感到惊讶。 – 2011-04-15 19:46:59

0

您可能感兴趣的meme tracking,其中我记得,做有趣的事与专有名词,但基本上识别流中的话题越来越少:

而在Eddi,基于交互式主题的社交状态流浏览

相关问题