我是新来的igraph和社会网络分析,而不是R.结构化数据
我奋力正确地构建我的社区检测数据集,但已经成功地使用IGRAPH生成一个共生矩阵as directed [here]。接下来我要做的是在同一个数据集上使用社区检测算法来创建一个图表,显示群集as is done in the answer here。
如何做到这一点的示例代码如下:
df1 <- graph.famous("Zachary")
df2 <- walktrap.community(df1) #any algorithm
plot.communities(df2, df)
我一直在网上找到了扎卡里数据集的结构上戳,这样我就可以正确模拟我的数据,但我正在努力寻找通过技术文档的方法。
我的数据,目前在长形结构化,使得:
id interest comments
1 Comedy 2
1 Music: Electronic 11
1 Video Gaming 10
1 Music: Pop 1
1 Entertainment 1
1 Video Gaming 4
2 Video Gaming 45
2 Entertainment 26
2 Music: Pop 1
2 Comedy 14
3 Video Gaming 10
3 Entertainment 4
3 Comedy 8
4 Video Gaming 9
4 Music: Electronic 1
4 Music: Pop 2
5 Music: Pop 2
5 Entertainment 1
5 Video Gaming 1
6 Video Gaming 12
我试图找到重叠在人群中,我学习兴趣的集群,所以ID
是一个人,在interests
是人的兴趣,以及comments
是他们已经表现出兴趣的次数的指数。这有帮助吗?
我试着在这个数据集上运行社区算法(例如df2 <- walktrap.community(df)
),但似乎没有正常工作。关于这个n00b做错了的想法?
图形由节点和边组成。您的数据集中与节点有关的内容以及您如何知道哪些节点已连接?对于Zarchary数据,它可以用邻接矩阵('get.adjacency(df1)')或边缘列表('get.edgelist(df1)')表示。 – MrFlick
@MrFlick节点是列“利益“ - 即喜剧,博弈等。我试图找到我正在研究的人群中重叠兴趣的集群,因此身份证是一个人,利益是人的利益,”评论“是很多时候他们表现出兴趣。这有帮助吗? – roody
这是有道理的,但仍然不能很好地转化为图形的语言。所以你希望每个兴趣成为一个节点,然后你想要一个节点之间的边缘,如果一个用户共享这两个利益?我不确定你会如何处理评论栏,因为这看起来不适合作为节点或边缘权重。我仍然很难看到这些数据如何以图表的形式表现出来。 – MrFlick