cluster-analysis

-1热度

1回答

我正在使用Pandas在Python中使用csv文件。我在思考如何实现以下目标时遇到了一些麻烦。我需要实现的是使用相似性函数对条目进行分组。例如，每个组X应包含组中每个对在特定属性列值上最多为Y的所有条目。鉴于CSV的这个例子： <pre> name;sex;city;age john;male;newyork;20 jack;male;newyork;21 mar

0热度

1回答

发送要在群集上执行的Python函数

我想为学校项目构建一个4-5树莓派，我想为类似于Thread的Python编写一个库，但不是在同一个函数上运行给定的函数机器在一个线程中，我将在另一个树莓派上运行它，然后将响应返回给发件人。我应该使用套接字和服务器 - 客户端模型来通过局域网进行数据传输，并且使用exec()来执行从站上的功能，然后将结果作为消息发回给启动器？这是最好的方法吗？

1热度

1回答

聚类时间事件

我有一个关于使用点云的聚集来执行聚类的问题，其中一个维度 - 代表时间 - 有点受到保护。为了使超清晰，考虑这个视频用肉眼人们可以看到一些浓密云层飞来飞去像蚊子，它们可能代表几件事情进入和离开现场。现在假设我们有一个3维点（X，Y，时间）的数组，并应用一些天真的集群（比如DBSCAN）现在聚类相当不错，除了会议事件在考虑相同的群集，提出了X轨迹。现在，如果有不同的方式来处理第三个坐标，也许人

-1热度

1回答

将k-均值收敛到全局最小值

我读到平分k均值算法有助于收敛到全局最小值。我不确定这是否正确，因为我无法找到批准此声明的来源或研究论文。有人可以分辨这种说法是否正确？

0热度

1回答

亲和传播的收敛

事实上，我想用亲和传播算法的结果来生成进化算法的初始种群，以解决社交网络中社区检测的问题。所以在算法的每次迭代中我都保留了结果，最后我有N个解，其中N是迭代次数。蟒蛇代码如下： def affinity_propagation3(S, preference=None, convergence_iter=25, max_iter=200, damping=0.5, copy=Tr

-4热度

1回答

用于在Python中对视频和音频文件进行群集的算法有哪些

有人可以帮助我理解用于在Python中对视频和音频文件进行群集的算法。

0热度

1回答

文本聚类：在k中选择k意味着

在删除了停用词并在一组文档中应用了词干化过程之后，我应用了在Javascript中平分K-means以对从一些网页接收的一组文档进行聚类以查找它们的相似性。什么应该是一个很好的方法来找出在创建基于文本的群集时应该创建多少个群集？我看到了一些方法，例如弯头，轮廓或信息标准方法，但假设我没有任何有关我创建的集群的信息，其他方法似乎更适合数字集群，而不适用于基于文本的集群。 entropy是否可以帮助

1热度

1回答

聚类和匹配有什么区别？

聚类和匹配有什么区别？例如：有一个由四个元素组成的池，在一个场景中，我想要生成一对。我所做的是测量每个元素相互之间的距离，从而产生一个2x2矩阵。然后匹配算法找到具有最低或最高加权总和的两个配对。什么是聚类算法在做什么？当我要求两个簇号时，结果是一样的，还是不一样？

1热度

1回答

r heatmap.2：防止在树状图中操纵一些矩阵行

我使用多个变量分析多个观测值的某些数据，并通过热图可视化它们，通过聚类和树状图建立来执行行和列重新排列。我使用R的gplots库中的heatmap.2()函数。然而，某些行（通常是几个最后一个）的观察值将被排除在分析之外，因为它们是一些部分的总和，但是它们需要被包括在它们的位置的树状图中。那就是我需要对数据进行聚类，而不考虑这些行进行缩放等，但接下来要使用保留的着色方案将它们包括在最后的位置。下面

-2热度

1回答

如何决定是否分割群集？

我给了一个群集。我如何决定将两个部分的群集分解比原始群集好？我已经尝试使用K均值与k = 2，并再次卡住..溢出或不溢出更好？编辑：嗯，我不明白的downvotes ...一点解释将有助于改善这样的问题：d