2011-03-07 183 views
5

数据存储标签云我们已经在我们的App Engine数据存储非结构化一些文本数据。我想在数据存储对象的一个​​子集上创建一个属性的“一次性”标签云。环顾四周后,我看不到任何框架可以让我在没有自己编写的情况下做到这一点。谷歌应用程序引擎和Python

我想到的方法是:

  • 写的地图(如在地图中减少)函数在数据存储中的特定类型的每一个对象走了过来,
  • 拆分文本字符串转换成单词
  • 对于每个字递增计数器
  • 使用最终计数产生一些第三方软件标签云(离线 - 这里的任何建议表示欢迎)
如果不是我是接近它在正确的道路的

正如我以前从未做过这个,我是游荡,如果首先周围有一些框架,做到这一点对我来说()。即请随时指出计划中的漏洞。

回答

5

Feed TagCloudPyTagCloud两种可能性。

  • Feed TagCloud Generator Gadget for Google App Engine可能适合你的 需求。不幸的是,这是 无证件。幸运的是它是 相当简单,但我不确定 它是多么适合您的需求。

    它运行在一个饲料,并出现 是有些柔性的,所以如果你有 您的网站的饲料,它可能 不会太麻烦, 整合,虽然所有的处理 会上网。

  • PyTagCloud也值得一看 的样子。您将能够离线处理 ,并且它会生成 相当漂亮的云。

    所有你必须做的就是这个工作 ,是导出的数据存储; 计数和分裂将 为你做,因为PyTagCloud可以 对文本文件进行操作。继 约Uploading and Downloading Data在App Engine 文档的说明会告诉你如何 到数据存储导出到 本地机器。您需要编写 “出口商类别”,并在输出上运行 PyTagCloud。


如果您决定推出自己的,你可能想跳过在线处理和使用的Uploading and Downloading Data脱机上述方法,除非你想有一个动态更新的云。遍历整个数据存储区,进行在线计数是该任务中最令人讨厌且最昂贵的部分。如果你想要或需要动态标签云,这样做才有意义。如上所述,我建议编写一个“出口商类”,并在本地进行操作。

+0

谢谢Ezra - 那里有一些非常有用的信息。 – 2011-03-08 15:53:22