2009-06-28 23 views
0

Brent's answer暗示我已经创建了SO问题的数据库,以便他可以快速分析问题。无法通过Python制作SO问题的MySQL数据库

我有兴趣通过MySQL制作一个类似的数据库,这样我就可以用类似于Brent的查询来练习MySQL。

数据库应至少包括以下字段(我在这里猜测,因为SO的api的API似乎是sectet)。我只想列出相关的变量,这些变量可以让我对布伦特进行类似的分析。

  • 问题
  • Question_id(私钥)
  • Question_time

  • 评论

  • COMMENT_ID(私钥)
  • COMMENT_TIME

  • USER_ID(PRI瓦泰岛键)

  • USER_NAME

我们需要显然是由Python的美丽的肥皂凑数据,因为布伦特的数据库显然是隐藏的。

如何通过Python的美丽的肥皂做出这样的MySQL数据库?**

+0

为什么要创建一个数据库?你正在创建一个数据库,所以你可以搜索?这似乎有点愚蠢,因为SO提供搜索。 – 2009-06-28 15:45:14

+0

@ S.Lott:我正在创建一个数据库来练习MySQL。我的目标是用MySQL进行数据分析。 – 2009-06-28 15:53:55

回答

1

我确定可以直接使用@RichieHindle提到的XML数据转储,但是我对@ nobody_的sqlite版本更加快乐 - 尤其是在将sqlite版本中的README文件添加为索引之后。

如果你有完整的索引sqlite版本,并且希望将Python标签的子集加载到MySQL数据库中,那么可以将它看作是使用两个数据库API实例的简单而整洁的练习,写给MySQL(我个人发现sqlite的性能完全令人满意,一旦索引建立完成,所以我没有任何子集提取,也没有任何移动到其他数据库引擎) - 没有汤也没有肥皂需要的目的。无论如何,尽管lxml和全部都是直接从XML进行加载,但对我来说更简单快捷。

当然,如果你仍然想要执行子集加载,并且如果你在编码时遇到任何问题,请问(有模式和代码示例,错误消息,如果有的话等),并且SOers会尝试回答,像往常一样!)