2009-12-30 39 views
5

我即将编写一些示例应用程序和附带文档,比较访问存储在关系数据库中的信息的方式。为了展示现实生活中的需求,我需要包含数以万计事实的现实数据集。自由可用的分层信息示例数据集和实际名称

是任何人都知道,大小的可公开获得的,免费的数据集,分类,人的名字与人类水平的差异,或或大组织等级,或大分层,分级数据集的数据集产品目录

如果是的话,请指点我正确的方向。


第1部分,人的名字:http://timecenter.cs.aau.dk/software.htm

第2部分,分层数据:没有答案了

+0

随机生成它有什么问题?如果不做更多的努力,那么按照数据来适应你的模型的努力是一样的。 – Joe 2009-12-30 21:48:50

回答

3
+0

这导致我http://dev.mysql.com/doc/#sampledb有几个有前途的线索。 谢谢。 – mikaelhg 2009-12-30 22:56:34

+0

进一步检查导致了http://timecenter.cs.aau.dk/software.htm,它有一个非常漂亮的模拟员工数据库,MySQL使用它自己的示例数据库。 – mikaelhg 2009-12-30 23:06:23

2

您自己的电脑的目录树是有很多事实的大型层次结构。你可能有几千个“事实”,它们是文件名,修改日期,大小,额外的操作系统信息等等。

如果这还不够大,找一个你可以登录的服务器。这将会更大。

不够大?获取网络抓取工具并开始抓取一个大型网站。这可以像你耐心抓取一样大。

+0

仅仅有一堆分层节点链接数据不能帮助读者理解特定演示解决方案如何提供想要的结果。为此,数据必须为读者提供可理解的分层上下文,例如组织层次结构或工具目录的分类层次结构。 – mikaelhg 2009-12-31 00:16:44

+0

文件系统是一种标准的,广为人知的,几乎通用的“分层上下文”。它似乎远比组织或工具目录更普遍。 – 2009-12-31 02:36:03