2016-11-22 71 views
2

原来的蜂巢教程可在网上指的是一个名为“pv_2008-06-08.txt”数据集:为蜂巢教程实例数据

https://cwiki.apache.org/confluence/display/Hive/Tutorial

和当然,它在几十个教程所有的被引用通过互联网。但是,我无法在任何地方找到原始数据。有人知道它在哪里吗?

+0

https://www.quora.com/Where-can -I-find-large-datasets-open-to-the-public通过此链接 – TKHN

+0

对不起,但我不确定你的评论是否回答我的问题。要么你明白我在寻找一个通用的样本数据集(我不是:我正在寻找所提及的浏览量),或者我可以在你给我的链接列表中找到它,我看不到它。你能更精确一点吗? – astrojuanlu

回答

0

通过给定的网站阅读后,发现在该网站给出的例子已过时。请使用新链接获取更多示例。

https://cwiki.apache.org/confluence/display/Hive/Tutorial#Tutorial-UsageandExamples

注意:许多下面的例子是过时的。更多最新的信息可以在LanguageManual中找到。

如果你仍然有兴趣在该数据集,建议您邮寄给社会提供(请参见下面的链接)

http://hive.apache.org/mailing_lists.html

Hortonworks数据集:

最近我碰到这种Hortonworks数据集可用于在Hive和Pig中创建数据库和查询。

https://app.box.com/v/hadoopcrashcoursedata

如果你想尝试这个数据集,这里是链接使用上述数据集创建表

http://hortonworks.com/hadoop-tutorial/hello-world-an-introduction-to-hadoop-hcatalog-hive-and-pig/#section_4

+0

感谢链接Habi,但遗憾的是我的请求数据集不存在。 – astrojuanlu