谷歌云平台架构

是通过谷歌查询大存储处理，在谷歌云存储，并只用于分割目的吉贝数据？或者Google Big Query是否拥有自己的存储机制。

我在学习架构，我看到箭头互相指向，但它没有说GBQ的架构在哪里？

谢谢。

2017-08-10 arcee123

巨像 - 分布式存储

的BigQuery依靠巨人，谷歌最新一代的分布式文件系统。每个Google数据中心都有自己的Colossus群集，并且每个Colossus群集都有足够的磁盘，以便每次为每个BigQuery用户提供数千个专用磁盘。 Colossus还处理复制，恢复（当磁盘崩溃时）和分布式管理（因此没有单点故障）。 Colossus足够快到允许BigQuery提供与许多内存中的数据库类似的性能，但利用了更便宜但高度并行化的，可伸缩，耐用和高性能的基础架构。

BigQuery中利用了ColumnIO柱状存储格式和压缩算法来以最佳方式在巨人数据存储用于读取大量结构化data.Colossus的允许大量查询用户扩展到几十PB的在存储无缝，而无需支付附加更昂贵的计算资源的代价 - 大多数传统数据库都是这种情况。

关于ColumnIO的部分已过时--BigQuery现在使用Capacitor format - 但其余部分仍然相关。

来源

2017-08-10 20:42:46

是巨人一个谷歌云存储的东西？意思是它用在两者上？还是GCS和Colossus之间的独立架构？ – arcee123

[GCS建立在巨像之上]（https://cloudplatform.googleblog.com/2014/01/easier-faster-lower-cost-big-data-processing-with-the-google-cloud-storage-connector - 用于-hadoop.html）。 Colossus为Google自己的服务提供了一个较低级别的存储API。 –

谢谢！这是我需要知道的一件事。 – arcee123

谷歌云平台架构

回答

相关问题