2017-08-17 75 views
0

我想从NCEP GFS(天气预报数据提供者)下载FTP文件并从中提取一些参数。过滤后(我只需要温度和降水),每天GRIB格式(二进制)大约有1 GB的数据。由于这些文件包含“网格数据”,因此SQL Azure不是(IMHO)存储此类文件的最佳解决方案(10年数据导致存储3 TB)。最后,这些文件应该由Azure ML和Power BI使用。报告涉及一些“地理空间联合”,按国家,州等汇总网格数据。选择合适的Azure技术来存储和处理天气预报数据

您对如何选择正确的技术有任何想法吗? 当我阅读Azure文档时,由于数据存储太多而很难理解它们各自的优点和缺点:Azure Data Lake,HDInsight等等,因此我有点迷路。

在此先感谢您帮帮我。

问候

+0

FTP站点是ftp://ftp.ncep.noaa.gov/pub/data/nccf/com/gfs/prod/ – RudyCo

+0

数据的过滤使用GriApi.NET完成:https://github.com/0x1mason /GribApi.NET – RudyCo

回答

0

在数据存储方面,你可以存储在蔚蓝的Blob存储数据。可能是一个功能应用程序来处理这些文件。这是基于我对编制数据的一点理解。