2017-10-17 189 views
0

我打算从网络资源(网络报废)中做数据提取作为我工作的一部分。我想提取我公司10公里范围内的信息。从网上提取数据

我想提取的信息,如公寓,其地址,单位数量和每平方英尺的价格。其他事情如该地区的多所学校和幼儿园以及酒店。

我知道我需要从几个来源/网页中提取。我也将使用Python。

我想知道应该使用哪个库或多个库。网络报废是唯一的手段吗?我们可以从Google地图提取信息吗?

此外,如果任何人有任何经验,我将非常感激,如果你能指导我这一点。

非常感谢,伙计们。

回答

0

对于Google地图,请尝试API。谷歌TOS非常沮丧地使用Google地图数据提取的网络抓取工具。

如果您使用的是Python,它具有非常好的库BeautifulSoup和Scrapy用于此目的。

其他意思?您可以从OSM数据中提取POI,尝试使用开源工具。物业信息?可以从政府办公室为您的县/州提供,试试看。

+0

谢谢!尝试Google API和BeautifulSoup! – arshyMA