2015-10-19 111 views
1

下面是数据快照:转换一个熊猫系列串

enter image description here

我想找到被包含的子页面获得的总要求“为XXXXX”(假设)

每当我尝试在PAGE_NAME变量进行任何字符串操作,显示属性为float和我正在一个error.Here是错误: Error

我从一个CSV文件中得到的数据。它有600万条记录。它显示的数据类型为: “语言”:对象, “PAGE_NAME”:对象, “请求”:Int64的

我试图将其转换为字符串使用:english_data['page_name'].astype(basestring)

似乎不是正在工作。

+3

而是发布数据帧的截图总数,如果您直接复制并粘贴数据,其他人可以更容易地重现您的问题。另外,请更新抛出错误的代码以及您收到的错误。 –

+0

它确实有助于发布实际代码而不是图片。 – Leb

回答

2

您可以使用Seriesstr属性以矢量化方式应用字符串方法。要查找的行与一些字符串'xxx''page_name'列,你可以做

df.page_name.str.contains('xxx') 

GET请求到该页面,你可以这样做

df.requests[df.page_name.str.contains('xxx')].sum()