Q

转换一个熊猫系列串

2015-10-19 111 views 1 likes

1

下面是数据快照：转换一个熊猫系列串

我想找到被包含的子页面获得的总要求“为XXXXX”（假设）

每当我尝试在PAGE_NAME变量进行任何字符串操作，显示属性为float和我正在一个error.Here是错误： Error

我从一个CSV文件中得到的数据。它有600万条记录。它显示的数据类型为： “语言”：对象， “PAGE_NAME”：对象， “请求”：Int64的

我试图将其转换为字符串使用：english_data['page_name'].astype(basestring)

似乎不是正在工作。

2015-10-19 user3252148

+3

而是发布数据帧的截图总数，如果您直接复制并粘贴数据，其他人可以更容易地重现您的问题。另外，请更新抛出错误的代码以及您收到的错误。 –

+0

它确实有助于发布实际代码而不是图片。 – Leb

A

回答

2

您可以使用Series的str属性以矢量化方式应用字符串方法。要查找的行与一些字符串'xxx'的'page_name'列，你可以做

df.page_name.str.contains('xxx')

GET请求到该页面，你可以这样做

df.requests[df.page_name.str.contains('xxx')].sum()

2015-10-19 18:59:47 JoeCondron