dataframe

    0热度

    1回答

    我正在尝试解析一些网域(数以万计)以查看它们是否包含任何英文单词。 我很容易解析域名以获取tldextract域的主要部分,然后尝试使用enchant来查看它们是否存在于英文字典中。 问题是我不知道如何将域分割成多个单词来检查,即latimes返回False,但times会返回True。 有没有人知道一个聪明的方法来看,如果在字符串中包含任何英语单词? 谢谢!

    0热度

    2回答

    我有一个包含列“日期”数据集: date item 20.3.2010 17:08 a 20.3.2010 11:16 b 2010-03-20 15:55:14.060 c 2010-03-21 13:56:45.077 d 我想有格式20.3.2010 17:08所有值转换为2010-03-21 13:56:45.077。 有没有人有想法? 谢谢。

    2热度

    3回答

    我有一个数据框,以便该列包含json对象和字符串。我想摆脱不包含json对象的行。 下面是我的数据框的样子: import pandas as pd df = pd.DataFrame({'A': ["hello","world",{"a":5,"b":6,"c":8},"usa","india",{"a":9,"b":10,"c":11}]}) print(df) 我应该如何删除只包

    -1热度

    1回答

    1)我有两个数据帧。他们有相同的数量和名称的列。我怎样才能将它整合到一个数据框中? 我需要像np.vstack那样的数据框。 2)我有'性'栏的数据框,'男'和'女'在哪里。我怎样才能改变值“男性” 1和“女”为0(无环路) 预先感谢

    1热度

    1回答

    我正在尝试创建一个新列,其中另一列中的值的平均值取决于另一列中的值。 pd.DataFrame({"A":[1, 2, 1, 2], "B":[4, 6, 8, 12] 我想创建一个新的列“C”,这将是 pd.DataFrame({"A":[1, 2, 1, 2, 3], "B":[4, 6, 8, 12, 4], "C":[6,9,6,9,4]} 如果

    1热度

    3回答

    非常新的火花/斯卡拉。我想知道是否有一种简单的方法来以列式方式聚合Array [Double]。这里有一个例子: c1 c2 c3 ------------------------- 1 1 [1.0, 1.0, 3.4] 1 2 [1.0, 0,0, 4.3] 2 1 [0.0, 0.0, 0.0] 2 3 [1.2, 1.1, 1.1] 然后,一旦聚集,我会看起来像一个表

    2热度

    2回答

    组 从等于最高值的值数据框中选择多行我有一个数据帧,看起来像这样: query <- c('a','a','a','b','b','b','c','c','c') hit <- c(1,2,3,4,5,6,7,8,9) score <- c(97,97,96,98,97,96,99,99,98) df <- data.frame(query,hit,score) df quer

    3热度

    1回答

    我有一个csv文件,它有很多列。一列包含字典对象形式的数据以及字符串。例如:列包含以下数据:{“a”:5,“b”:6,“c”:8},“usa”,“india”,{“a”:9,“b” :10,“C”:11} 当我使用阅读本CSV成数据帧: df = pd.read_csv(path) 该列的数据被识别为字符串当我没有df.applymap(type) 检查每个类型元素存储在这个特定的列中。 但是

    0热度

    2回答

    我的数据集示例如下: df1 <- data.frame(v1 = c(1,1,1,4,5,5,4,1,2,3,5,6,2,1,5), v2 = c(11,13,3,42,15,25,44,13,21,73,65,26,52,11,57)) df2 <- data.frame(v3 = c(1,2,3,0,4,5,6,7)) df2$newCol = 0 我想要做以下的伪代

    1热度

    2回答

    如果您想要查找数据框中每列的最大频率并返回因子,类别和频率,您会做什么? 所以我的代码如下: dfreqcommon = data.frame() for (i in 1:ncol(diamonds)){ dfc = data.frame(t(table(diamonds[,i]))) dfc$Var1 = names(diamonds)[i] dfreqcommon = rbind