categorical-data

    2热度

    1回答

    例如,我在以下csv格式数据: 1,2,1:3:4,2 0,1,3:5,1 .. 。 由逗号分隔的每一列代表一个特征。通常情况下,一个特征是独热(例如COL0,COL1,COL3),但在这种情况下,用于COL2特征具有多个输入(由冒号分隔)。 我敢肯定tensorflow可以处理一个热功能,以稀疏张量,但我不知道它是否能与多个输入,比如COL2处理功能? 如果可以,应该如何表示张量流的稀疏张量?

    5热度

    5回答

    我使用下面的一段代码将字符串转换为数据集中的分类值。 data['weekday'] = pd.Categorical.from_array(data.weekday).labels 对于例如, index weekday 0 Sunday 1 Sunday 2 Wednesday 3 Monday 4 Monday 5 Thursday 6 Tuesday 编

    1热度

    1回答

    我是R的新手,真的想把所有东西都包裹起来(甚至在线课程 - 迄今为止一直没有帮助)。 我开始的是一个大型数据框,其中包含97个有关符合法规的变量。 我已经根据不同的地理位置创建了多个数据框(可能有更简单的方法)。 在每个这些数据框中,我有7个变量,我希望找到“是”和“否”响应的意思。 我第一次尝试: summary(urban$vio_bag) Length Class Mode

    1热度

    1回答

    我有这样一个数据帧添加新类别列,与10M行: probe time 2016-01-01 00:05:00 3 2016-01-01 00:05:00 1 2016-01-01 00:05:00 5 2016-01-01 00:05:00 5 2016-01-01 00:05:00 4 2016-01-01 00:05:00 2 2016-01-01 00:05

    1热度

    1回答

    使用熊猫0.18.1,当过滤列dtype是category时,我意识到不同的行为。这是一个简单的例子。 import pandas as pd import numpy as np l = np.random.randint(1, 4, 50) df = pd.DataFrame(dict(c_type=l, i_type=l)) df['c_type'] = df.c_type.ast

    2热度

    1回答

    我想创建一个图形,就像名为Fathom的软件一样。 我有希望创造这样一个波动的情节绝对频率数据的双向表,但关键的区别是,你可以看到各个数据点。 我试过ggfluctuation(...),levelplots(...)和各种包装(如ggplot2),但没有成功。我在任何论坛上都找不到任何帮助。 如果有人能够帮助我指导或创建一些能达到我目标的代码,我将非常感激。

    -2热度

    2回答

    我想了解R.回归我试图解决一个锻炼至极拥有100个随机男女数据集是这样的: sex sbp bmi male 130 40.0 female 126 29.0 female 115 25.0 male 120 33.0 female 128 34.0 ... 我想一个数字摘要(0)绘制了sbp和bmi(1)之间的关系,并用R^2(2)估计了beta1,beta2和

    -1热度

    1回答

    我有一个单元格包含不同的唯一值的分类变量的单元格。假设单元格被称为r,在r {1,1}中,我们有第一个类别,包括“a”,“b”,“c”,在r {1,2}中我们有“高”,“低“,依此类推到r {1,n}。 我的问题是如何做一个循环来获得分类组合的所有可能的组合。我无法使用allcombs函数,因为r中的每个单元都必须单独输入。我需要将这个循环放在更大的函数中。

    0热度

    1回答

    不像sort pandas dataframe based on list,我有一个索引数据帧是这样的: $ echo -e 'abc\txyz\t0.9\nefg\txyz\t0.3\nlmn\topq\t0.23\nabc\tjkl\t0.5\n' > test.txt $ cat test.txt abc xyz 0.9 efg xyz 0.3 lmn opq 0.23 abc j

    1热度

    1回答

    我正在尝试创建一个代表今年的月份的Shiny滑块。理想情况下,我希望将月份显示为字符串/字符而不是整数(其中1 = 1月,2 = 2月等)。 我发现this question,这导致我this answer,允许字符显示在Shiny滑块上。它将JS代码插入到R. 当我尝试更改上述答案以适合我的示例时,我可以正确显示月份名称,但我认为在JS代码中存在循环问题。而不是1对应的值为1,它对应的值为0.我