2
我有一个dataset ,温度为一列。由于加热器的工作原理,数据中存在一些缺陷。为了直接比较不同的数据集,我想填写这些缺失的温度,并在另一列中添加相应的NaN。通过重新索引将行插入数据框
我试过使用这里给出的答案,这似乎正是我想要的:link。 但是,这并不工作 - 我得到了新的温度值,我希望有一个数据帧,但相应的数据已经:
import pandas as pd
import numpy as np
A1 = pd.read_table('Test data.tsv', encoding='ISO-8859-1', header = 2)
A1.columns = ['time',2,3,4,5,6,7,'freq',9,10,11,12,13,'temp',15,16,17,18,19]
A1truncated = A1[A1.temp >= 25]; A1truncated=A1truncated[A1truncated.temp <= 350.1]
A1averaged = A1truncated.groupby(['temp'], as_index=False)['freq'].mean()
A1averaged = np.around(A1averaged, decimals=1)
A1averaged.set_index('temp')
new_index = pd.Index(np.arange(25, 350, 0.1), name='temp')
A1indexed = A1averaged.set_index('temp').reindex(new_index).reset_index()
打开我的19列到1温度指数( A1averaged),然后分成2列,新的温度列表和一列空数据(A1索引)。 任何想法为什么这不起作用?或另一种方法来做同样的事情?
完美,非常感谢!我永远不会注意到浮动问题 – Yobmod