2017-06-20 51 views
-4

嗨,我真的很陌生,我很难实现我附上csv文件的代码,我需要创建一个表格,显示男性和女性的平均工资CSV file for the data 请问你们有这些问题:R编程表创建

Q1。 使用R创建一个表格,显示被放置的男性和女性的平均工资。检查数据中是否存在性别差异。换句话说,观察这个数据集中男性的平均工资是否高于女性的平均工资。并且我还需要运行 t检验来测试以下假设: H1:男性MBA的平均薪水高于女性MBA的平均薪水。

+5

向我们展示您的尝试。我们不在这里为你做你的工作。并请参阅https://meta.stackoverflow.com/questions/284236/why-is-can-someone-help-me-not-an-actual-question – GhostCat

回答

0

请参阅GhostCat关于提问的评论链接。话虽如此,以下可能会帮助你找出如何去做你所要求的。

有一些您可能需要熟悉的方便功能。要阅读csv文件,您需要运行read.csv,您可以在其中按Tab键通知您可输入的参数 - 例如,header = TRUE表示csv的第一行仅为标题信息。

dat <- read.csv(file = "~\WHERE\FILENAME.csv", header = TRUE) 

要保存任何对象保存为data.frame你可以使用as.data.framedata.frame功能。

df <- as.data.frame(dat) 

要将data.frame按某个值拆分成不同的列表,可以使用split函数。

df_Gender <- split(df, df$Gender) 

上列出工作的最佳方法是熟悉apply系列函数(查看完整的可运行和解释R Grouping functions: sapply vs. lapply vs. apply. vs. tapply vs. by vs. aggregate)。

如果您在处理一个步骤时遇到非常麻烦的问题,请在发布问题之前疯狂搜索。祝你好运。

+0

我是新来的这个,所以抱歉发布恼人的整个问题。我的不好 –

+0

我为表格创建了一个数据框,现在我想在某个列的这个表中找到平均值。 **> dean.df < - table(mba.df $ Gender,mba.df $ Placement) >查看(dean.df)** –

+0

所以我添加了平均函数'dean.df < - table(mba.df $ Gender,mba.df $ Placement,mean) 表中的错误(mba.df $ Gender,mba.df $ Placement,mean): 所有参数必须具有相同的长度' –