我有一个数据集并希望在一端丢弃1%的数据。例如,我有3000个观测值,我想放弃30个最高值。有没有这种修剪的命令?顺便说一句,我是Stata新手。在Stata中修剪数据
1
A
回答
1
您可以在Stata中使用_pctile
。
sysuse auto, clear
_pctile weight, nq(100)
return list #this is optional
drop if weight>r(r99) #top 1 percent
1
如果你知道你可以使用什么截止是你降:
drop if var1>300
其下降与var1
超过300
您可以使用summarize var1, detail
拿到钥匙百分所有行:它会给你1%和99%的百分点以及其他标准百分位数。
0
要在Stata选择30个观测,请使用以下命令:
keep if (_n<=30)
为了跌幅居前30的意见在Stata,请使用以下命令
keep if (_n>30)
+0
这是一个误导,作为一个答案,没有解释说你必须先排序并分别处理缺失的值。 –
相关问题
- 1. 修剪大数据
- 2. 在Pyspark数据框中修剪
- 3. MySQL的:修剪数据库
- 4. 修剪数据,并删除
- 5. 数据库修剪策略
- 6. 修剪数据,摆脱“*”
- 7. 修剪SQL Server数据库中的值
- 8. 试图修剪sqlite中的数据
- 9. 修剪数据库中的内容?
- 10. 从MySQL中的数据修剪字符
- 11. Stata中的数据精度
- 12. Stata。排序数据
- 13. 在MySQL中修剪中间数字?
- 14. 在stata中分离面板数据
- 15. 修剪在C#
- 16. 在查找表中修剪字符串中的数据
- 17. 如何在.NET中修剪数组?
- 18. Hibernate UserType截断修剪数据
- 19. 如何高效地修剪数据
- 20. 修剪表格字段数据
- 21. asp.net MVC3:修剪所有HTTP POST数据
- 22. MySQL的修剪数据更新
- 23. 读取JSON数据和修剪串
- 24. 使用YouTube数据API修剪视频
- 25. 如何修剪音频数据?
- 26. 修剪左空间数据库
- 27. \通过NSURLRequest发送数据时修剪
- 28. H2数据库CSVREAD不修剪引号
- 29. 如何在GridDiew列中修剪数据,从数据库中检索
- 30. 在C++中修剪double值
只是为了指出什么应该是显而易见的:许多统计人员认为这种数据丢失是一个坏主意。一个相关但不同的点是,这不是在例如修剪手段,其中极值被忽略,但不被删除。 'trimmean'(SSC)是用户编写的Stata实现。 –