2017-04-24 121 views
2

我正在进行一项临床研究项目,该项目使用全国性医院出院的大型数据集。我们正在使用SPSS进行统计分析。计算跨多个变量的频率SPSS

该数据集包含25个诊断变量(DX1-DX25),每个放电可捕获多达25个诊断。患者可能有多种诊断,因此DX1将作为主要诊断,DX2将作为次要诊断,等等。

DXn变量是包含ICD-9代码的字符串变量。 ICD-9是一种诊断疾病分类的系统。

我们想知道所有25个诊断变量中的10个最常见的诊断(ICD-9代码)。有没有办法在SPSS中的所有25个诊断变量上运行频率分析?换句话说,我想要一个频率表,显示每个ICD-9代码的组合频率/出现频率。

谢谢!

回答

1

你可以重组(以获得一个变量的所有诊断),然后使用一个简单的频率分析:

varstocases /make DX from DX1 to DX25. 
freq DX. 

你应该这样做在一个单独的数据集,并保留原始数据集的结构。例如:

dataset name OrigData. 
dataset copy ForRestr. 
dataset activate ForRestr. 
varstocases ..... 
freq .... 
dataset activate OrigData. 
+2

如果DX变量是与相关值标签一起的数字,那么可以使用多重响应组,例如'MULT RESPONSE GROUPS = $ DX(DX1 TO DX25 1,100))\ FREQUENCIES $ DX.'如果它们是字符串,可以使用'MRSETS',但是您需要使用'CTABLES'而不是'FREQUENCIES'。 –

+0

@AndyW,为什么不把它作为答案?到“DXn变量”的问题是字符串变量“。 –

+0

工作很好,谢谢! – pottedsucculent

2

如果你有机会获得定制表(CTABLES)过程中,您可以定义一个多类别集(分析>表>多重响应集,并使用定制表格程序在所有变量制表不管变量是字符串还是数字,这都可以工作