1
我有一个关于文本处理任务,我不知道如何从不同的表中某些列合并成一个表将两个id结合到一个新表中?
因此,这里的情况: 我有一个名为list
与id_doc
表,title
列 然后我创建一个名为term_list
的新表,其中包含结果字词列表,当我对list
标题进行文本处理时。
term_list
表具有id_term
,term
,df
和idf
列。最后,我想有一台名为term_freq
具有tf
列id
,id_term
,id_doc
,和normalized_tf
例如: 表list
是这样的:
id_doc titles
11 information retrieval system
12 operating system
13 business information
表term_list
是下面这个样子:
id_term term df idf
21 information 2 --
22 retrieval 1 --
23 system 2 --
24 operating 1 --
25 business 1 --
我想问一下如何创建一个表term_freq
这样表becom像这样?
id id_term id_doc tf normalized_tf
31 21 11 1 --
32 22 11 1 --
33 23 11 1 --
34 24 12 1 --
35 23 12 1 --
36 25 13 1 --
37 21 13 1 --
主要的问题是我必须参加id_term
和id_doc
到一个表一个id_doc
有关系的几个id_term
,但我不知道如何关联,因为list
和term_list
没有任何类似的列。
请帮助:(