我正在转换正在从PDF文件中读取的文本。 特别是,我有一个字符向量,其中包含连字符(“ - ”),用于预制大纲,或将单词分隔为新行,但仅当发生时才会出现。例如: text text text 123-
456 text text..
我想要做的就是删除所有hypens和toghether粘贴这些话。 text text text 123456
text text..
我开始尝试: li
我试图执行基于http://tidytextmining.com/sentiment.html#the-sentiments-dataset情感分析。在执行情感分析之前,我需要将我的数据集转换为整洁的格式。 我的数据集的形式: x <- c("test1" , "test2")
y <- c("this is test text1" , "this is test text2")
res <-