试试这个(正常方式):
with open("rawCorpus.txt", 'r') as read_file:
raw_data = read_file.readlines()
my_save_data = open("testFile.text", "a")
for lines in raw_data:
if "." in lines:
re_lines = lines.replace(".", ".\r\n")
my_save_data.write(re_lines)
else:
my_save_data.write(lines + "\n")
my_save_data.close()
如果你的文本文件不是很大,你可以试试这个太:
with open("rawCorpus.txt", 'r') as read_file:
raw_data = read_file.read()
re_data = raw_data.replace(".", ".\n")
with open("testFile.text", "w") as save_data:
save_data.write(re_data)
UPDATE(输出新行也取决于您的文本查看器!因为在某些文本编辑器中,“\ n”是一个新行,但在其他一些文件中,“\ r \ n”是一个新行。 ):
输入样本:
这是一本书。我喜欢它。
这是一个苹果。我喜欢它。
这是一台笔记本电脑。我喜欢它。
这是一支笔。我喜欢它。
这是一个手机。我喜欢它。
代码:
last_buffer = []
read_lines = [line.rstrip('\n') for line in open('input.txt')]
my_save_data = open("output.txt", "a")
for lines in read_lines:
re_make_lines = lines.split(".")
for items in re_make_lines:
if items.replace(" ", "") == "":
pass
else:
result = items.strip() + ".\r\n"
my_save_data.write(result)
my_save_data.close()
输出继电器将是:
这是一本书。
我喜欢它。
这是一个苹果。
我喜欢它。
这是一台笔记本电脑。
我喜欢它。
这是一支笔。
我喜欢它。
这是一个手机。
我喜欢它。
什么问题? –
如果发现“。”,我正在阅读文件。或句子结尾时,应该添加一个换行符,然后继续拆分。 –
你的文本文件很大?或不? – DRPK