readlines

0热度

1回答

我正在处理的文本和PDF文件等于或小于5KB。如果该文件是一个文本文件，我从形式的文件，并获得字符串中所需的输入来概括： file = file.readlines() file = ''.join(file) result = summarize(file, num_sentences) 它是很容易做到，但对于PDF文件，事实证明它不是那么容易的。有没有办法将pdf文件的句子作为一个字符

3热度

5回答

阅读，直到一个点的Python

我有一个文本文件的完整数据与 #Name #main 然后启动它，然后许多数字，然后将该文件与 #extra !side 所以这里有一个结束小片段 #Name #main 60258960 33031674 72302403 #extra !side 我想只读取数字。但是，这是一脚，我希望他们每个人都是他们自己的单独的字符串。所以我知道如何读头后开始 read=f.r

5热度

1回答

如何避免在Python文件输入库中缓冲

我在这里看到过这个问题，但给出的答案在我的情况下不起作用，并被标记为重复。 python -u does not work for stdin in Python 3. sys.stdin = sys.stdin.detach()抛出一个ValueError: underlying buffer has been detached。这些都不适用于非stdin输入和其他文件被用作流。 Adding

0热度

1回答

只读包含某些特定字符串的行，并在其上应用正则表达式

这是我的代码：我有一个脚本读取文件，但在我的文件中，并非所有行都相似，我只想从行中提取信息有I DOC O:。我试过用if条件，但它仍然在有些情况下正则表达式不配套线路不工作： #!/usr/bin/env python # -*- coding: utf-8 -*- import re def extraire(data): ms = re.match(r'(\S+).*

1热度

4回答

如何在Python中以相反的顺序将输入文件中的行写入输出文件3

我想要做的是从一个文本文档中取一系列行，并在一秒钟内将它们反过来。例如文本文档中包含： hi there people 因此，因此我希望写这些同样的思路，以文本文档B，只是这样的： people there hi 到目前为止，我有： def write_matching_lines(input_filename, output_filename): infile = op

0热度

1回答

不同索引的行读取

下面是我放在一起搜索文本文件中的数字的一些代码。这对我想要做的事很好。现在它找到7个位置，我需要读取7个不同索引处的行。什么可能是开始这个最好的方法。谢谢，这是用C＃编写的。 private void button1_Click(object sender, EventArgs e) { richTextBox1.Text = ""; using (Open

1热度

3回答

python从文件读取特定行并继续

我想从文件中读取特定行，并在结束每个块的过程后继续读取。假设我在文件中有19000行。每次我将提取前19行，使用这些行进行一些计算并将输出写入另一个文件。然后，我将再次提取接下来的19行，并执行相同的处理。所以，我试图用以下方式提取行： n=19 x = defaultdict(list) i=0 fp = open("file") for next_n_lines in izip_l

-1热度

1回答

Python 2.7：将一行转换为260个字符的行，并在每行中删除'_'之前的所有字符

我必须将infile转换为260个字符的行，并且除去之前的所有内容（包括字符）'_' 我一直在找几个小时，并找到一种方法来转换为260个字符。 lines = infile.readlines() [line[i:i+n] for i in lines(0, len(line), 640)] 并发现了很多例子，在字符串或所有字符后删除字符后的参数。请帮我在这里...

2热度

1回答

用Python中的连续字符读取文件

我正在寻找一种很好的pythonic读取文件的方式，并且连接上面那些逻辑连续的任何行，如线连续字符所示。例如。 Here is a normal line. This line continues over \ two lines. This line continues over\ three \ lines. 我在这里找到了一个解决方案：http://code.activesta

2热度

2回答

Python islice正在读取相同的行

我有一个大的日志文件（> 1GB）应该被分析，所以我写了一个python程序。我已经使用islice，所以我可以读取文件块（10,000行），这样我的服务器不会用完内存。我查阅了一些关于stackoverflow的islice解决方案并实现了一个，但程序无法按预期工作，因为isclice每次都读取相同的行（但在读完整个文件后正确停止...）。我不能使用with open因为它与Python 2.