readlines

    0热度

    1回答

    我正在处理的文本和PDF文件等于或小于5KB。如果该文件是一个文本文件,我从形式的文件,并获得字符串中所需的输入来概括: file = file.readlines() file = ''.join(file) result = summarize(file, num_sentences) 它是很容易做到,但对于PDF文件,事实证明它不是那么容易的。有没有办法将pdf文件的句子作为一个字符

    3热度

    5回答

    我有一个文本文件的完整数据与 #Name #main 然后启动它,然后许多数字,然后将该文件与 #extra !side 所以这里有一个结束小片段 #Name #main 60258960 33031674 72302403 #extra !side 我想只读取数字。但是,这是一脚,我希望他们每个人都是他们自己的单独的字符串。 所以我知道如何读头后开始 read=f.r

    5热度

    1回答

    我在这里看到过这个问题,但给出的答案在我的情况下不起作用,并被标记为重复。 python -u does not work for stdin in Python 3. sys.stdin = sys.stdin.detach()抛出一个ValueError: underlying buffer has been detached。 这些都不适用于非stdin输入和其他文件被用作流。 Adding

    0热度

    1回答

    这是我的代码:我有一个脚本读取文件,但在我的文件中,并非所有行都相似,我只想从行中提取信息有I DOC O:。 我试过用if条件,但它仍然在有些情况下正则表达式不配套线路不工作: #!/usr/bin/env python # -*- coding: utf-8 -*- import re def extraire(data): ms = re.match(r'(\S+).*

    1热度

    4回答

    我想要做的是从一个文本文档中取一系列行,并在一秒钟内将它们反过来。例如文本文档中包含: hi there people 因此,因此我希望写这些同样的思路,以文本文档B,只是这样的: people there hi 到目前为止,我有: def write_matching_lines(input_filename, output_filename): infile = op

    0热度

    1回答

    下面是我放在一起搜索文本文件中的数字的一些代码。这对我想要做的事很好。现在它找到7个位置,我需要读取7个不同索引处的行。什么可能是开始这个​​最好的方法。谢谢,这是用C#编写的。 private void button1_Click(object sender, EventArgs e) { richTextBox1.Text = ""; using (Open

    1热度

    3回答

    我想从文件中读取特定行,并在结束每个块的过程后继续读取。假设我在文件中有19000行。每次我将提取前19行,使用这些行进行一些计算并将输出写入另一个文件。然后,我将再次提取接下来的19行,并执行相同的处理。所以,我试图用以下方式提取行: n=19 x = defaultdict(list) i=0 fp = open("file") for next_n_lines in izip_l

    -1热度

    1回答

    我必须将infile转换为260个字符的行,并且除去之前的所有内容(包括字符)'_' 我一直在找几个小时,并找到一种方法来转换为260个字符。 lines = infile.readlines() [line[i:i+n] for i in lines(0, len(line), 640)] 并发现了很多例子,在字符串或所有字符后删除字符后的参数。 请帮我在这里...

    2热度

    1回答

    我正在寻找一种很好的pythonic读取文件的方式,并且连接上面那些逻辑连续的任何行,如线连续字符所示。例如。 Here is a normal line. This line continues over \ two lines. This line continues over\ three \ lines. 我在这里找到了一个解决方案:http://code.activesta

    2热度

    2回答

    我有一个大的日志文件(> 1GB)应该被分析,所以我写了一个python程序。我已经使用islice,所以我可以读取文件块(10,000行),这样我的服务器不会用完内存。 我查阅了一些关于stackoverflow的islice解决方案并实现了一个,但程序无法按预期工作,因为isclice每次都读取相同的行(但在读完整个文件后正确停止...)。我不能使用with open因为它与Python 2.