2010-09-03 97 views
2

我觉得我在这里错过了一些简单的东西(像往常一样)。如何读取Java中的PGM图像?

我正在尝试使用Java读取PGM图像。 Matlab的不只是罚款 - 输出图像的像素(例如,一个小的32×32图像)在Matlab中给了我这样的事情:

1 0 11 49 94 118 118 106 95 88 85 96 124 143 142 133

我的Java的读者,但是,输出这样的:

1 0 11 49 94 118 118 106 95 88 85 96 124 65533 65533 65533

似乎像127以上的像素值用65533填充,尽管它确实得到了一些不正确的随机值,甚至几乎将整个底行赋值为-1。

下面是我使用的代码:

filePath = 'imagepath.pgm'; 
FileInputStream fileInputStream = new FileInputStream(filePath); 
BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(fileInputStream)); 

// read the header information ... 

int [][] data2D = new int [picWidth] [picHeight]; 

for (int row = 0; row < picHeight; row++) { 
    for (int col = 0; col < picWidth; col++) { 
    data2D[row][col] = bufferedReader.read(); 
    System.out.print(data2D[row][col] + " "); 
    } 
    System.out.println(); 
} 

fileInputStream.close();

任何想法,将不胜感激。

编辑这里是无符号的PGM值:

  1  0 11 49 94 118 118 106 95 88 85 96 124 143 142 133 
    30 26 29 57 96 122 125 114 102 94 91 101 127 146 145 136 
    96 85 70 75 101 128 136 126 111 106 106 112 131 149 153 147 
    163 147 114 93 99 120 132 123 110 113 124 129 137 154 166 168 
    215 195 149 105 88 99 114 111 106 123 148 158 160 174 191 197 
    245 224 173 115 81 82 100 109 117 144 179 194 194 205 222 230 
    235 217 170 115 78 78 113 117 100 83 80 212 214 226 244 253 
    178 167 135 93 68 78 123 129 106 77 69 202 204 222 244 255 
    114 110 92 64 54 81 107 105 83 59 56 182 184 201 222 231 
    79 80 71 52 55 97 67 55 41 33 42 184 179 181 185 183 
    62 66 65 52 63 115 29 16 12 17 30 209 197 174 150 132 
    40 47 52 44 55 109 171 196 188 186 208 229 218 179 136 107 
    31 38 44 37 43 89 145 167 158 159 191 223 219 179 133 105 
    48 52 56 51 57 91 128 133 117 120 157 196 200 168 128 105 
    64 67 70 73 87 114 127 107 79 81 118 159 173 154 123 104 
    63 67 73 83 107 132 129 91 54 54 88 130 153 146 123 106

标题是这样的:

P5 
# MatLab PGMWRITE file, saved 27-Jun-2002 
16 16 
255

编辑#2

下面是完整的输出,以证明下面的概念代码:

 
Skipping unknow token: "" 
Skipping unknow token: "1^vvj_XU`|���" 
Skipping unknow token: "" 
Skipping unknow token: "9`z}rf^[e���`UFKe��~ojjp������r]cx�{nq|������ÕiXcroj{��������sQRdmu��������٪sNNqudSP�����]DN{�jME�����rn\@6QkiS;8�����OPG47aC7)!*�����>BA4?s" 
Skipping unknow token: "" 
Skipping unknow token: "" 
Skipping unknow token: "�Ů��(/4,7m�ļ���ڳ�k" 
Skipping unknow token: "&,%+Y������۳�i04839[��ux��Ȩ�[email protected]���{h?CISk��[66X���{j" 
Exception in thread "main" java.util.NoSuchElementException 
    at java.util.Scanner.throwFor(Scanner.java:838) 
    at java.util.Scanner.next(Scanner.java:1347) 
    at Test.main(Test.java:49) 

行中抛出的异常简称为:

System.out.println(String.format("Skipping unknow token: \"%s\"", scan.next())); 

的问题,我敢肯定,有事情做的事实,这些图像文件包括两个ASCII文本/数字,以及作为二进制图像数据。但是,如果Java阅读PNG没有问题,为什么缺乏对PGM的支持?

编辑3

好吧,我找到问题的实施......不幸的是,它弃用:

filePath = "imagepath.pgm" 
    FileInputStream fileInputStream = new FileInputStream(filePath); 
    DataInputStream dis = new DataInputStream(fileInputStream); 
    StreamTokenizer streamTokenizer = new StreamTokenizer(dis); 

    // read header text using StreamTokenizer.nextToken() 

    data2D = new int [picWidth] [picHeight]; 
    for (int row = 0; row < picHeight; row++) { 
    for (int col = 0; col < picWidth; col++) { 
     data2D[row][col] = dis.readUnsignedByte(); 
     System.out.print(data2D[row][col] + " "); 
    } 
    System.out.println(); 
    } 

根据Java文档中,StreamTokenizer(InputStream)构造已过时,因为DataInputStream.readLine()方法不能正确地将原始字节转换为字符。但是,它似乎在标题上的这个特定情况下起作用,并且显然适用于随后的二进制图像数据。

不幸的是,它仍然是过时了,它似乎是通过混合一BufferedReader作为文档读取头和尝试使用DataInputStream读取原始字节后,表明在EOFException唯一的结果。仍然在寻找解决方案...

+0

完成并完成,让我知道你可能还需要什么。 – Magsol 2010-09-06 21:53:58

回答

6

您的代码存在的问题是您使用错误的类从文件中读取原始数据。由于BufferedReader文件说:

public int read() throws IOException

读取单个字符。

返回:字符范围读,为整数0到65535(0x00-0xffff),或-1,如果流的末尾,已达到

所以每次调用read()方法的BufferedReader实际上会从输入流中消耗一个或两个字节(基于字符编码),这不是您想要的。这也解释了为什么你得到了很多-1:流比你想象的要早得多。

由于PGM包含ASCII码十进制值,因此使用Scanner类很容易解析。

下面是一个几乎未经测试的代码演示了如何读取PGM图像假设:

  • 它包含一个神奇的数字后一个注释(即它没有以#除了开头的行第二个)
  • PGM文件正好是4行。

下面的代码:

String filePath = "image.pgm"; 
fileInputStream = new FileInputStream(filePath); 
Scanner scan = new Scanner(fileInputStream); 
// Discard the magic number 
scan.nextLine(); 
// Discard the comment line 
scan.nextLine(); 
// Read pic width, height and max value 
int picWidth = scan.nextInt(); 
int picHeight = scan.nextInt(); 
int maxvalue = scan.nextInt(); 

fileInputStream.close(); 

// Now parse the file as binary data 
fileInputStream = new FileInputStream(filePath); 
DataInputStream dis = new DataInputStream(fileInputStream); 

// look for 4 lines (i.e.: the header) and discard them 
int numnewlines = 4; 
while (numnewlines > 0) { 
    char c; 
    do { 
     c = (char)(dis.readUnsignedByte()); 
    } while (c != '\n'); 
    numnewlines--; 
} 

// read the image data 
int[][] data2D = new int[picHeight][picWidth]; 
for (int row = 0; row < picHeight; row++) { 
    for (int col = 0; col < picWidth; col++) { 
     data2D[row][col] = dis.readUnsignedByte(); 
     System.out.print(data2D[row][col] + " "); 
    } 
    System.out.println(); 
} 

需要实现:注释行的支持,对于每一个元素的值应该由maxvalue进行划分,对错误的文件,异常处理的错误检查。我使用UNIX行尾测试了PGM文件,但它也应该在Windows上工作。

请让我强调一下,这不是PGM解析器的强大而不完整的实现。此代码仅用于概念验证,可能会满足您的需求。

如果你确实需要一个健壮的PGM解析器,你可以使用Netpbm提供的工具。

+0

这很好,但它会产生一个新问题:解析出头文件。我使用BufferedReader/StreamTokenizer来读取标题字符,出于某种原因,一旦完成,第一次调用dis.readByte()就会抛出EOFException异常。如果我从文件中删除标题并直接从二进制文件中读取,我遇到了一个不同的问题:它读取的前55个字节是垃圾数字;第56个字节是在我的原始文章中首先显示的“1”,后面是所有相应的数字(由于垃圾导入,最多55个字节)。有什么想法吗? – Magsol 2010-09-06 21:56:33

+0

呃抱歉,无视55字节的位;如果我消除标题(因此,BufferedReader/StreamTokenizer并具有单个文件句柄 - DataInputStream - 从文件读取),它工作得很好。 – Magsol 2010-09-06 22:05:54

+0

我的不好,我没有阅读PGM文件格式规范。我会尽量在几分钟内给它一个镜头。 – 2010-09-06 22:33:17