我的问题如下:如何匿名处理选定标记的XML数据?
我必须读取一个大的XML文件,50 MB;并匿名与私人问题有关的一些标签/字段,如姓名地址,电子邮件,电话号码等...
我确切知道XML中的哪些标签将被匿名化。
s|<a>alpha</a>|MD5ed(alpha)|e;
s|<h>beta</h>|MD5ed(beta)|e;
alpha
哪里和beta
指内的任何字符,这也将被散列,使用可能的算法等MD5。
我只会转换标签值,而不是标签本身。
我希望我对自己的问题有足够的了解。我如何实现这一目标?
甲50 MB文件可能会有点多的DOM处理,根据在存储器中的数据结构的扩展因子。至少可能需要一段时间才能有结果出来。流或拉处理可能是一个更好的主意。 – mirod 2009-02-20 13:33:24