我正在处理大量由5K多个不同实体准备的文档。我试图做的一件事是确定一个盒子是否被检查过。编制者需要通过检查五个不同框中的一个来指示一些信息。试图编写一些代码来确定是否在html页面中检查了框
问题是编写者自己决定如何在html中显示一个复选框。他们的一些表示很有趣。他们主要依靠wingdings作为字体指令。这里有几个类型的选中的复选框的我发现迄今
'serif">S</font>'
'wingdings">x</font>'
'ü'
'ý'
'þ'
<font style="font-family: Wingdings; font-variant: normal">þ</font>
的一段代码,我上面粘贴的文件被打开时与IE浏览器的变体将显示一个确认框,它会呈现什么否则当文档用Firefox,Safari或Chrome打开时。
下面是另一个例子
<div style="DISPLAY: block; MARGIN-LEFT: 0pt; TEXT-INDENT: 0pt; MARGIN-RIGHT: 0pt" align="center"><font style="DISPLAY: inline; FONT-SIZE: 10pt; FONT-FAMILY: times new roman">THE DATA THAT HAS THE CHECKED BOX <font style="DISPLAY: inline; FONT-FAMILY: wingdings 2, serif">R</font></font></div>
所以我想最简单的形式,我的问题是
有什么python中“知道”是
<font style="DISPLAY: inline; FONT-FAMILY: wingdings 2, serif">R</font>
这是一个检查框?然后进一步扩展 - 是否有什么'知道'这个几乎每一个检查框可以呈现在HTML代码中的方式?
我要说明的是,当我检查的字体元素的文本,我得到一个Unicode [R
我希望这是更清晰。
对我们所问的没有任何意义。请更改您的问题,并以较少的blabla来达到这个程度......具体的问题是什么 - 将其归结为两个句子。 – 2011-04-04 01:57:43
相反,如果任何人有另一种方式,我可以考虑这个问题,将不胜感激。 – PyNEwbie 2011-04-04 02:08:55
你真正的问题是什么?将其缩减为两个句子... – 2011-04-04 02:11:14