在webspiders/crawlers中,我怎样才能得到实际的初始用户在HTML文档中看到的字体的渲染大小,在记住CSS。如何获取网页上字体的大小?
0
A
回答
3
渲染文本大小? 用户可以使用他/她的浏览器设置随意更改文字大小。 更不用说不同的浏览器呈现相同的内容略有不同。
0
如果你满意的答案是为“默认”,为了这个目的没有用户自定义视图(这很可能),我相信你正在寻找一个相当痛苦的情景:
嵌入在您的蜘蛛中支持CSS 的渲染引擎。希望 使用与您的用户的大多数 匹配的引擎,或者使用 所有三种通用引擎,并存储 所有这些引擎的信息。您的消费技术在 嵌入方便程度差异很大。
将正在爬行的URI加载到 渲染引擎中。
使用引擎的API,查询它的 字体规格包含你认为 代表文本元素 (选择这 为此我甚至不会 开始预测策略的运动)。 如何访问此操作完全取决于 您的 引擎的嵌入方案。
我希望这是'硬道路',但我不确定是否有'简单'的方法。
相关问题
- 1. 如何获取网页中元素的文字字体大小
- 2. 在网页上获取图像大小
- 3. 如何从CMFCPropertyFontProperty获取字体大小
- 4. Java获取字体大小
- 5. 获取字体大小
- 6. 如何获取UILabel的字体大小和字体名称?
- 7. 网页的字体大小和行高
- 8. CSS - 提高网页字体大小
- 9. 网站上的不同字体大小
- 10. SVG - 获取TextElement的字体大小
- 11. 获取div的计算字体大小
- 12. 如何使用自定义字体大小获取字符大小
- 13. ASP.net无法获取字体大小
- 14. Ruby代码获取网页的字节大小
- 15. 如何获取页面大小
- 16. Java - 如何获取JTextPane的默认字体大小
- 17. 如何获取HTML中的字体大小
- 18. 如何在自定义UITableViewCell中获取UILabel的字体大小?
- 19. 如何获取ace编辑器的当前字体大小?
- 20. 如何获取html标签的字体大小
- 21. 如何获取网页上可见DOM元素的可视大小
- 22. Winforms上的字体大小
- 23. 如何减少网站的整体字体大小?
- 24. 如何使用pdfbox获取字体大小
- 25. 用CGContextShowGlyphsAtPoint绘制文本 - 如何获取字体大小?
- 26. 从文本中获取字体和字体大小?
- 27. iPhone上的字体大小小于PC
- 28. 不同手机上的网站上的字体大小相同
- 29. 如何获取ImageRendition大小?
- 30. 如何缩小字体大小?
将使用浏览器的默认大小,除非它设置在某处。通常CSS中的字体总是至少设置一次。爬虫应该查看DOM层次结构来确定使用了哪种CSS设置,除非它被HTML本身的内联CSS覆盖。相当多的工作,但可能的。虽然将标题与普通文本分开以便更好地了解是什么,但可能会更容易。 – Alec 2009-06-19 21:26:02