是否有我可以在Python中调用的函数或方法
这会告诉我数据是RSS还是HTML?
确定数据是否是python上的RSS或HTML
1
A
回答
0
文件类型通常应该在带外确定。例如。如果您要从Web服务器获取文件,则要查看的地方应该是HTTP响应的Content-Type
标头。如果您正在读取本地文件,文件系统将有一种确定文件类型的方法 - 在Windows上查看文件扩展名。
如果这些都不可用,您将不得不采取内容嗅探。这是从来没有完全可靠,RSS是特别烦,因为有它的多个不兼容的版本,而是最好的,你可以这样做很可能是:
尝试解析与XML解析器的内容。如果失败,则内容不是格式良好的XML,因此不能是RSS。
看看
document.documentElement.namespaceURI
。如果它是http://www.w3.org/1999/xhtml
,那么你已经有了XHTML。如果它是http://www.w3.org/1999/02/22-rdf-syntax-ns#
,那么你就有RSS(一种味道)。如果
document.documentElement.tagName
是rss
,那么您已经获得了RSS(略有不同的风味)。
如果文件不能被解析为XML,它可能是HTML(或者它的一些标签汤近似值)。可以想象,它也可能会被破坏RSS。在这种情况下,大多数Feed工具会拒绝它。如果您仍然需要检测这种情况,那么您会减少到在文件开头附近寻找字符串<html
或<rss
或<rdf:RSS
。这将更加不可靠。
2
您可以随时自行分析以搜索xml
标记(对于RSS)或html
标记(对于HTML)。
相关问题
- 1. Python - 确定参数是否是整数
- 2. 如何确定一个网页是否有RSS或不在C#
- 3. 确定Feed是Atom还是RSS
- 4. 确定行是否在或不是jquery
- 5. 确定数据库是否正常化
- 6. 确定PipeStream是否有数据
- 7. 确定数据是否与R有关
- 8. 确定值是否是Python中的整数
- 9. 确定输入是否是Python中的数字
- 10. 如何确定是否存在SQL服务器或数据库
- 11. 确定一个数组是否是关联(散列)或不
- 12. 如何确定“html”或“body”是否滚动窗口
- 13. 如何确定数据是否是无效的tar文件?
- 14. 确定DataColumn是否是数字
- 15. Excel:确定是否使用Save或SaveAs
- 16. 确定是否新安装或更新
- 17. 确保Python代码是否在GPU或CPU上运行
- 18. 确定是否变量在Python
- 19. 确定是否将数据添加或删除到Firebase实时数据库
- 20. 确定是否在调试或释放与python内建dll
- 21. 确定一个字符串是否是有效的HTML代码
- 22. 确定它是否是锁定类型(读取或写入)
- 23. 确定是否关系是1NF没有数据
- 24. 确定是否一个int是2的幂或不单行
- 25. 有没有确定是否“主要”是Android或Java的
- 26. 确定NSString中的路径是否是目录或文件?
- 27. 目标C,检查是否对象是不确定的或零
- 28. 如何让程序确定输入是否是python中的int?
- 29. 确定登录是否映射到特定的数据库
- 30. 如何确定一个特定的资源是否有数据
如果您指的是''声明,则不能保证RSS文件(或任何类型的XML文件)中会有一个声明。 – bobince 2010-05-21 14:35:57