我正在使用scrapy来抓取YouTube视频,并且需要视频的标题/描述语言。当我在this video上使用浏览器视图源时,我可以在脚本标记内有一个变量'METADATA_LANGUAGE': 'no'
。我可以在scrapy和它的扩展中提取这个值,或者我应该下载并使用像beautifulsoup/htmlparser这样的库解析html。我如何提取scrapy中的javascript值
0
A
回答
0
根据this,您可以选择带有xpath/css的脚本文本,然后使用正则表达式搜索变量名称。假设第一个脚本包含METADATA_LANGUAGE
:
items = response.xpath('//script/text()')[0].re(".*METADATA_LANGUAGE.*")
1
是的,这是可能的使用Scrapy。你可以看看this question。
有很多方法可以实现你要找的东西。一种方法是使用scrapy的选择器获取<script>
标签,然后使用regex获取您要查找的特定METADATA_LANGUAGE
变量。
相关问题
- 1. 如何提取scrapy
- 2. Scrapy - 我如何从嵌套链接中提取信息
- 3. 如何为scrapy提供抓取网址?
- 4. Scrapy如何提取样式属性?
- 5. 如何使用scrapy提取全价?
- 6. 我如何从javascript中提取rapidminer xpath值
- 7. SCrapy提取数据
- 8. 提取文本的XPath scrapy
- 9. Scrapy /从scrapy中隐藏的divs中提取数据
- 10. 如何从Scrapy中提取网页中的所有内容
- 11. 如何使用javascript提取值?
- 12. 我如何提取美丽的值?
- 13. Scrapy“Quotes Tutorial” - 提取文本中的Unicode
- 14. Scrapy:如何提取嵌套div(xpath选择器)中的内容?
- 15. 如何提取文本以及scrapy中的超链接文本?
- 16. 如何提取中值?
- 17. 提取与XPath和scrapy
- 18. 如何从DOM中使用JavaScript提取元素值,如果我知道XPATH?
- 19. 如何在javascript中提取输入元素的值
- 20. javascript:如何提取在此表单中输入的值?
- 21. 如何使用Scrapy从变量中提取文本?
- 22. 如何在Scrapy中提取嵌套文本?
- 23. Scrapy/Python/XPath - 如何从数据中提取数据?
- 24. 如何抓取scrapy中url的url?
- 25. 如何在JSON中提取[[]]中的值?
- 26. Python的Scrapy:跟随链接,并提取数据从JavaScript表
- 27. 如何从MongoDB中将值提取到JavaScript中?
- 28. 如何使用scrapy提取动态加载的图像的src
- 29. 如何连接我的文本与模型中的值提取?
- 30. Javascript - 提取跨度值
如果您希望JavaScript生成的内容看Selenium。它使用浏览器获取最终呈现的html,并将其返回scrapy进行刮取。 – Steve