screen-scraping

0热度

1回答

我想从这个网站刮交换价格信息，并采取后入数据库：https://www.mnb.hu/arfolyamok 我写了这个代码，但蹊跷的吧。我如何解决它，我必须改变它？我与Python 2.7.13在Windows 7 的代码工作是在这里： import csv import requests from BeautifulSoup import BeautifulSoup u

0热度

1回答

Powershell网页抓取IE下拉不更新值

我目前正在尝试在PowerShell中开发一个用于打开Internet Explorer，更改两个下拉值（更新表值）的脚本，然后将表格最好拖放到CSV文件中。顺便说一句，该网站有一个静态的URL，改变下拉不改变网址:( 我可以得到IE打开和改变两个下拉值，但该表不是在此之后更新自己的价值观...... 我认为这是值得做的网站代码，它显示了这个下拉菜单的选项： <select id="pricin

0热度

1回答

获取错误91在运行中的数据刮代码

我得到当我打电话一个错误：其被定义为Datascrape()： Sub Datascrape() Dim count, i As Long Dim ie As Object count = Sheets("properties-2017-06-05").Cells(1, 10).Value Sheets("properties-2017-06-05").Ra

0热度

1回答

发行刮页面

建立我与scrapy刮房屋广告的UL部分。我成功收集每个广告的大部分住房特征，随后用大熊猫进行分析。问题我似乎无法凑了一定ul广告页面。这个问题涉及任何房屋广告页面上的“主要功能”和“额外”部分：例如this one。当我尝试刮擦元素时，我收到一个空白返回。尝试次数我试过以下，以获得 '附加' response.css("section.divFeatures") # empty

0热度

2回答

python从html页面抓取日期（2017年6月10日）

如何从具有下表数据的html页面提取日期“June 03,2017”。日期将根据订单号更改。我不确定我是否正确使用它。请指教。 <tr> <td style="font:bold 24px Arial;">Order #12345</td> <td style="font:13px Arial;"><strong>Order Date:</strong> June 03, 20

0热度

1回答

我可以让Windows内置步骤记录器（PSR）存储刻度级别的时间戳吗？

我为我的应用程序使用Windows“问题步骤记录器”（PSR），并需要将每个ActionSet（截图）与时间戳一起存储为滴答粒度粒度。目前PSR HTML文件给我按以下格式每一个动作： <EachAction ActionNumber="120" Time="11:43:44 AM" Pid="8992" ProgramId="0000da39a3ee5e6b4b0d3255bfef9560189

0热度

1回答

使用Python Request/lxml进行网页抓取：从ul/li获取数据

因此我对此很陌生，在这个问题上，我一直没能在google上找到任何东西。我使用要求和LXML与的Python，我已经看到有很多关于网页抓取不同的模块，但没有任何理由在选择一个另一个？你可以使用request/lxml来做同样的事情吗？例如BeautifulSoup？无论如何，这里是我的实际的问题; 这是我的代码： import requests from lxml import html

1热度

1回答

Xpath Python网页抓取

这是我的代码。我正在尝试打印商业名称并且它的工作原理但打印商业地址时始终为空值。 from lxml import html import requests from bs4 import BeautifulSoup page = requests.get('https://appext20.dos.ny.gov/lcns_public/bus_name_inq_frm?p_reco

0热度

1回答

问题做网页刷屏

当我刮的网页https://www.g2a.com/rising-storm-2-vietnam-steam-cd-key-global.html 我需要从表中数据的标题。 var express = require('express'); var fs = require('fs'); var request = require('request'); var cheerio = requ

0热度

1回答

面临的问题，当使用网页抓取页面表节点JS

我刮的网页https://www.g2a.com/rising-storm-2-vietnam-steam-cd-key-global.html 我需要从表中数据的标题。 var express = require('express'); var fs = require('fs'); var request = require('request'); var cheerio = requi