screen-scraping

    0热度

    1回答

    我想从这个网站刮交换价格信息,并采取后入数据库:https://www.mnb.hu/arfolyamok 我写了这个代码,但蹊跷的吧。我如何解决它,我必须改变它? 我与Python 2.7.13在Windows 7 的代码工作是在这里: import csv import requests from BeautifulSoup import BeautifulSoup u

    0热度

    1回答

    我目前正在尝试在PowerShell中开发一个用于打开Internet Explorer,更改两个下拉值(更新表值)的脚本,然后将表格最好拖放到CSV文件中。 顺便说一句,该网站有一个静态的URL,改变下拉不改变网址:( 我可以得到IE打开和改变两个下拉值,但该表不是在此之后更新自己的价值观...... 我认为这是值得做的网站代码,它显示了这个下拉菜单的选项: <select id="pricin

    0热度

    1回答

    我得到当我打电话一个错误:其被定义为Datascrape(): Sub Datascrape() Dim count, i As Long Dim ie As Object count = Sheets("properties-2017-06-05").Cells(1, 10).Value Sheets("properties-2017-06-05").Ra

    0热度

    1回答

    建立 我与scrapy刮房屋广告的UL部分。 我成功收集每个广告的大部分住房特征,随后用大熊猫进行分析。 问题 我似乎无法凑了一定ul广告页面。这个问题涉及任何房屋广告页面上的“主要功能”和“额外”部分:例如this one。 当我尝试刮擦元素时,我收到一个空白返回。 尝试次数 我试过以下,以获得 '附加' response.css("section.divFeatures") # empty

    0热度

    2回答

    如何从具有下表数据的html页面提取日期“June 03,2017”。日期将根据订单号更改。我不确定我是否正确使用它。请指教。 <tr> <td style="font:bold 24px Arial;">Order #12345</td> <td style="font:13px Arial;"><strong>Order Date:</strong> June 03, 20

    0热度

    1回答

    我为我的应用程序使用Windows“问题步骤记录器”(PSR),并需要将每个ActionSet(截图)与时间戳一起存储为滴答粒度粒度。目前PSR HTML文件给我按以下格式每一个动作: <EachAction ActionNumber="120" Time="11:43:44 AM" Pid="8992" ProgramId="0000da39a3ee5e6b4b0d3255bfef9560189

    0热度

    1回答

    因此我对此很陌生,在这个问题上,我一直没能在google上找到任何东西。 我使用要求和LXML与的Python,我已经看到有很多关于网页抓取不同的模块,但没有任何理由在选择一个另一个?你可以使用request/lxml来做同样的事情吗?例如BeautifulSoup? 无论如何,这里是我的实际的问题; 这是我的代码: import requests from lxml import html

    1热度

    1回答

    这是我的代码。我正在尝试打印商业名称并且它的工作原理 但打印商业地址时始终为空值。 from lxml import html import requests from bs4 import BeautifulSoup page = requests.get('https://appext20.dos.ny.gov/lcns_public/bus_name_inq_frm?p_reco

    0热度

    1回答

    当我刮的网页https://www.g2a.com/rising-storm-2-vietnam-steam-cd-key-global.html 我需要从表中数据的标题。 var express = require('express'); var fs = require('fs'); var request = require('request'); var cheerio = requ

    0热度

    1回答

    我刮的网页https://www.g2a.com/rising-storm-2-vietnam-steam-cd-key-global.html 我需要从表中数据的标题。 var express = require('express'); var fs = require('fs'); var request = require('request'); var cheerio = requi