domcrawler

    0热度

    1回答

    这是一个项目,我在空闲时间帮助减少了在公司重复点击所花的时间,所以我希望它不会被冒犯或禁止。 Page to be scraped 我只想要第二个链接的URI,因为它是精确的搜索匹配。第一个也包含后缀-V1331后缀。 错误: <a href="http://pdb2.turck.de/en/DE/products/0000000000011ba40002003a"> <strong>

    1热度

    2回答

    我在做功能测试和我得到的错误 InvalidArgumentException:当前节点列表为空 这是我的代码 public function testThis(){ $requestContent = [ 'val1' => '324343', 'valname' => '"Benjamin"', 'valLast' => '"A"',

    0热度

    2回答

    我开始使用Goutte从网站获取所需的信息,它的辉煌,它节省了我的大量时间和麻烦。但另一方面,有时出现异常,我不知道是什么导致了他们。所以继承人我从现在刮一个页面: http://lifecenter.sgst.cn/hit/search.jsp?key1=%27a%27&key2=%27b%27&key3=%27c%27&key4=%27d%27&key5=C0305 我一直在经历这个网站,下面

    2热度

    1回答

    是否可以使用DomCrawler获取数据? $cralwer->attr('class')得到了节点的类属性,但是->attr('data-something')或->attr('something')总是导致null。 编辑:标签PHP也是因为我尝试从php操作DomElement对象(使用->attributes->getNamedItem()),它仍然不起作用。我想知道是否根本无法返回数据属

    1热度

    1回答

    <span class="tl"> <a href="/en/laravel/" class="c">laravel</a>, <span>goutte</span>, <a href="/en/html/">html</a>, <span>dom crawler</span>, <a href="/en/form/">form</a><span>guzzle</span>, <span>w

    2热度

    1回答

    我使用Symfony DOM Crawler读取并保存包含模板的HTML文档。但是模板中缺少结束的HTML标签。这里有一个例子: <?php $htmlString = <<<'HTML' <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Title</title> </hea

    1热度

    1回答

    当我得到没有DomCrawler的内容时,我得到带有自定义标签(如@click)的html,但是当我使用$this->crawler->filter('something')->html() DomCrawler正在删除我的@click标签。 这里不使用DomCrawler一个例子: 这里使用DomCrawler: 正如你所看到的,是DomCrawler删除所有@clicks,怎么能我阻止了这个?

    1热度

    1回答

    我使用DomCrawler获得从谷歌Play的数据页和它的作品的情况下,99%,除了我偶然发现了一个网页,它无法找到具体的股利。我检查了HTML代码,它肯定存在。我的代码是 $autoloader = require __DIR__.'\vendor\autoload.php'; use Symfony\Component\DomCrawler\Crawler; $app_id = 'com

    0热度

    1回答

    我正在抓取this页面。我访问下面的HTML获取部分细节: <h2> <span class="mw-headline" id="Volume_one:_Quicksilver_.282003.29">Volume one: <i> <a href="https://en.wikipedia.org/wiki/Quicksilver_(novel)"

    2热度

    2回答

    我有一个GOUTTE /客户端(GOUTTE用来请求symfony的),我想加入的路径,并获得最终的URL: $client = new Goutte\Client(); $crawler = $client->request('GET', 'http://DOMAIN/some/path/') // $crawler is instance of Symfony\Component\DomC