lynx

    -1热度

    1回答

    我的单页设计网站上有几个锚点。那些通过JavaScript动画的人不能在屏幕阅读器lynx中工作。 单击其中一个链接始终定位此页面上的第一个锚点。 由于Javascript不会影响(通常)屏幕阅读器的行为 - 我该怎么办? @Allan:感谢您的帮助! 因此,这里是一些代码:链接到主导航,只能通过屏幕阅读器看到直接跳转到id为“mainnavi”链接: <p class="sreenreader-

    1热度

    1回答

    我试图在我的perl cgi脚本中运行lynx,以便从wen页面中提取一些文本。我这样做是在我的脚本通过以下方式, lynx -source -preparsed "$url" > data.txt 但我得到我的服务器的error_log以下错误: 仰望www.xyz.com 使HTTP连接到www.xyz.com警报!: 无法连接到远程主机。 山猫:无法访问startfile xyz.com 我

    0热度

    1回答

    我用lynx转储网站。 lynx -dump https://URL.com > file.txt 某些URL被分成两行,如果可能,我想停止。我有什么选择吗? 我运行一个sed命令,去除行不以http,所以你可以看到这个问题。 谢谢, 克里斯 编辑:我要补充一点,我想的链接不要把得到的可见或隐藏链接部分。

    1热度

    1回答

    我想在Amazon EC2 Linux中设置一个cron以在每天晚上12:15 AM运行SOLR全导入。 在我设置cron之前,我尝试在终端中测试它是否正常工作。我用下面的命令来测试 /usr/bin/lynx http://amzon-instance-ip:8983/solr/work/dataimport?command=full-import 输出命令: [1] 15153 但是,

    -1热度

    1回答

    HTML文件中提取文本我有一个脚本: cd ../data; dossier=$(ls crawl); let "compte = 1"; for file in $dossier do lynx --dump --nolist $file >> ../data/txt/$compte'.txt'; let "compte = compte + 1"; done 我使用l

    0热度

    1回答

    我正在尝试从10个URL的.txt文件中提取原始数据,并将每行(URL)的原始数据放在.txt文件中。然后通过使用Python重复处理过程中的数据(来自同一个原始.txt文件的原始数据被剥离了html)。 import commands import os import json # RAW DATA input = open('uri.txt', 'r') t_1 = open('c

    1热度

    2回答

    正如我研究的最聪明的方式是使用API​​,但使用cURL时,我可以在输出中找到所有需要的信息,但它有点混乱。 curl https://www.youtube.com/user/HowdiniGuru/videos | grep "watch?" 返回包含视频网址,所有需要的块: <h3 class="yt-lockup-title "><a class="yt-uix-sessionlink

    0热度

    1回答

    我需要编写一个脚本,告诉给定网站(第一个参数)是否已更改。我写了类似的东西,但它不工作,不能让发现错误 #!/bin/bash website=$1 time=$2 #frequency of checking the page x=1 spr=$(diff -s ttt.txt ttt1.txt) lynx -dump $website | cat > ttt.txt ttt1.t

    0热度

    2回答

    我正在运行lynx来测试我必须做的一些HTML,因为考虑到可访问性。我猜想,如果Lynx看起来很漂亮,那么屏幕阅读器,蹩脚手机和其他东西的整个范围都可以,甚至是大多数古老的硬件。 在某些情况下,我使用了一个快捷方式,以防止在支持和启用JS的常规情况下一次性清除所有静态HTML,包括将所有静态HTML标记嵌套在标识的div标记中被消灭。 后来我意识到,引起了我的lynx编译行为改变: <!DOCTY

    1热度

    1回答

    我想用grep的结果对猞猁命令 lynx -head -dump http://abdsadsac.org 结果该命令 Looking up 111.111.111.111:9004 Making HTTP connection to 111.111.111.111:9004 Alert!: Unable to connect to remote host. lynx: Can't a