2013-03-11 162 views
0

我有一个工作脚本(视窗32位)成功地读取密码保护的网站onwith read.csv一个txt文件。下面是非常简单的代码片段:阅读文本文件成R有密码保护的网站

fname <- "http://www.frontierweather.com/degreedays/StatePopulationWeightedWeatherData_Since2010.txt" 
dd2 <- read.csv(fname, sep=",", header=T) 

后来我有一个新的计算机(Windows 64位)和read.csv没有loger似乎能够获得超出网站的认证。相反,在它的,这似乎是有关网站验证的乱码数据框读取数据读取:

> head(dd2) 
        X..DOCTYPE.html.PUBLIC....W3C..DTD.XHTML.1.0.Transitional..EN 
1      http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd> 
2          <html xmlns=http://www.w3.org/1999/xhtml> 
3                   <head> 
4             <title>Please login</title> 
5           <link rel=stylesheet type=text/css 
6   href=http://www.frontierweather.com/amember/templates/css/reset.css /> 

Uncessfully,我已经试过几件事情要设法得到它的工作:

    从旧机器
  1. 转移饼干在
  2. 打开网站当系统提示允许窗口与保存的用户名和密码,
  3. 前缀的网址(以FNAME)“用户名:密码@”
  4. 在数据存储为“可信站点”的interent explorer集合网站中。
  5. 经过所有ackages是
  6. 验证,无论是新老机都运行同一版本的新电脑,旧电脑上相同的Internet Explorer的

任何帮助或方向(第9版)将不胜感激。

+2

Try [RCurl](http://stackoverflow.com/a/3236879/1412059)? – Roland 2013-03-11 16:03:23

+0

@Roland:RCurl是一个我不喜欢并且愿意学习的软件包,但是您能否指出一个起点或者如何从网页读取一个简单的.txt文件的好例子,它受密码保护?谢谢] – MikeTP 2013-03-11 17:24:22

回答

1

我想通了,我的问题,因为我浪费了一整天试图解决这个问题,我想分享我的解决方案,所以希望它不会引起他人相同的惊愕,因为它引起了我。

首先,据我所知道的,问题有绝对无关,与R或从32到64位机的切换。相反,这一切似乎源于Internet Explorer 7中的新设置,它是从Internet Explorer 7开始引入的。

在Internet Explorer的选项中,选项为“启用保护模式(需要重新启动Internet Explorer)” ) 默认。 Internet Explorer允许您更改以下每个安全区域的设置:Internet,本地Intra Net,受信任的站点和受限制的站点。

加在我的数据被外包给可信站点列表中的网址后,我被选中的复选框关闭启用保护模式。一旦进行了此更改并重新启动Internet Explorer,read.csv(上面)就可以完美工作。

做一些进一步的研究后,我发现了以下内容:

保护模式有助于防止恶意软件在互联网利用 漏洞Explorer 7中,保护您的计算机免受 ,黑客可以获得访问最常用的方法你的系统。 - How To Disable Protected Mode in Internet Explorer 7

大概是由具有保护模式启用(与我的新电脑来了一个默认设置);它阻止R访问包含我的用户名和密码的cookie被送到R和/或返回到Internet Explorer以检索数据。

+0

@jeromy:谢谢编辑 – MikeTP 2013-03-12 03:58:26

+0

没问题,花蕾。我正在讨论摆脱那些“在这里输入链接描述” – 2013-03-12 14:36:10