data-science-experience

    1热度

    1回答

    我有一个在rails应用程序中创建的Postgresql数据库,我想添加默认值。 我创建了一个迁移 class AddCityStateDefaults < ActiveRecord::Migration def change change_table :addresses do |t| t.change_default :city, default: "Los A

    1热度

    1回答

    的spark documentation展示了如何可以添加火花包: sparkR.session(sparkPackages = "com.databricks:spark-avro_2.11:3.0.0") 我相信初始化会话时,这只能使用。 如何在DSX上使用笔记本电脑为SparkR添加Spark包?

    1热度

    1回答

    我试图用无头和具有::现场delimmiters数据集的工作: ! wget --quiet http://files.grouplens.org/datasets/movielens/ml-1m.zip ! unzip ml-1m.zip ! mv ml-1m/ratings.dat . ! head ratings.dat 输出: 1::1193::5::978300760 1::

    0热度

    1回答

    我抓到那FTPLIB可以用DSX IBM数据科学体验 from ftplib import FTP 卜如何做一个SFTP连接看起来蟒蛇笔记本里面?这样我就可以自动导入本地数据。 TIA

    0热度

    1回答

    我有一个包含2个colomns的数据集,第一个表示一个星期(从21-39开始),第二个表示在医学测试中表示某个结果的数字。 这是数据的外观 head(s) Week ILI 21 11 22 14 23 34 24 56 25 56 21 67 22 4 23 45 我想有这样看的数据,所以我可以绘制它 21 22 23 24 25 11 14 34 56 56 67

    1热度

    2回答

    rdd.map给出:TypeError:不支持的操作数类型为 - :'Row'和'float' temprdd = df.select('results').rdd 然后,我想要做的所有在它的对象计算(基本上在我的“结果”栏,我觉得现在是自己的RDD): 我使用创建一个数据帧的RDD : sqrt(temprdd.map(lambda x : pow(x-mean,2)).sum()) 但

    1热度

    1回答

    我需要访问Spark历史记录服务器,以便我调整缓慢的火花作业。 我正在寻找DSX中的链接,但找不到一个链接,因此我已经在Bluemix控制台中打开了Spark服务,并从那里直接导航到Spark历史记录服务器(作业历史记录链接)。 有没有办法直接从DSX访问Spark历史记录服务器?

    0热度

    3回答

    我试图调整慢速运行的DSX作业的性能。 我已从Bluemix上的基础Spark业务导航到Spark历史记录服务器(按照此question)。 我已经执行包含一些基本的火花代码单元: In [1]: x = sc.parallelize(range(1, 1000000)) x.collect() Out[1]: [1, 2, 3, 4, 5, ... 以后,我在浏览器中刷新

    0热度

    3回答

    我试图连接到IBM的星火作为Bluemix从RStudio我的台式机上运行的运行的服务。 我抄config.yml从IBM的数据科学实验运行自动配置RStudio环境: default: method: "shell" CS-DSX: method: "bluemix" spark.master: "spark.bluemix.net" spark.in

    5热度

    1回答

    我需要配置通过SSL协议连接到服务器。我从服务器所有者获得2个文件 - CA根证书(ca.pem)和测试证书请求(test.csr文件)。 我尝试测试通过的OpenSSL s_connect工具连接,我给奇怪的结果(XXX - 蒙面值): openssl s_client -connect MYURL -CAfile ca.pem CONNECTED(00000003) xxx verify