mahout

    0热度

    1回答

    我正在尝试在AWS EMR集群上运行Mahout ALS建议,但这需要比我预期的更长的时间。 以下是我运行命令: aws add-steps --cluster-id <cluster_id> \ --steps Type=CUSTOM_JAR,\ Name="Mahout ALS Factorization Job",\ Jar=s3://

    0热度

    1回答

    我有6000个用户评分3900部电影的800.000条记录的训练数据集。 这些存储在逗号分隔的文件中,如:​​。 我有另一个数据集(200.000条记录),格式为:userId,movieId。我的目标是使用第一个数据集作为训练集,以确定第二组缺失的偏好。 到目前为止,我设法加载了训练数据集,并生成了基于用户的建议。这非常顺利,并且不需要太多时间。但是在写回建议时我很挣扎。 我尝试的第一个方法是:

    0热度

    1回答

    我试着写输出到一个CSV文件,但第一个值都是这种格式 我使用的ObjectOutputStream到文件时。通常第一个值应该是1,1,1,2,2,2,3 .... 这是我的代码有什么想法吗? import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.Obje

    4热度

    1回答

    有没有类似于Mahout's XmlInputFormat但是对于Flink? 我有一个很大的XML文件,我想提取特定的元素。在我的情况下,这是一个维基百科转储,我需要得到所有<page>标签。 I.e.如果我有一个文件 <mediawiki> <siteinfo>...</siteinfo> <page>...</page> <page>...</page>

    0热度

    1回答

    运行电影推荐我跑到下面的代码,但收到错误...... # The HDInsight cluster name. $clusterName = "my-cluster-name" Use-AzureHDInsightCluster $clusterName # NOTE: The version number portion of the file path # may change

    -3热度

    2回答

    我试图编译Mahout的环境变量的拖尾斌/ java的,我临时改变JAVA_HOME变量是这样的: export JAVA_HOME=/usr/lib/jvm/java-1.6.0-openjdk-1.6.0.33.x86_64/ 和 我检查是否正确地使用这种改变命令: printenv |grep JAVA_HOME 返回: JAVA_HOME=/usr/lib/jvm/java-1.6

    1热度

    1回答

    我学习象夫本站教程象夫随机森林: http://mahout.apache.org/users/classification/partial-implementation.html ,但是当所有的工作顺利完成我的输出文件是这样的: @ 1 @ 。@ 0 @ @ 1 @。@ 0 @ @ 0 @。@ 0 @ @ 1 @。@ 0 @ @ 1 @。@ 0 @ @ 0 @。@ 0 @ @ 0 @。@ 0 @

    0热度

    2回答

    从终端输入路径到目录运行mahout spark-itemsimilarity时出现以下错误。 Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 0 at org.apache.mahout.math.cf.SimilarityAnalysis$.cooccurrencesIDSs(Similarit

    1热度

    2回答

    目前我正在使用Mahout RowSimilarity Job进行一些文档相似性分析。这可以通过从控制台运行命令'mahout rowsimilarity ...'轻松完成。不过我注意到这个Job也支持在Spark引擎上运行。我想知道如何在Spark Engine上运行此作业。

    0热度

    1回答

    我使用Java 8与Hadoop和Mahout 0.10.0一起构建了一个软件,并在Mahout库的代码中进行了一些自定义更改。 我使用Maven来管理依赖关系。 其他依赖正在由hadoop common和hdfs和纱线等maven处理。 我在内部使用RandomWrapperClass的任务的运行时遇到问题。 以下错误发生的每一个地图操作: Error: java.lang.ClassNot