如何使用Spark MLlib 构建分类模型

2025-03-22 12:06:28
推荐回答(1个)
回答1:

1.1 LDA实例 实例步骤: 1)加载数据 返回的数据格式为:documents: RDD[(Long, Vector)],其中:Long为文章ID,Vector为文章分词后的词向量;用户可以读取指定目录下的数据,通过分词以及数据格式的转换,转换成RDD[(Long, Vector)]即可。