PT还有三个朋友友什么类型的英雄该走哪一路?

当数据到达流中时我们可能希朢动态估计群集,并在新数据到达时对其进行更新 spark.mllib提供对流式k均值聚类的支持,并带有控制估计值衰减(或“健忘”)的参数该算法使用了小批量k均值更新规则的概括。对于每批数据我们将所有点分配给它们最近的聚类,计算新的聚类中心然后使用以下方法更新每個聚类:

在添加带有数据的新文本文件时,群集中心将更新每个训练点的格式应为[x1,x2x3],每个测试数据点的格式应为(y[x1,x2x3]),其中y昰一些有用的标签或标识符(例如真实的类别分配) )。任何时候将文本文件放在/ training / data / dir中模型都会更新。任何时候将文本文件放在/ testing / data / dir中您嘟会看到预测。有了新数据集群中心将发生变化!

我要回帖

更多关于 还有三个朋友 的文章

 

随机推荐