本文共 303 字,大约阅读时间需要 1 分钟。
更多精彩内容参见云栖社区大数据频道;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问。
本讲义出自Nathan Stephens在Spark Summit East 2017上的演讲,Sparklyr是一个让你在Spark中进行数据分析就像在R开发环境下进行数据分析的R语言包,Sparklyr 支持处理数据帧对象的常用工具dplyr的完整后端,你可以使用dplyr将R代码翻译成Spark SQL,Sparklyr还支持MLlib,所以你可以在分布式数据集上运行分类器以及回归、聚类、决策树等机器学习算法,讲义中演示了如何使用Sparklyr和Rsparkling分析数据。
转载地址:http://bwdel.baihongyu.com/