博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【Spark Summit East 2017】R与Spark:如何使用RStudio的 Sparklyr和H2O的 Rsparkling分析数据...
阅读量:7120 次
发布时间:2019-06-28

本文共 303 字,大约阅读时间需要 1 分钟。

更多精彩内容参见云栖社区大数据频道;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问。

本讲义出自Nathan Stephens在Spark Summit East 2017上的演讲,Sparklyr是一个让你在Spark中进行数据分析就像在R开发环境下进行数据分析的R语言包,Sparklyr 支持处理数据帧对象的常用工具dplyr的完整后端,你可以使用dplyr将R代码翻译成Spark SQL,Sparklyr还支持MLlib,所以你可以在分布式数据集上运行分类器以及回归、聚类、决策树等机器学习算法,讲义中演示了如何使用Sparklyr和Rsparkling分析数据。

5a38a80e9582d2ed243bc7d96f5f3b27daab60bd

a4d31555f86d19b0951f7d33b80546e8362643ad

6e696e1206c577aaab6994c634f0be1a32b58e5e

e296a364c19fb833341b12b2ad0551f07b21a6f6

04267ba58ab9f9526eca8de65147f72c279e75e7

de160af590d3625326373365884aa28d0457f635

ad3b45500ae86f24698bfc91effce9adb6330225

bee2c0e83a313ac0e062882892d292487c9442be

179bd359b9369a6df761bbfb8ccec92fbd41b909

9088263dee1650c4b3315798754c74817c871dee

354a78b631b5b3798da9c4269b6632199e8552f6

e584128ac595f856a227653b702816827066840a

1af6870f291b4c68c8d994d1dacde20003829633

a014bd626e836b56ccb5de858cfdcf07bddacb9c

8e2d871a839f90c4e820de5e0e9e34681da49c4f

296c4a629711cf0d7d453b777e534a7b02d71063

75e27850e270de0877b00388aaf958350b785a9e

转载地址:http://bwdel.baihongyu.com/

你可能感兴趣的文章
citrix环境部署系列教程 (六)Citrix XenApp6.5安装部署
查看>>
个人选择VPS服务器的几个心得体会
查看>>
树莓派B+ debian(raspbian)源的选择
查看>>
简单DHCP服务器的配置
查看>>
我的友情链接
查看>>
我的友情链接
查看>>
浪完了,回来上班了。
查看>>
Ubuntu terminator 多窗口终端的快捷键
查看>>
如何理解阻塞和非阻塞同步和异步
查看>>
Android绘制进阶之一:图形的绘制
查看>>
不要等和专注
查看>>
我的友情链接
查看>>
我的友情链接
查看>>
Extjs Grid Cell Tooltip
查看>>
循环FTP脚本的共享和说明
查看>>
我的友情链接
查看>>
不要对最终用户谈云
查看>>
hive计算inner join报内存溢出
查看>>
Nagios邮件报警、短信报警配置
查看>>
jQuery全能权威指南昀籍配套源码
查看>>