python+大数据计算平台,pyodps架构搭建

数据分析和机器学习

机器学习是输入输出一个data frame。比如,有一个iris的data frame,先用name字段来做一个分类字段,调用split方法将其分成60%的训练数据和40%的测试数据。然后初始化一个randomforests,其里面有一棵决策树,调用train方法训练训练数据,调用predict方法形成一个预测数据,调用segments[0]就可以看到可视化结果。

未来计划

分布式numpy,dataframe基于分布式numpy的后端;

内存计算,提升交互式体验;

tensorflow。

Posted in 未分类

发表评论