数据分析和机器学习
机器学习是输入输出一个data frame。比如,有一个iris的data frame,先用name字段来做一个分类字段,调用split方法将其分成60%的训练数据和40%的测试数据。然后初始化一个randomforests,其里面有一棵决策树,调用train方法训练训练数据,调用predict方法形成一个预测数据,调用segments[0]就可以看到可视化结果。
未来计划
分布式numpy,dataframe基于分布式numpy的后端;
内存计算,提升交互式体验;
tensorflow。