世界很杂乱,来自现实世界的数据也一样杂乱。近来一份调查报告显示数据科学家60%的时间都花在整理数据上。不幸的是,57%的人认为这是工作中最头疼的一部分。
整理数据非常消耗时间,不过也有许多工具被开发出来让这关键的一步变得稍微可以忍受。python 社区提供了许多库让数据变得清晰有序——从格式化 dataframe 到匿名化数据集。
告诉我们你觉得有用的库——我们一直致力于优化放入mode python notebooks中的库。
更多资料:https://github.com/luminosoinsight/python-ftfy