python有哪些数据分析和数据展现的模块可以用

2025-03-12 01:01:54
推荐回答(2个)
回答1:

ipython:只是个notebook,但是很好用。。。

numpy
scipy :
pandas
matplotlib: python画图
nltk, gensim:nlp
statsmodels: 各种模型
scikit-learn: machine learning模块,很全

回答2:

1、python下的数据分析模块
pandas:依赖于numpy和sciepy,主要用于数据分析,数据预处理以及基本的作图,这个包不涉及复杂的模型。
statsmodels:统计包,设计各种统计模型,包括回归、广义回归、假设检验等,结果类似于R语言,会给出各种检验结果。
对于numpy和scipy是作为科学计算用的,提供各种向量矩阵计算、优化、随机数生成等等。
以上都是一些包,如果是分析环境的话,可以考虑spyder和ipython notebook——其中ipython notebook 是可以把代码、结果以及报告同时结合在一起的东西——类似于R语言的Rmarkdown。
2、python的数据可视化
最常用的matplotlib,用于科学制图——基础的绘图,已经集成在pandas里。此外,ggplot2在R语言下的绘图神器,也同时支持python的哟,非常推荐。
3、数据存储
一般都用数据库吧。如果怕麻烦,用cPickle直接把数据保存成文本,下次使用直接load就可以。此外,python是内置了spqlite3数据库的,可以直接使用。对于复杂的数据,可以使用数据库接口——各种的,包括hadoop。