哪个数据可视化工具比较好?

2024-12-12 13:23:46
推荐回答(1个)
回答1:

看了一下其他的回答,都是利用现有的可视化软件,这里以Python为例,介绍2个比较好用的可视化包—seaborn和pyecharts,简单易学、容易上手,绘制的图形漂亮、大方、整洁,感兴趣的朋友可以尝试一下,实验环境win10+python3.6+pycharm5.0,主要内容如下:

1.seaborn:这是一个基于matplotlib的可视化包,是对matplotlib更高级的API封装,绘制的图形种类繁多,包括常见的折线图、柱状图、饼状图、箱型图、热力图等,所需的代码量更少,使用起来更方便,下面我简单介绍一下这个包的安装和使用:

程序运行截图如下:

2.pyecharts:这个是echarts提供给python的一个接口,在前端的数据可视化中,可能会用到这个echarts包,借助pyecharts,我们不仅可以绘制出漂亮的柱状图、折线图等,还可以绘制3D图形、地图、雷达图、极坐标系图等,简单好用,非常值得学习,下面我简单介绍一下这个包的安装和使用:

程序运行截图如下:

补充推荐一个Python 新数据可视化模块——Plotly Express 。

Plotly Express

Plotly Express是一个新的高级Python数据可视化库,它是Plotly.py的高级封装,它为复杂的图表提供了一个简单的语法。只需一次导入,大多数绘图只要一个函数调用,接受一个整洁的Pandas dataframe,就可以创建丰富的交互式绘图。

Plotly Express 安装

惯例,使用 pip进行安装。

Plotly Express支持构建图表类型 gapminder数据集说明

我们使用gapminder数据集进行体验 Plotly Express 。

gapminder数据集显示2007年按国家/地区的人均预期寿命和人均GDP 之间的趋势:包含1952~2007年世界各国家人口、GDP发展与/地区的人均预期寿命和人均GDP 之间的趋势。

散点图scatter

常用参数说明:


使用散点图描述中国人口与GDP增长趋势图

地理散点图scatter_geo

常用参数说明


使用地理散点图描述全球人口与GDP

折线图(line)

常用参数说明


使用折线图描述1952~2007中国与美国人口增长趋势图

条形图(bar)

常用参数说明


使用条形图描述1952~2007中国与美国人口增长趋势图

等值区域图(choropleth)

常用参数说明


使用等值区域图描述各个国家人口数量

目前国内数据可视化工具或产品很多,到底那个工具或者产品是最好的?看了很多数据可视化产品,总结下来分为几大类。

下面我将一一分别进行工具介绍:

一.数据可视化库类

一个纯javascript的数据可视化库,百度的产品,常应用于软件产品开发或者 系统的图表模块,图表种类多,动态可视化效果,开源免费。

评价: 非常好的一个可视化库,图表种类多,可选的主题。Echarts中主要还是以图表为主,没有提供文本和表格方面的展现库,如果有相关需求还需要引入表格和文本方面的其他可视化库。

与echarts相似,同样是可视化库,不过是国外的产品,商用需要付费,文档详尽。

评价: 同样是非常好的一个可视化库,图表种类多。但是同样需要进行二次开发,,没有提供文本和表格方面的展现库。而且因为商用付费,所以能选择echarts肯定不会选择highcharts。

Antv是蚂蚁金服出品的一套数据可视化语法,是国内第一个才用the grammar of Graphics这套理论的可视化库。在提供可视化库同时也提供简单的数据归类分析能力。


评价: 是一个优秀的可视化库,需要进行二次开发。因为采用的是the grammar of Graphics 语法,和echarts相比各有千秋。

二.报表、BI类

由echarts衍生出来的子产品,同样继承了echarts的特点,图表种类多,没有提供文本和表格方面的展现库。Echarts接受json格式的数据,百度图说把数据格式进行了封装,可以通过表格的形式组织数据。

评价:可以把表格数据转换成图表展现形式的工具,支持excel数据导入 ,适合做静态的BI报告。因为数据偏静态,没看到与数据库结合的部分,很难和第三方系统结合展现动态变化的数据,如日报表、月报表、周报表等。

FineReport报表软件是一款纯Java编写的、集数据展示(报表)和数据录入(表单)功能于一身的企业级web报表工具,它“专业、简捷、灵活”的特点和无码理念,仅需简单的拖拽操作便可以设计复杂的中国式报表,搭建数据决策分析系统。

评价: FineReport可以直连数据库,方便快捷的定制各种复杂表样,用来做出固定格式的周报、月报等。它的格式类似于excel界面,特色功能报表制作,报表权限分配,报表管理还有填报,支持多种数据库。

Tableau 是桌面系统中最简单的商业智能工具软件,Tableau 没有强迫用户编写自定义代码,新的控制台也可完全自定义配置。在控制台上,不仅能够监测信息,而且还提供完整的分析能力。Tableau控制台灵活,具有高度的动态性。

评价: 全球知名的BI工具,价格6000元/年/人左右,但是国外产品不花钱不会为你做任何定制化改动,售后很有问题。

FineBI与FineReport都是帆软的产品。首先FineReport作为一款报表工具,主要用于解决提升IT部门的常规/复杂报表开发效率问题;而FineBI是商业智能BI工具,在IT信息部门分类准备好数据业务包的前提下,给与数据,让业务人员或领导自行分析,满足即席数据分析需求,是分析型产品。

FineBI的使用感同Tableau类似,都主张可视化的 探索 性分析,有点像加强版的数据透视表。上手简单,可视化库丰富。可以充当数据报表的门户,也可以充当各业务分析的平台。

评价:FineBI做到了自助式分析,图表类型丰富,数据分析功能较强大,钻取,筛选,分组等功能都有。但是对于普通没有IT基础的人来说,要想真正熟练地掌握finebi,还是有一定的难度的,需要花上几天,但是这个难度相比Excel的VBA学习还是低不少的。

Power BI 是一套商业分析工具,用于在组织中提供见解。可连接数百个数据源、简化数据准备并提供即席分析。生成美观的报表并进行发布,供组织在 Web 和移动设备上使用。每个人都可创建个性化仪表板,获取针对其业务的全方位独特见解。在企业内实现扩展,内置管理和安全性。

评价: 类似于excel的桌面bi工具,功能比excel更加强大。支持多种数据源。价格便宜。但是只能作为单独的bi工具使用,没办法和现有的系统结合到一起。

三.可视化大屏类

提供丰富的模板与图形,支持多数据源,拖拉式布局,支持服务化服务方式和本地部署。整体来说是一款很好的大屏的产品。

评价: 产品不错,就是价格服务版每年5100元/年,本地部署竟然要110万,每年续费也要37万。

前文有介绍过,finereport是一个企业级的报表工具,同时也提供大屏的服务。通过布局、色彩、绑定数据等环节完成大屏的制作。拥有很多自助开发的可视化插件库。

评价: 很优秀的软件,性价比高。学习方面,掌握FineReport的dashboard制作,应该也比较简单的。

五 .专业类(地图、科学计算、机器学习)

很多工具都能实现数据地图,比如echarts,finereport,tableau等。

ggplot2是R语言最流行的第三方扩展包,是RStudio首席科学家Hadley Wickham读博期间的作品,是R相比其他语言一个独领风骚的特点。包名中“gg”是grammar of graphics的简称,是一套优雅的绘图语法。主要用于机器学习绘图。

评价: 机器学习、数学、科学计算领域专业的绘图语言。专业与技术要求都很高,不是专业搞机器学习或者科学计算的工程师,一般不会用到。

Python是一门编成语言,其周边的绘图库也比较丰富比如pandas和matplotlib ,pandas能够绘制线图、柱图、饼图、密度图、散点图等; matplotlib主要是绘制数学函数相关的图如三角函数图、概率模型图等。

评价: 机器学习、数学、科学计算领域专业的绘图语言。专业与技术要求都很高,不是专业搞机器学习或者科学计算的工程师,一般不会用到。

R-ggplot2

ggplot2是R语言最为强大的作图软件包,强于其自成一派的数据可视化理念。当熟悉了ggplot2的基本套路后,数据可视化工作将变得非常轻松而有条理。

技术相关

1. 将数据,数据相关绘图,数据无关绘图分离

这点可以说是ggplot2最为吸引人的一点。众所周知,数据可视化就是将我们从数据中 探索 的信息与图形要素对应起来的过程。

ggplot2将数据,数据到图形要素的映射,以及和数据无关的图形要素绘制分离,有点类似java的MVC框架思想。这让ggplot2的使用者能清楚分明的感受到一张数据分析图真正的组成部分,有针对性的进行开发,调整。

2. 图层式的开发逻辑

在ggplot2中,图形的绘制是一个个图层添加上去的。举个例子来说,我们首先决定 探索 一下身高与体重之间的关系;然后画了一个简单的散点图;然后决定最好区分性别,图中点的色彩对应于不同的性别;然后决定最好区分地区,拆成东中西三幅小图;最后决定加入回归直线,直观地看出趋势。这是一个层层推进的结构过程,在每一个推进中,都有额外的信息被加入进来。在使用ggplot2的过程中,上述的每一步都是一个图层,并能够叠加到上一步并可视化展示出来。

3. 各种图形要素的自由组合

由于ggplot2的图层式开发逻辑,我们可以自由组合各种图形要素,充分自由发挥想象力

基本开发步骤

1. 初始化 – ggplot()

这一步需要设定的是图的x轴,y轴和”美学特征”。基本形式如下:

p