1. 本际云推荐 - 专业推荐VPS、服务器,IDC点评首页
  2. 云主机运维
  3. VPS运维

Python大数据可视化控制模块altair的应用详细说明

Altair大数据可视化控制模块介绍

Altair被称作是统计分析大数据可视化库,因为它能全方位地了解数据信息、认知和处理数据,解放我们从繁杂的大数据可视化环节中出来。本文将介绍Python中的Altair大数据可视化控制模块,以及制作某些常见的数据图表。

Python大数据可视化控制模块altair的应用详细说明

Altair模块初体验

通过如下指令,我们安装Altair模块:pip install altair;pip install vega_datasets;pip install altair_viewer。也可以通过conda包管理器来安装:conda install-c conda-forge altair vega_datasets。然后我们就可以尝试绘制一个直方图。先创建一个DataFrame数据集,代码如下:

df=pd.DataFrame({"brand":["iPhone","Xiaomi","HuaWei","Vivo"],
        "profit(B)":[200,55,88,60]})

接下来就可以绘制直方图了。代码如下:

import altair as alt
import pandas as pd
import altair_viewer
chart=alt.Chart(df).mark_bar().encode(x="brand:N",y="profit(B):Q")
altair_viewer.display(chart,inline=True)

在代码中,alt.Chart()特定使用了数据信息,应用了实例方法mark_*()制作数据图表的款式,最终特定了X轴和Y轴所代表的数据信息。其中,N代表了名义型自变量(Nominal),如手机品牌,而Q则代表了数值型变量(Quantitative),分为离散型数据信息(discrete)和连续型数据信息(continuous),还有时间序列分析型数据信息T及其顺序型自变量O。

Altair模块进阶操作

除了常见的直方图、折线图、散点图之外,我们还可以制作甘特图、条形图等。甘特图通常在项目管理中用到,描绘了每个项目的时间跨度和完成程度。代码如下:

project=[{"project":"Proj1","start_time":"2022-01-16","end_time":"2022-03-20"},
         {"project":"Proj2","start_time":"2022-04-12","end_time":"2022-11-20"},......]
df=alt.Data(values=project)
chart=alt.Chart(df).mark_bar().encode(
        alt.X("start_time:T",axis=alt.Axis(format="%x",formatType="time",tickCount=3),
              scale=alt.Scale(domain=[alt.DateTime(year=2022,month=1,date=1),alt.DateTime(year=2022,month=12,date=1)])),
        alt.X2("end_time:T"),
        alt.Y("project:N",axis=alt.Axis(labelAlign="left",labelFontSize=15,labelOffset=0,labelPadding=50)),
        color=alt.Color("project:N",legend=alt.Legend(labelFontSize=12,symbolOpacity=0.7,titleFontSize=15)))
chart.save("chart_gantt.html")

最后,我们可以让散点图看起来更加美观,添加一些颜色和大小的变化。代码如下:

df=data.cars()
df_1=alt.Chart(df).transform_filter(alt.datum.Origin=="USA")
chart=df_1.mark_circle(color=alt.RadialGradient("radial",[alt.GradientStop("white",0.0),alt.GradientStop("red",1.0)]),size=160).encode(
        alt.X("Horsepower:Q",scale=alt.Scale(zero=False,padding=20)),
        alt.Y("Miles_per_Gallon:Q",scale=alt.Scale(zero=False,padding=20)),
        size="Acceleration:Q")

综上所述,Altair大数据可视化控制模块十分实用,能够帮助我们更好地理解、处理数据信息。我们可以通过各种图表来展现数据信息,包括直方图、折线图、甘特图、散点图等。希望本文能给您带来一些帮助。

原创文章,作者:小编小本本,如若转载,请注明出处:https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/6946.html