第二节:Seaborn

1、Seaborn

在上节中我们学习了matplotlib,这节课我们来看看另一个可视化的模块seaborn,它是基于matplotlib的更高级的开源库,主要用作于数据可视化,解决了matplotlib的两大问题。正如Michael Waskom所说的:Matplotlib试着让简单的事情更加简单,困难的事情变得可能,那么Seaborn就是让困难的东西更加简单。

使用matplotlib最大的问题就是它默认的各种参数,在serborn当中则完全避免了这些问题

# 导入模块
import matplotlib.pyplot as plt
import pandas as pd

# 初始化 Figure 和 Axes 对象
fig, ax = plt.subplots()

# 加载数据
tips = pd.read_csv("https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv")

# 创建 violinplot
ax.violinplot(tips["total_bill"], vert=False)

# 导入模块
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns

# 加载数据
tips = pd.read_csv("https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv")

# 创建 violinplot
sns.violinplot(x = "total_bill", data=tips)

# 展示图像
plt.show()

使用matplotlib,通常都需要我们自己来增加颜色、刻度标签等一些样式。seaborn就是matplotlib的延伸,如果会用matplotlib,那么使用seaborn也没问题

2、加载数据

使用seaborn不仅可以将自己本地的数据绘制成图表,还可以使用库本身提供的内置数据集

2.1、加载内置数据集

可以通过load_dataset()来使用内置的seaborn数据集,需要查看所有内置数据集可以点击https://github.com/mwaskom/seaborn-data

# 导入模块
import seaborn as sns
import matplotlib.pyplot as plt

# 加载鸢尾花数据
iris = sns.load_dataset("iris")

# 构建 iris plot
sns.swarmplot(x="species", y="petal_length", data=iris)

# 展示 图像
plt.show()

2.2、加载本地数据集

数据可视化大部分的应用场景都是使用自己的数据集,seaborn主要适用于我们平时常用的DataFrame数组。它是一种类似于二维数组的数据结构。
Seaborn对DataFrame非常友好的原因是,因为DataFrame的标签会自动导入到图表当中。在第一个Seaborn示例中绘制的一个小提琴图像,x轴会自动添加一个标签total_bill,这个在matplotlib中就需要我们自己手动添加了。
# 导入模块
import matplotlib.pyplot as plt
import seaborn as sns
import tushare as ts

data = ts.get_k_data('000001')
data = data.tail()

# 建立一个 factorplot
g = sns.factorplot('high','low',data=data, kind="bar",palette="muted", legend=False)

# 展示图像
plt.show()

3、配置

3.1、在seaborn中使用matplotlib的默认值

# Import Matplotlib
import matplotlib.pyplot as plt

# 查看所有可用的样式
plt.style.available

# 使用matplotlib的默认值
plt.style.use("classic")
['bmh',
 'classic',
 'dark_background',
 'fast',
 'fivethirtyeight',
 'ggplot',
 'grayscale',
 'seaborn-bright',
 'seaborn-colorblind',
 'seaborn-dark-palette',
 'seaborn-dark',
 'seaborn-darkgrid',
 'seaborn-deep',
 'seaborn-muted',
 'seaborn-notebook',
 'seaborn-paper',
 'seaborn-pastel',
 'seaborn-poster',
 'seaborn-talk',
 'seaborn-ticks',
 'seaborn-white',
 'seaborn-whitegrid',
 'seaborn',
 'Solarize_Light2',
 'tableau-colorblind10',
 '_classic_test']

3.2、在matplotlib中使用seaborn的颜色作为色彩

可以使用color_palette()来定义要使用的颜色映射和参数n_colors的颜色数

# 导入相关模块
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
from matplotlib.colors import ListedColormap

# 定义一个变量N
N = 500

# 构建 colormap
current_palette = sns.color_palette("muted", n_colors=5)
cmap = ListedColormap(sns.color_palette(current_palette).as_hex())

# 初始化数据
data1 = np.random.randn(N)
data2 = np.random.randn(N)
# 产生随机数标签
colors = np.random.randint(0,5,N)

# 创建散点图图表
plt.scatter(data1, data2, c=colors, cmap=cmap)

# 添加颜色条
plt.colorbar()

# 展示图像
# plt.show()

3.3、在seaborn中旋转标签文本

# Import the necessary libraries
import matplotlib.pyplot as plt
import seaborn as sns 
import numpy as np
import pandas as pd

# 初始化数据
x = 10 ** np.arange(1, 10)
y = x * 2
data = pd.DataFrame(data={'x': x, 'y': y})

# 创建 lmplot
grid = sns.lmplot('x', 'y', data, size=7, truncate=True, scatter_kws={"s": 100})

# 在X轴上旋转标签
grid.set_xticklabels(rotation=90)

# 展示图像
# plt.show()

上一篇
下一篇
Copyright © 2022 Egon的技术星球 egonlin.com 版权所有 帮助IT小伙伴学到真正的技术