在上节中我们学习了matplotlib,这节课我们来看看另一个可视化的模块seaborn
,它是基于matplotlib的更高级的开源库,主要用作于数据可视化,解决了matplotlib的两大问题。正如Michael Waskom所说的:Matplotlib试着让简单的事情更加简单,困难的事情变得可能,那么Seaborn就是让困难的东西更加简单。
使用matplotlib最大的问题就是它默认的各种参数,在serborn当中则完全避免了这些问题
| |
| import matplotlib.pyplot as plt |
| import pandas as pd |
| |
| |
| fig, ax = plt.subplots() |
| |
| |
| tips = pd.read_csv("https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv") |
| |
| |
| ax.violinplot(tips["total_bill"], vert=False) |
| |
| import matplotlib.pyplot as plt |
| import pandas as pd |
| import seaborn as sns |
| |
| |
| tips = pd.read_csv("https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv") |
| |
| |
| sns.violinplot(x = "total_bill", data=tips) |
| |
| |
| plt.show() |
使用matplotlib,通常都需要我们自己来增加颜色、刻度标签等一些样式。seaborn就是matplotlib的延伸,如果会用matplotlib,那么使用seaborn也没问题
使用seaborn不仅可以将自己本地的数据绘制成图表,还可以使用库本身提供的内置数据集
可以通过load_dataset()
来使用内置的seaborn数据集,需要查看所有内置数据集可以点击https://github.com/mwaskom/seaborn-data
| |
| import seaborn as sns |
| import matplotlib.pyplot as plt |
| |
| |
| iris = sns.load_dataset("iris") |
| |
| |
| sns.swarmplot(x="species", y="petal_length", data=iris) |
| |
| |
| plt.show() |
| 数据可视化大部分的应用场景都是使用自己的数据集,seaborn主要适用于我们平时常用的DataFrame数组。它是一种类似于二维数组的数据结构。 |
| Seaborn对DataFrame非常友好的原因是,因为DataFrame的标签会自动导入到图表当中。在第一个Seaborn示例中绘制的一个小提琴图像,x轴会自动添加一个标签total_bill ,这个在matplotlib中就需要我们自己手动添加了。 |
| |
| import matplotlib.pyplot as plt |
| import seaborn as sns |
| import tushare as ts |
| |
| data = ts.get_k_data('000001') |
| data = data.tail() |
| |
| |
| g = sns.factorplot('high','low',data=data, kind="bar",palette="muted", legend=False) |
| |
| |
| plt.show() |
| |
| import matplotlib.pyplot as plt |
| |
| |
| plt.style.available |
| |
| |
| plt.style.use("classic") |
| ['bmh', |
| 'classic', |
| 'dark_background', |
| 'fast', |
| 'fivethirtyeight', |
| 'ggplot', |
| 'grayscale', |
| 'seaborn-bright', |
| 'seaborn-colorblind', |
| 'seaborn-dark-palette', |
| 'seaborn-dark', |
| 'seaborn-darkgrid', |
| 'seaborn-deep', |
| 'seaborn-muted', |
| 'seaborn-notebook', |
| 'seaborn-paper', |
| 'seaborn-pastel', |
| 'seaborn-poster', |
| 'seaborn-talk', |
| 'seaborn-ticks', |
| 'seaborn-white', |
| 'seaborn-whitegrid', |
| 'seaborn', |
| 'Solarize_Light2', |
| 'tableau-colorblind10', |
| '_classic_test'] |
可以使用color_palette()来定义要使用的颜色映射和参数n_colors的颜色数
| |
| import seaborn as sns |
| import matplotlib.pyplot as plt |
| import numpy as np |
| from matplotlib.colors import ListedColormap |
| |
| |
| N = 500 |
| |
| |
| current_palette = sns.color_palette("muted", n_colors=5) |
| cmap = ListedColormap(sns.color_palette(current_palette).as_hex()) |
| |
| |
| data1 = np.random.randn(N) |
| data2 = np.random.randn(N) |
| |
| colors = np.random.randint(0,5,N) |
| |
| |
| plt.scatter(data1, data2, c=colors, cmap=cmap) |
| |
| |
| plt.colorbar() |
| |
| |
| |
| |
| import matplotlib.pyplot as plt |
| import seaborn as sns |
| import numpy as np |
| import pandas as pd |
| |
| |
| x = 10 ** np.arange(1, 10) |
| y = x * 2 |
| data = pd.DataFrame(data={'x': x, 'y': y}) |
| |
| |
| grid = sns.lmplot('x', 'y', data, size=7, truncate=True, scatter_kws={"s": 100}) |
| |
| |
| grid.set_xticklabels(rotation=90) |
| |
| |
| |