第三节:实战项目之分析链家房源信息

获取数据

链接:https://pan.baidu.com/s/1E8akk1gX9zppCViOQLDiUQ  密码:f66q

导入模块

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib as mpl

import matplotlib.pyplot as plt
from IPython.display import display

plt.style.use('fivethirtyeight')
sns.set_style({'font.sans-serif':['simhei','Arial']})
%matplotlib inline

数据规整

lj_df = pd.read_csv('E:\\Test\\DataAnalysis\\lianjia\\lianjia.csv')
display(lj_df.head())
Direction District Elevator Floor Garden Id Layout Price Region Renovation Size Year
0 东西 灯市口 NaN 6 锡拉胡同21号院 101102647043 3室1厅 780.0 东城 精装 75.0 1988
1 南北 东单 无电梯 6 东华门大街 101102650978 2室1厅 705.0 东城 精装 60.0 1988
2 南西 崇文门 有电梯 16 新世界中心 101102672743 3室1厅 1400.0 东城 其他 210.0 1996
3 崇文门 NaN 7 兴隆都市馨园 101102577410 1室1厅 420.0 东城 精装 39.0 2004
4 陶然亭 有电梯 19 中海紫御公馆 101102574696 2室2厅 998.0 东城 精装 90.0 2010
# 获取所有数据列信息
lj_df.info()

RangeIndex: 23677 entries, 0 to 23676
Data columns (total 12 columns):
Direction     23677 non-null object
District      23677 non-null object
Elevator      15440 non-null object
Floor         23677 non-null int64
Garden        23677 non-null object
Id            23677 non-null int64
Layout        23677 non-null object
Price         23677 non-null float64
Region        23677 non-null object
Renovation    23677 non-null object
Size          23677 non-null float64
Year          23677 non-null int64
dtypes: float64(2), int64(3), object(7)
memory usage: 2.2+ MB
df = lj_df.copy()
df
Direction District Elevator Floor Garden Id Layout Price Region Renovation Size Year
0 东西 灯市口 NaN 6 锡拉胡同21号院 101102647043 3室1厅 780.0 东城 精装 75.0 1988
1 南北 东单 无电梯 6 东华门大街 101102650978 2室1厅 705.0 东城 精装 60.0 1988
2 南西 崇文门 有电梯 16 新世界中心 101102672743 3室1厅 1400.0 东城 其他 210.0 1996
3 崇文门 NaN 7 兴隆都市馨园 101102577410 1室1厅 420.0 东城 精装 39.0 2004
4 陶然亭 有电梯 19 中海紫御公馆 101102574696 2室2厅 998.0 东城 精装 90.0 2010
5 南北 广渠门 有电梯 18 幸福家园二期 101102407993 2室1厅 1180.0 东城 其他 111.0 2003
6 西罗园 无电梯 6 西革新里110号院 101102629841 1室1厅 319.0 东城 其他 42.0 1992
7 西罗园 有电梯 16 建予园 101102378003 2室1厅 640.0 东城 其他 105.0 1999
8 南北 东花市 有电梯 9 富贵园一区 101102345859 3室2厅 1780.0 东城 精装 161.0 2003
9 东北 东直门 有电梯 25 万国城MOMA 101102070529 2室2厅 1300.0 东城 精装 127.0 2002
10 工体 无电梯 5 十字坡东里 101102599410 1室1厅 405.0 东城 精装 37.0 1986
11 地安门 无电梯 5 帽儿胡同45号院 101102516190 2室1厅 700.0 东城 其他 50.0 1985
12 西 广渠门 有电梯 19 金桥国际 101102620368 1室1厅 462.0 东城 精装 54.0 2004
13 西 崇文门 有电梯 18 太华公寓 101102624056 1室0厅 518.0 东城 精装 64.0 2000
14 西南 菜户营 有电梯 23 信德园 101102691675 3室1厅 960.0 西城 其他 146.0 2002
15 木樨地 无电梯 4 西便门外大街 101102653830 2室0厅 457.0 西城 简装 50.0 1957
16 西北 马甸 NaN 18 双旗杆东里 101102570446 2室1厅 610.0 西城 简装 58.0 1986
17 马连道 有电梯 18 第三区 101102583180 2房间2卫 340.0 西城 精装 33.0 2011
18 西南 六铺炕 有电梯 17 六铺炕二区 101102306094 3室1厅 1120.0 西城 其他 78.0 1990
19 广安门 有电梯 26 荣丰2008 101101718499 1室0厅 320.0 西城 精装 28.0 2006
20 南北 牛街 有电梯 12 平原里小区 101102532889 2室1厅 596.0 西城 简装 59.0 1999
21 南北 木樨地 有电梯 18 真武庙六里 101102454060 2室1厅 888.0 西城 精装 78.0 1988
22 西北 右安门内 无电梯 7 右安门内大街 101102089935 1室1厅 405.0 西城 其他 45.0 1991
23 南北 西直门 无电梯 6 玉桃园二区 101102528745 2室1厅 650.0 西城 简装 60.0 1997
24 南北 马连道 无电梯 7 红莲南里 101102625441 2室1厅 470.0 西城 精装 61.0 1992
25 牛街 NaN 6 白广路6号院 101102562685 3室0厅 635.0 西城 简装 84.0 1955
26 西 亚运村小营 有电梯 7 育慧里一区 101102161792 1室0厅 343.0 朝阳 精装 52.0 2001
27 南北 望京 有电梯 10 大西洋新城A区 101102387406 2室2厅 835.0 朝阳 精装 86.0 1999
28 东西 团结湖 无电梯 6 团结湖路 101102395918 2室1厅 430.0 朝阳 精装 65.0 1980
29 南北 三元桥 有电梯 12 尚家楼48号院 101102691041 2室1厅 610.0 朝阳 精装 75.0 1998
23647 东南 和平里 NaN 6 和平里七区 101102564044 2室1厅 650.0 东城 精装 69.0 1995
23648 东西 工体 NaN 6 工体北里 101102547276 2室1厅 490.0 东城 毛坯 54.0 1984
23649 东南北 安贞 NaN 12 小黄庄二区 101102726945 4室1厅 1300.0 东城 简装 122.0 1996
23650 西 广渠门 NaN 29 广渠家园 101102653969 1室1厅 435.0 东城 精装 51.0 2009
23651 西南 和平里 无电梯 6 和平里七区 101102686119 2室1厅 540.0 东城 简装 56.0 1989
23652 南北 东直门 NaN 6 北官厅胡同2号院 101102669476 2室1厅 650.0 东城 精装 59.0 1985
23653 东南 朝阳门内 NaN 6 仓南胡同 101102422853 2室1厅 938.0 东城 简装 71.0 2003
23654 安定门 NaN 11 鼓楼外大街52号 101102492879 2室1厅 685.0 东城 简装 62.0 1992
23655 南北 崇文门 NaN 12 新裕家园 101102454084 3室1厅 1293.0 东城 精装 125.0 2004
23656 东西 崇文门 NaN 16 新景家园西区 101102532627 3室1厅 870.0 东城 精装 91.0 2004
23657 南西北 金宝街 NaN 5 史家胡同20号院 101102587502 2室0厅 686.0 东城 精装 46.0 1980
23658 工体 NaN 9 春秀路 101102587082 2室1厅 572.0 东城 简装 59.0 1998
23659 东西 朝阳门内 NaN 16 西水井胡同 101102328585 2室1厅 699.0 东城 简装 74.0 2003
23660 南北 东直门 NaN 14 民安小区东羊管胡同 101102328701 2室1厅 760.0 东城 精装 73.0 2002
23661 左安门 NaN 15 左安漪园 101102716957 3室1厅 950.0 东城 精装 113.0 2004
23662 南北 和平里 NaN 6 和平里九区 101102724566 3室1厅 670.0 东城 简装 67.0 1990
23663 西 和平里 NaN 20 和平里二区 101102668742 2室1厅 800.0 东城 精装 79.0 2006
23664 西南 和平里 NaN 6 和平里三区 101102647453 1室1厅 430.0 东城 简装 40.0 1996
23665 东北 永定门 NaN 6 定安里 101102729923 3室1厅 419.0 东城 精装 64.0 1984
23666 西北 陶然亭 有电梯 23 中海紫御公馆 101102184767 2室1厅 599.0 东城 简装 63.0 2010
23667 南北 永定门 NaN 6 定安里 101102724425 2室1厅 365.0 东城 精装 55.0 1984
23668 南北 东直门 NaN 6 海运仓小区 101102575113 3室1厅 950.0 东城 简装 82.0 2003
23669 西南 广渠门 NaN 22 京禧阁 101102509047 2室1厅 1050.0 东城 精装 119.0 2013
23670 南北 交道口 NaN 6 土儿胡同 101102411691 2室1厅 880.0 东城 简装 69.0 2002
23671 南北 和平里 NaN 5 甘水桥 101102292212 3室1厅 565.0 东城 简装 56.0 1983
23672 南北 广渠门 NaN 16 保利蔷薇 101102296423 2室1厅 1010.0 东城 简装 97.0 2008
23673 南北 永定门 NaN 6 郭庄北里 101102593534 2室1厅 468.0 东城 简装 66.0 1995
23674 南北 和平里 NaN 6 康鸿家园 101102549465 3室2厅 1400.0 东城 简装 155.0 2000
23675 南北 前门 NaN 6 台基厂头条10号院 101102322422 4室1厅 1100.0 东城 简装 107.0 1990
23676 南北 崇文门 NaN 15 新景家园东区 101102657079 1室1厅 790.0 东城 精装 81.0 2008

23677 rows × 12 columns

df['PerPrice'] = lj_df['Price']/lj_df['Size']
df
Direction District Elevator Floor Garden Id Layout Price Region Renovation Size Year PerPrice
0 东西 灯市口 NaN 6 锡拉胡同21号院 101102647043 3室1厅 780.0 东城 精装 75.0 1988 10.400000
1 南北 东单 无电梯 6 东华门大街 101102650978 2室1厅 705.0 东城 精装 60.0 1988 11.750000
2 南西 崇文门 有电梯 16 新世界中心 101102672743 3室1厅 1400.0 东城 其他 210.0 1996 6.666667
3 崇文门 NaN 7 兴隆都市馨园 101102577410 1室1厅 420.0 东城 精装 39.0 2004 10.769231
4 陶然亭 有电梯 19 中海紫御公馆 101102574696 2室2厅 998.0 东城 精装 90.0 2010 11.088889
5 南北 广渠门 有电梯 18 幸福家园二期 101102407993 2室1厅 1180.0 东城 其他 111.0 2003 10.630631
6 西罗园 无电梯 6 西革新里110号院 101102629841 1室1厅 319.0 东城 其他 42.0 1992 7.595238
7 西罗园 有电梯 16 建予园 101102378003 2室1厅 640.0 东城 其他 105.0 1999 6.095238
8 南北 东花市 有电梯 9 富贵园一区 101102345859 3室2厅 1780.0 东城 精装 161.0 2003 11.055901
9 东北 东直门 有电梯 25 万国城MOMA 101102070529 2室2厅 1300.0 东城 精装 127.0 2002 10.236220
10 工体 无电梯 5 十字坡东里 101102599410 1室1厅 405.0 东城 精装 37.0 1986 10.945946
11 地安门 无电梯 5 帽儿胡同45号院 101102516190 2室1厅 700.0 东城 其他 50.0 1985 14.000000
12 西 广渠门 有电梯 19 金桥国际 101102620368 1室1厅 462.0 东城 精装 54.0 2004 8.555556
13 西 崇文门 有电梯 18 太华公寓 101102624056 1室0厅 518.0 东城 精装 64.0 2000 8.093750
14 西南 菜户营 有电梯 23 信德园 101102691675 3室1厅 960.0 西城 其他 146.0 2002 6.575342
15 木樨地 无电梯 4 西便门外大街 101102653830 2室0厅 457.0 西城 简装 50.0 1957 9.140000
16 西北 马甸 NaN 18 双旗杆东里 101102570446 2室1厅 610.0 西城 简装 58.0 1986 10.517241
17 马连道 有电梯 18 第三区 101102583180 2房间2卫 340.0 西城 精装 33.0 2011 10.303030
18 西南 六铺炕 有电梯 17 六铺炕二区 101102306094 3室1厅 1120.0 西城 其他 78.0 1990 14.358974
19 广安门 有电梯 26 荣丰2008 101101718499 1室0厅 320.0 西城 精装 28.0 2006 11.428571
20 南北 牛街 有电梯 12 平原里小区 101102532889 2室1厅 596.0 西城 简装 59.0 1999 10.101695
21 南北 木樨地 有电梯 18 真武庙六里 101102454060 2室1厅 888.0 西城 精装 78.0 1988 11.384615
22 西北 右安门内 无电梯 7 右安门内大街 101102089935 1室1厅 405.0 西城 其他 45.0 1991 9.000000
23 南北 西直门 无电梯 6 玉桃园二区 101102528745 2室1厅 650.0 西城 简装 60.0 1997 10.833333
24 南北 马连道 无电梯 7 红莲南里 101102625441 2室1厅 470.0 西城 精装 61.0 1992 7.704918
25 牛街 NaN 6 白广路6号院 101102562685 3室0厅 635.0 西城 简装 84.0 1955 7.559524
26 西 亚运村小营 有电梯 7 育慧里一区 101102161792 1室0厅 343.0 朝阳 精装 52.0 2001 6.596154
27 南北 望京 有电梯 10 大西洋新城A区 101102387406 2室2厅 835.0 朝阳 精装 86.0 1999 9.709302
28 东西 团结湖 无电梯 6 团结湖路 101102395918 2室1厅 430.0 朝阳 精装 65.0 1980 6.615385
29 南北 三元桥 有电梯 12 尚家楼48号院 101102691041 2室1厅 610.0 朝阳 精装 75.0 1998 8.133333
23647 东南 和平里 NaN 6 和平里七区 101102564044 2室1厅 650.0 东城 精装 69.0 1995 9.420290
23648 东西 工体 NaN 6 工体北里 101102547276 2室1厅 490.0 东城 毛坯 54.0 1984 9.074074
23649 东南北 安贞 NaN 12 小黄庄二区 101102726945 4室1厅 1300.0 东城 简装 122.0 1996 10.655738
23650 西 广渠门 NaN 29 广渠家园 101102653969 1室1厅 435.0 东城 精装 51.0 2009 8.529412
23651 西南 和平里 无电梯 6 和平里七区 101102686119 2室1厅 540.0 东城 简装 56.0 1989 9.642857
23652 南北 东直门 NaN 6 北官厅胡同2号院 101102669476 2室1厅 650.0 东城 精装 59.0 1985 11.016949
23653 东南 朝阳门内 NaN 6 仓南胡同 101102422853 2室1厅 938.0 东城 简装 71.0 2003 13.211268
23654 安定门 NaN 11 鼓楼外大街52号 101102492879 2室1厅 685.0 东城 简装 62.0 1992 11.048387
23655 南北 崇文门 NaN 12 新裕家园 101102454084 3室1厅 1293.0 东城 精装 125.0 2004 10.344000
23656 东西 崇文门 NaN 16 新景家园西区 101102532627 3室1厅 870.0 东城 精装 91.0 2004 9.560440
23657 南西北 金宝街 NaN 5 史家胡同20号院 101102587502 2室0厅 686.0 东城 精装 46.0 1980 14.913043
23658 工体 NaN 9 春秀路 101102587082 2室1厅 572.0 东城 简装 59.0 1998 9.694915
23659 东西 朝阳门内 NaN 16 西水井胡同 101102328585 2室1厅 699.0 东城 简装 74.0 2003 9.445946
23660 南北 东直门 NaN 14 民安小区东羊管胡同 101102328701 2室1厅 760.0 东城 精装 73.0 2002 10.410959
23661 左安门 NaN 15 左安漪园 101102716957 3室1厅 950.0 东城 精装 113.0 2004 8.407080
23662 南北 和平里 NaN 6 和平里九区 101102724566 3室1厅 670.0 东城 简装 67.0 1990 10.000000
23663 西 和平里 NaN 20 和平里二区 101102668742 2室1厅 800.0 东城 精装 79.0 2006 10.126582
23664 西南 和平里 NaN 6 和平里三区 101102647453 1室1厅 430.0 东城 简装 40.0 1996 10.750000
23665 东北 永定门 NaN 6 定安里 101102729923 3室1厅 419.0 东城 精装 64.0 1984 6.546875
23666 西北 陶然亭 有电梯 23 中海紫御公馆 101102184767 2室1厅 599.0 东城 简装 63.0 2010 9.507937
23667 南北 永定门 NaN 6 定安里 101102724425 2室1厅 365.0 东城 精装 55.0 1984 6.636364
23668 南北 东直门 NaN 6 海运仓小区 101102575113 3室1厅 950.0 东城 简装 82.0 2003 11.585366
23669 西南 广渠门 NaN 22 京禧阁 101102509047 2室1厅 1050.0 东城 精装 119.0 2013 8.823529
23670 南北 交道口 NaN 6 土儿胡同 101102411691 2室1厅 880.0 东城 简装 69.0 2002 12.753623
23671 南北 和平里 NaN 5 甘水桥 101102292212 3室1厅 565.0 东城 简装 56.0 1983 10.089286
23672 南北 广渠门 NaN 16 保利蔷薇 101102296423 2室1厅 1010.0 东城 简装 97.0 2008 10.412371
23673 南北 永定门 NaN 6 郭庄北里 101102593534 2室1厅 468.0 东城 简装 66.0 1995 7.090909
23674 南北 和平里 NaN 6 康鸿家园 101102549465 3室2厅 1400.0 东城 简装 155.0 2000 9.032258
23675 南北 前门 NaN 6 台基厂头条10号院 101102322422 4室1厅 1100.0 东城 简装 107.0 1990 10.280374
23676 南北 崇文门 NaN 15 新景家园东区 101102657079 1室1厅 790.0 东城 精装 81.0 2008 9.753086

23677 rows × 13 columns

# 重新摆放列位置
columns = ['Region', 'District', 'Garden', 'Layout', 'Floor', 'Year', 'Size', 'Elevator', 'Direction', 'Renovation', 'PerPrice', 'Price']
df = pd.DataFrame(df, columns = columns)

# 重新审视数据集
display(df.head(n=2))
Region District Garden Layout Floor Year Size Elevator Direction Renovation PerPrice Price
0 东城 灯市口 锡拉胡同21号院 3室1厅 6 1988 75.0 NaN 东西 精装 10.40 780.0
1 东城 东单 东华门大街 2室1厅 6 1988 60.0 无电梯 南北 精装 11.75 705.0

数据分析

联系管理员微信tutu19192010,注册账号

上一篇
下一篇
Copyright © 2022 Egon的技术星球 egonlin.com 版权所有 帮助IT小伙伴学到真正的技术