# plotly_week2 **Repository Path**: jiayingb/plotly_week2 ## Basic Information - **Project Name**: plotly_week2 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2019-11-15 - **Last Updated**: 2024-10-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README plotly_week02
In [43]:
import plotly as py 
import cufflinks as cf 
import pandas as pd 
cf.set_config_file(offline=True, theme='ggplot') 
In [44]:
import pandas as pd
df = pd.read_csv("Desktop\sample_energy.tsv",encoding='utf8',sep="\t",\
                keep_default_na=False, na_values='na_rep')
                
df.head()
Out[44]:
地区 指标 地区名 指标名 2009 2010 2011 2012 2013 2014 2015 2016 2017
0 110000 A070609 北京市 电力消费量 739.1465 809.900 821.7054 874.3 913.1 937.05 952.7169 1020.2706 1066.8903
1 110000 A070701 北京市 单位地区生产总值能耗(等价值) 0.6060 0.582 0.4590 NaN NaN NaN NaN NaN NaN
2 110000 A070702 北京市 单位地区生产总值能耗(等价值)_同比增长 -5.7600 NaN -6.9400 NaN NaN NaN -6.1700 NaN NaN
3 110000 A070703 北京市 单位工业增加值能耗(规模以上当量值) 0.9090 NaN NaN NaN NaN NaN NaN NaN NaN
4 110000 A070704 北京市 单位工业增加值能耗(规模以上当量值)_同比增长 -12.3000 NaN -18.5000 NaN NaN NaN -8.1600 NaN NaN

抽取四个地区2009、2010、2011年的数据

In [45]:
df.地区名.unique()
Out[45]:
array(['北京市', '天津市', '河北省', '山西省', '内蒙古自治区', '辽宁省', '吉林省', '黑龙江省', '上海市',
       '江苏省', '浙江省', '安徽省', '福建省', '江西省', '山东省', '河南省', '湖北省', '湖南省',
       '广东省', '广西壮族自治区', '海南省', '重庆市', '四川省', '贵州省', '云南省', '西藏自治区',
       '陕西省', '甘肃省', '青海省', '宁夏回族自治区', '新疆维吾尔自治区'], dtype=object)
In [46]:
df.set_index("地区名").loc[["北京市","上海市","广东省","重庆市"],:]
Out[46]:
地区 指标 指标名 2009 2010 2011 2012 2013 2014 2015 2016 2017
地区名
北京市 110000 A070609 电力消费量 739.1465 809.900 821.7054 874.3 913.1 937.05 952.716900 1020.270600 1066.8903
北京市 110000 A070701 单位地区生产总值能耗(等价值) 0.6060 0.582 0.4590 NaN NaN NaN NaN NaN NaN
北京市 110000 A070702 单位地区生产总值能耗(等价值)_同比增长 -5.7600 NaN -6.9400 NaN NaN NaN -6.170000 NaN NaN
北京市 110000 A070703 单位工业增加值能耗(规模以上当量值) 0.9090 NaN NaN NaN NaN NaN NaN NaN NaN
北京市 110000 A070704 单位工业增加值能耗(规模以上当量值)_同比增长 -12.3000 NaN -18.5000 NaN NaN NaN -8.160000 NaN NaN
北京市 110000 A070705 单位地区生产总值电耗(等价值) 681.8500 NaN NaN NaN NaN NaN NaN NaN NaN
北京市 110000 A070706 单位地区生产总值电耗(等价值)_同比增长 -2.7400 NaN -6.1000 NaN NaN NaN -4.870000 NaN NaN
上海市 310000 A070609 电力消费量 1153.3794 1295.870 1339.6248 1353.4 1410.6 1369.03 1405.546400 1486.019600 1526.7716
上海市 310000 A070701 单位地区生产总值能耗(等价值) 0.7270 0.712 0.6180 NaN NaN NaN NaN NaN NaN
上海市 310000 A070702 单位地区生产总值能耗(等价值)_同比增长 -6.1700 NaN -5.3200 NaN NaN NaN -3.920000 NaN NaN
上海市 310000 A070703 单位工业增加值能耗(规模以上当量值) 0.9570 NaN NaN NaN NaN NaN NaN NaN NaN
上海市 310000 A070704 单位工业增加值能耗(规模以上当量值)_同比增长 -5.0000 NaN -7.3300 NaN NaN NaN 0.150000 NaN NaN
上海市 310000 A070705 单位地区生产总值电耗(等价值) 808.4900 NaN NaN NaN NaN NaN NaN NaN NaN
上海市 310000 A070706 单位地区生产总值电耗(等价值)_同比增长 -6.3900 NaN -4.4200 NaN NaN NaN -4.000000 NaN NaN
广东省 440000 A070609 电力消费量 3609.6424 4060.130 4399.0168 4619.4 4830.1 5235.23 5310.691922 5610.134203 5958.9678
广东省 440000 A070701 单位地区生产总值能耗(等价值) 0.6840 0.664 0.5630 NaN NaN NaN NaN NaN NaN
广东省 440000 A070702 单位地区生产总值能耗(等价值)_同比增长 -4.2700 NaN -3.7800 NaN NaN NaN -5.710000 NaN NaN
广东省 440000 A070703 单位工业增加值能耗(规模以上当量值) 0.8090 NaN NaN NaN NaN NaN NaN NaN NaN
广东省 440000 A070704 单位工业增加值能耗(规模以上当量值)_同比增长 -6.9400 NaN -5.1300 NaN NaN NaN -10.470000 NaN NaN
广东省 440000 A070705 单位地区生产总值电耗(等价值) 1002.0900 NaN NaN NaN NaN NaN NaN NaN NaN
广东省 440000 A070706 单位地区生产总值电耗(等价值)_同比增长 -6.1300 NaN -1.4600 NaN NaN NaN -6.080000 NaN NaN
重庆市 500000 A070609 电力消费量 533.7976 626.440 717.0331 723.5 813.3 867.24 875.373726 924.894756 992.6490
重庆市 500000 A070701 单位地区生产总值能耗(等价值) 1.1810 1.127 0.9530 NaN NaN NaN NaN NaN NaN
重庆市 500000 A070702 单位地区生产总值能耗(等价值)_同比增长 -5.5000 NaN -3.8100 NaN NaN NaN -6.310000 NaN NaN
重庆市 500000 A070703 单位工业增加值能耗(规模以上当量值) 1.8540 NaN NaN NaN NaN NaN NaN NaN NaN
重庆市 500000 A070704 单位工业增加值能耗(规模以上当量值)_同比增长 -11.9500 NaN -5.3100 NaN NaN NaN -8.360000 NaN NaN
重庆市 500000 A070705 单位地区生产总值电耗(等价值) 894.2700 NaN NaN NaN NaN NaN NaN NaN NaN
重庆市 500000 A070706 单位地区生产总值电耗(等价值)_同比增长 -4.6900 NaN -1.6300 NaN NaN NaN -9.060000 NaN NaN
In [47]:
df.set_index("地区名").loc[["北京市","上海市","广东省","重庆市"],["2009","2010","2011"]]
Out[47]:
2009 2010 2011
地区名
北京市 739.1465 809.900 821.7054
北京市 0.6060 0.582 0.4590
北京市 -5.7600 NaN -6.9400
北京市 0.9090 NaN NaN
北京市 -12.3000 NaN -18.5000
北京市 681.8500 NaN NaN
北京市 -2.7400 NaN -6.1000
上海市 1153.3794 1295.870 1339.6248
上海市 0.7270 0.712 0.6180
上海市 -6.1700 NaN -5.3200
上海市 0.9570 NaN NaN
上海市 -5.0000 NaN -7.3300
上海市 808.4900 NaN NaN
上海市 -6.3900 NaN -4.4200
广东省 3609.6424 4060.130 4399.0168
广东省 0.6840 0.664 0.5630
广东省 -4.2700 NaN -3.7800
广东省 0.8090 NaN NaN
广东省 -6.9400 NaN -5.1300
广东省 1002.0900 NaN NaN
广东省 -6.1300 NaN -1.4600
重庆市 533.7976 626.440 717.0331
重庆市 1.1810 1.127 0.9530
重庆市 -5.5000 NaN -3.8100
重庆市 1.8540 NaN NaN
重庆市 -11.9500 NaN -5.3100
重庆市 894.2700 NaN NaN
重庆市 -4.6900 NaN -1.6300
In [48]:
df.set_index("指标名").loc["电力消费量"].set_index("地区名").loc[["北京市","上海市","广东省","重庆市"],["2009","2010","2011"]]
Out[48]:
2009 2010 2011
地区名
北京市 739.1465 809.90 821.7054
上海市 1153.3794 1295.87 1339.6248
广东省 3609.6424 4060.13 4399.0168
重庆市 533.7976 626.44 717.0331
In [49]:
dfm=df.set_index("指标名").loc["电力消费量"].set_index("地区名").loc[["北京市","上海市","广东省","重庆市"],["2009","2010","2011"]]
In [50]:
dfm.iplot(kind='bar',xTitle='消费电力',yTitle='地区/年份',title='电力消费量')
In [51]:
dfm.iplot(kind='bar',barmode='stack',xTitle='地区/年份',title='电力消费量')

只取2009年,四个地区,各类别的指标比较

In [52]:
dfmm= df.query('地区名 in["北京市","上海市","广东省","重庆市"]').set_index(['指标名','地区名'])[['2009']]
dfmm
Out[52]:
2009
指标名 地区名
电力消费量 北京市 739.1465
单位地区生产总值能耗(等价值) 北京市 0.6060
单位地区生产总值能耗(等价值)_同比增长 北京市 -5.7600
单位工业增加值能耗(规模以上当量值) 北京市 0.9090
单位工业增加值能耗(规模以上当量值)_同比增长 北京市 -12.3000
单位地区生产总值电耗(等价值) 北京市 681.8500
单位地区生产总值电耗(等价值)_同比增长 北京市 -2.7400
电力消费量 上海市 1153.3794
单位地区生产总值能耗(等价值) 上海市 0.7270
单位地区生产总值能耗(等价值)_同比增长 上海市 -6.1700
单位工业增加值能耗(规模以上当量值) 上海市 0.9570
单位工业增加值能耗(规模以上当量值)_同比增长 上海市 -5.0000
单位地区生产总值电耗(等价值) 上海市 808.4900
单位地区生产总值电耗(等价值)_同比增长 上海市 -6.3900
电力消费量 广东省 3609.6424
单位地区生产总值能耗(等价值) 广东省 0.6840
单位地区生产总值能耗(等价值)_同比增长 广东省 -4.2700
单位工业增加值能耗(规模以上当量值) 广东省 0.8090
单位工业增加值能耗(规模以上当量值)_同比增长 广东省 -6.9400
单位地区生产总值电耗(等价值) 广东省 1002.0900
单位地区生产总值电耗(等价值)_同比增长 广东省 -6.1300
电力消费量 重庆市 533.7976
单位地区生产总值能耗(等价值) 重庆市 1.1810
单位地区生产总值能耗(等价值)_同比增长 重庆市 -5.5000
单位工业增加值能耗(规模以上当量值) 重庆市 1.8540
单位工业增加值能耗(规模以上当量值)_同比增长 重庆市 -11.9500
单位地区生产总值电耗(等价值) 重庆市 894.2700
单位地区生产总值电耗(等价值)_同比增长 重庆市 -4.6900
In [53]:
dfmm.iplot(kind='bar')
In [54]:
dfmm.unstack()
Out[54]:
2009
地区名 上海市 北京市 广东省 重庆市
指标名
单位地区生产总值电耗(等价值) 808.4900 681.8500 1002.0900 894.2700
单位地区生产总值电耗(等价值)_同比增长 -6.3900 -2.7400 -6.1300 -4.6900
单位地区生产总值能耗(等价值) 0.7270 0.6060 0.6840 1.1810
单位地区生产总值能耗(等价值)_同比增长 -6.1700 -5.7600 -4.2700 -5.5000
单位工业增加值能耗(规模以上当量值) 0.9570 0.9090 0.8090 1.8540
单位工业增加值能耗(规模以上当量值)_同比增长 -5.0000 -12.3000 -6.9400 -11.9500
电力消费量 1153.3794 739.1465 3609.6424 533.7976
In [55]:
dfmm.unstack(0)
Out[55]:
2009
指标名 单位地区生产总值电耗(等价值) 单位地区生产总值电耗(等价值)_同比增长 单位地区生产总值能耗(等价值) 单位地区生产总值能耗(等价值)_同比增长 单位工业增加值能耗(规模以上当量值) 单位工业增加值能耗(规模以上当量值)_同比增长 电力消费量
地区名
上海市 808.49 -6.39 0.727 -6.17 0.957 -5.00 1153.3794
北京市 681.85 -2.74 0.606 -5.76 0.909 -12.30 739.1465
广东省 1002.09 -6.13 0.684 -4.27 0.809 -6.94 3609.6424
重庆市 894.27 -4.69 1.181 -5.50 1.854 -11.95 533.7976
In [56]:
dfmm.unstack(1).iplot(kind ='bar')
In [ ]: