importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspitplt.rcParams[,font.family,]=['SimHei,]plt.rcParams「axes.unicode_minus卜Falsedata=pd.read_csv('data/tmall.csv')data.columns=data.columns.str.strip()#列名有空格,需要处理下#print(data[data.duplicated()].count())#查看每一个字段有无重复值#print(data.isnull().sum())#订单付款时间为空
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
示订单没有付款,所以不作处理data[收货地址]二data[收货地址]str.replace。自治区|维吾尔|回族|壮族|省J,regex=True)#对省份做个清洗,便于可视化#print(data.收货地址.unique。)#检查清洗后的省份数据,查看清洗是否彻底存字典defdic():result={}result「总订单数1=data「订单编号,].count()result「已完成订单数']=data1订单编号[[data「订单付款时间]notnull()].count()result「未付款订单数1=data「订单编号[[data]订单付款时间]isnull()].count。result「退款订单数1=data「订单编号[[data1退款金额[>0].count()resultf总订单金额]=data「总金额,][data「订单付款时间]notnun()].sum()result]总退款金额]=data1退款金额'][data['退款金额].notnuH()].sum()result「总实际收入金额】=dataf买家实际支付金额'][data]订单付款时间'].notnull()].sum()print(result)准备数据resultl=data[data.订单付款时间.notnun()].groupbyC收货地址)「订单编号size。result1l=result1.to_dict()#原字典result12=sorted(resultll.items(),key=lambdaitem:item[l])#排序之后形成一个歹U表resultl3={}#排序之后又转换成字典foriinrange(len(resultl2)):result13[result12[i][0]]=resultl2[i][l]result14=[]forjinresultl3.keys():resultl4.append(j)绘制柱状图defdrawBar():fig=plt.figure(figsize=(20,15))#设置画布大小plt.barh(np.arange(len(resultl3)),resultl3.values(),tick_label=resultl4)plt.show()绘制订单走势图defdrawPlot():data「订单创立时间卜pd.to_datetime(data「订单创立时间'])datafiT单付款时间']=pd.to_datetime(data['订单付款时间口)result2=data.groupby(dataf单创立时间]apply(lambdax:x.strftime("%m-%d")))['订单编号[size。result21=result2.to_dict()fig=plt.figure(figsize=(20,12))#设置画布大小plt.title(n2020年订单量走势图”)plt.plot(result2l.keys(),result21.values())plt.showQdic()drawBar()drawPlot()