数据分析学习笔记(三)

导入numpy、pandas包

import pandas as pd
import numpy as np
df=pd.read_csv('train-left-up.csv')

将data文件夹里面的所有数据都载入,观察数据的之间的关系

df1=pd.read_csv('train-left-up.csv')
df2=pd.read_csv('train-left-down.csv')
df3=pd.read_csv('train-right-up.csv')
df4=pd.read_csv('train-right-down.csv')
df1.tail()

数据分析学习笔记(三)

df2.head()

数据分析学习笔记(三)

df3.tail()

数据分析学习笔记(三)

df4.head()

数据分析学习笔记(三)
由此可知:df2接在df1的下方,df3接在df1的右侧,df4接在df3的下方。

使用concat方法:将数据train-left-up.csv和train-right-up.csv横向合并为一张表,并保存这张表为result_up

result_up= pd.concat([df1,df3], axis=1)
result_up

数据分析学习笔记(三)
使用concat方法:将train-left-down和train-right-down横向合并为一张表,并保存这张表为result_down。然后将上边的result_up和result_down纵向合并为result

result_down= pd.concat([df2,df4], axis=1)
result_down

数据分析学习笔记(三)

result= pd.concat([result_up,result_down], axis=0,ignore_index=True)
result

数据分析学习笔记(三)
使用DataFrame自带的方法join方法和append:完成任务二和任务三的任务

result_up= df1.join(df3)
result_up
result_down= df2.join(df4)
result_down
result=result_up.append(result_down,ignore_index=True)
result

使用Panads的merge方法和DataFrame的append方法:完成任务二和任务三的任务

result_up=pd.merge(df1,df3,left_index=True,right_index=True)
result_up
result_down=pd.merge(df2,df4,left_index=True,right_index=True)
result_down
result=result_up.append(result_down,ignore_index=True)
result

merge、join以及concat的方法的不同以及相同
concat:可用于两个或多个df间行方向(增加行,下同)或列方向(增加列,下同)进行内联或外联拼接操作,默认行拼接,取并集.
merge:可用于两个df间行方向(一般用join代替)或列方向的拼接操作,默认列拼接,取交集(即:存在相同主键的df1和df2的列拼接)
join:可用于df间列方向的拼接操作,默认左列拼接,how=’left’

将我们的数据变为Series类型的数据

参考:
[1]https://blog.csdn.net/weixin_42782150/article/details/89546357

上一篇:Mark Down初学第一步


下一篇:No.286 - [978] Longest Turbulent Subarray - 简单动态规划