python DataFrame创建及基本操作 - 小众知识

python DataFrame创建及基本操作

2013年01月27日 14:18:05 苏内容
  标签: python
阅读:2550

1.DataFrame创建

pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

data:numpy ndarray(结构化或同类),dict或DataFrame,Dict可以包含Series,数组,常量或类似列表的对象

index:dataframe的索引,如果没有自定义,则默认为RangeIndex(0,1,2,…,n)

columns:dataframe的列标签,如果没有自定义,则默认为RangeIndex(0,1,2,…,n)

dtype:默认None,要强制的数据类型。 只允许一个dtype

copy:boolean,默认为False 

  1. # 从np.array 转换为 pd.DataFrame
  2. data = np.array([['','Col1','Col2'],
  3. ['Row1',1,2],
  4. ['Row2',3,4]])
  5. pd.DataFrame(data=data[1:,1:],
  6. index=data[1:,0],
  7. columns=data[0,1:])
  8. #      Col1 Col2
  9. # Row1    1    2
  10. # Row2    3    4
  11. # 直接采用字典做参数
  12. my_dict = {1: ['1', '3'], 2: ['1', '2'], 3: ['2', '4']}
  13. print(pd.DataFrame(my_dict))
  14. #    1  2  3
  15. # 0  1  1  2
  16. # 1  3  2  4
  17. # 用一个DataFrame做输入参数
  18. my_df = pd.DataFrame(data=[4,5,6,7], index=range(0,4), columns=['A'])
  19. print(pd.DataFrame(my_df))
  20. #    A
  21. # 0  4
  22. # 1  5
  23. # 2  6
  24. # 3  7
  25. # 输入一个Series
  26. my_series = pd.Series({"United Kingdom":"London", "India":"New Delhi", "United States":"Washington", "Belgium":"Brussels"})
  27. print(pd.DataFrame(my_series))
  28. #                          0
  29. # Belgium           Brussels
  30. # India            New Delhi
  31. # United Kingdom      London
  32. # United States   Washington

需要注意,以字典的方式创建,字典的键当做DataFrame的列名,当每个键对应的value值的个数为1时,必须输入index;以Series的方式创建,Series的索引是DataFrame的索引。

 


扩展阅读
相关阅读
© CopyRight 2010-2021, PREDREAM.ORG, Inc.All Rights Reserved. 京ICP备13045924号-1