【韦德国际1946手机版】pandas重新索引,等级次序

作者: 韦德国际1946手机版  发布:2019-05-28

有些时候,恐怕会遇上表格中冒出重复的目录,在操作重复索引的时候大概要注意一些难题。

pandas之重新索引

pandas有二个很关键的主意是reindex,它的效能是创造多个适应新索引的新指标。

成立多种索引并引用。

pandas中的档次化索引是我们能以低纬度形式管理北齐废帝度数据。

一、判别索引是还是不是再度

【韦德国际1946手机版】pandas重新索引,等级次序化索引。对于Series

直白上代码:

import numpy as np

from pandas import Series,DataFrame

ser = Series([-2.4, -1.4, 1.8, 2.8],['z','c','x','d'])

ser
Out[6]: 
z   -2.4
c   -1.4
x    1.8
d    2.8
dtype: float64

ser.reindex(['a','z','x','b','c','d'])
Out[8]: 
a    NaN
z   -2.4
x    1.8
b    NaN
c   -1.4
d    2.8
dtype: float64

可以调查到,reindex依附目录举办了重排,并且,假诺因而不存在的话就能引进缺点和失误值NaN。

我们得以钦赐索引所指向的值,使用fill_value参数:

ser.reindex(['a','z','x','b','c','d'],fill_value = 0)
Out[10]: 
a    0.0
z   -2.4
x    1.8
b    0.0
c   -1.4
d    2.8
dtype: float64

而对于有个别平稳数据,我们有事可能需求举行插值,进而补充确实数据,那样的话,大家得以选择method参数:

ser1 = Series(['Y','P','Z','X'],index = [0, 2, 5, 7])

ser1
Out[12]: 
0    Y
2    P
5    Z
7    X
dtype: object

ser1.reindex(range(8),method='ffill')#前向填充
Out[13]: 
0    Y
1    Y
2    P
3    P
4    P
5    Z
6    Z
7    X
dtype: object

ser1.reindex(range(8),method='bfill')#后向填充
Out[14]: 
0    Y
1    P
2    P
3    Z
4    Z
5    Z
6    X
7    X
dtype: object

能够小心到:

**ffill就是把后边的值向后填充,其余参数pad的功效与其同样。

bfill的职能是把前面包车型地铁值向前填充,参数backfill的功用与其同壹。**

index=pd.MultiIndex.from_product([df_code['id_stock'],df_date['date_trade']])

df_vol=pd.DataFrame(index=index,columns=['vol'])
data = Series(np.random.randn(10),index=[['a','a','a','b','b','b','c','c','d','d'],
                                         [1,2,3,1,2,3,1,2,2,3]])
print data
'''
a  1    0.109062
   2    0.180636
   3   -0.094262
b  1   -1.942745
   2   -1.617368
   3    1.036303
c  1    0.106169
   2   -0.942343
d  2   -0.584220
   3   -3.495089
dtype: float64
'''

a、塞里es索引重复剖断

对于DataFrame

reindex能够修改行和列的目录。若是只传入3个队列,就能重新索引行

不知底,你有未有理会到,在pandas中一旦只传入2个行列,恐怕索引,一般私下认可是修改行,可能索引行。

frame = DataFrame(np.arange(9).reshape(3,3),index = ['x','y','z'],columns=['BJ','TJ','HEB'])

frame
Out[18]: 
   BJ  TJ  HEB
x   0   1    2
y   3   4    5
z   6   7    8

frame1 = frame.reindex(['x','z','s','y'])#重新索引行

frame1
Out[20]: 
    BJ   TJ  HEB
x  0.0  1.0  2.0
z  6.0  7.0  8.0
s  NaN  NaN  NaN
y  3.0  4.0  5.0

frame.reindex(columns=['TJ','SJZ','BJ','HEB'])#重新索引列
Out[21]: 
   TJ  SJZ  BJ  HEB
x   1  NaN   0    2
y   4  NaN   3    5
z   7  NaN   6    8

frame.reindex(index=['a','b','c','d'],method = 'ffill',columns=['BJ','SD','HEB','TJ'])#重新索引列和行,并插值
Out[34]: 
   BJ  SD  HEB  TJ
a   0 NaN    2   1
b   0 NaN    2   1
c   3 NaN    5   4
d   6 NaN    8   7

可以小心到,张开发银行列一同索引的时候,行也无法不钦赐参数index,而插值的结果,只会沿着行使用。

但是并未有想精通,为何会产出以下的情景:

frame.reindex(index = ['x','z','s','y'],method = 'ffill',columns=['TJ','SJZ','BJ','HEB'])
Out[23]: 
    TJ  SJZ   BJ  HEB
x  1.0  NaN  0.0  2.0
z  7.0  NaN  6.0  8.0
s  NaN  NaN  NaN  NaN
y  4.0  NaN  3.0  5.0

frame.reindex(index = ['x','z','s','y'],method = 'ffill',columns=['TJ','SJZ','BJ'])
Out[24]: 
    TJ  SJZ   BJ
x  1.0  NaN  0.0
z  7.0  NaN  6.0
s  NaN  NaN  NaN
y  4.0  NaN  3.0

frame.reindex(index = ['x','z','s','y'],method = 'ffill')
Out[26]: 
    BJ   TJ  HEB
x  0.0  1.0  2.0
z  6.0  7.0  8.0
s  NaN  NaN  NaN
y  3.0  4.0  5.0

frame.reindex(index = ['x','z','s','y'],method = 'bfill')
Out[28]: 
   BJ  TJ  HEB
x   0   1    2
z   6   7    8
s   0   1    2
y   3   4    5

求解。

标签ix能够使重新索引变得很便捷,无需钦赐index和columns参数。

frame.ix[['a','b','c','d'],['BJ','TJ','SD','HEB']]
Out[37]: 
    BJ   TJ  SD  HEB
a  0.0  1.0 NaN  2.0
b  NaN  NaN NaN  NaN
c  3.0  4.0 NaN  5.0
d  6.0  7.0 NaN  8.0

然则经过考试,好像reindex不内定也足以,

frame.reindex(['a','b','c','d'],['BJ','TJ','SD','HEB'])
Out[35]: 
    BJ   TJ  SD  HEB
a  0.0  1.0 NaN  2.0
b  NaN  NaN NaN  NaN
c  3.0  4.0 NaN  5.0
d  6.0  7.0 NaN  8.0

可是,即便要开始展览插值,就必须内定参数。

那般的1个数据集大家得以将它变得越来越直观,将它成为唯有一层索引的数据:

s = Series([1,2,3,4,5],index=["a","a","b","b","c"]) 
print(s.index.is_unique) 
#False 
print data.unstack()
'''
输出结果为:
          1         2         3
a -0.391760  1.383009  0.275920
b  0.182211  0.601076 -1.354204
c  1.646033  0.180620       NaN
d       NaN -0.719814 -0.545921
'''

本文由韦德国际1946发布于韦德国际1946手机版,转载请注明出处:【韦德国际1946手机版】pandas重新索引,等级次序

关键词: python 我爱编程 Python相关 Pytho