对pandas实行多少预管理的实例解说,pandas中对S

作者: 韦德国际1946手机版  发布:2019-05-28

不常大家想要的数额统一结果是数量的轴向连接,在pandas中那足以因而concat来兑现。操作的靶子日常是Series。

Series类似于壹维数组

出席kaggle数据开采竞技,就率先个赛题Titanic的多寡,学习有关数据预管理以及模型营造,本博客关怀基于pandas进行数据预管理进度。包罗数据计算、数据离散化、数据关联性剖析

对pandas实行多少预管理的实例解说,pandas中对Series数据进行轴向连接的实例。参预kaggle数据开采竞赛,就率先个竞赛标题Titanic的数量,学习相关数据预管理以及模型建构,本博客关心基于pandas进行数据预管理进程。包蕴数据总结、数据离散化、数据关联性深入分析

Ipython中的交互代码如下:

先是步要求导入模块

from pandas import Series, DataFrame

In [4]: obj = Series([4, 7, -5, 3])

In [5]: obj
Out[5]:
0    4
1    7
2   -5
3    3

In [6]: obj.values
Out[6]: array([ 4,  7, -5,  3])

In [7]: obj.index
Out[7]: Int64Index([0, 1, 2, 3])

引进包和加载数据

引进包和加载数据

In [17]: from pandas import Series,DataFrame
In [18]: series1 = Series(range(2),index = ['a','b'])
In [19]: series2 = Series(range(3),index = ['c','d','e'])
In [20]: series3 = Series(range(2),index = ['f','g'])
In [21]: import pandas as pd

点名索引

In [8]: obj2 = Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c'])

In [9]: obj2
Out[9]:
d    4
b    7
a   -5
c    3

In [10]: obj2.index
Out[10]: Index([d, b, a, c], dtype=object)

In [11]: obj2['a']
Out[11]: -5

In [12]: obj2['d'] = 6

In [13]: obj2[['c', 'a', 'd']]
Out[13]:
c        3
a       -5
d        6
import pandas as pd
import numpy as np
train_df =pd.read_csv('../datas/train.csv') # train set
test_df = pd.read_csv('../datas/test.csv') # test set
combine = [train_df, test_df]
import pandas as pd
import numpy as np
train_df =pd.read_csv('../datas/train.csv') # train set
test_df = pd.read_csv('../datas/test.csv') # test set
combine = [train_df, test_df]

进展八个Series的连接:

各个运算

过滤,乘法

In [14]: obj2
Out[14]:
d        6
b        7
a       -5
c        3

In [15]: obj2[obj2 > 0]      In [16]: obj2 * 2       In [17]: np.exp(obj2)
Out[15]:                     Out[16]:                Out[17]:
d    6                       d    12                 d     403.428793
b    7                       b    14                 b    1096.633158
c    3                       a   -10                 a       0.006738
                             c     6                 c      20.085537

洗涤数据

保洁数据

In [22]: pd.concat([series1,series2,series3])
Out[22]: 
a 0
b 1
c 0
d 1
e 2
f 0
g 1
dtype: int64

Series看做3个定长有序的字典

In [18]: 'b' in obj2
Out[18]: True

In [19]: 'e' in obj2
Out[19]: False

翻看数据维度以及项目

查看数据维度以及项目

私下认可景况下,pandas实践的是根据axis=0实行连接。借使展开axis=1的连接,结果如下:

缺点和失误值处理

缺点和失误值管理

In [24]: S1=pd.concat([series1,series2,series3],axis=1)
In [25]: S1
Out[25]: 
 0 1 2
a 0.0 NaN NaN
b 1.0 NaN NaN
c NaN 0.0 NaN
d NaN 1.0 NaN
e NaN 2.0 NaN
f NaN NaN 0.0
g NaN NaN 1.0
In [26]: type(S1)
Out[26]: pandas.core.frame.DataFrame

翻开object数据总结音讯

查阅object数据总计新闻

本文由韦德国际1946发布于韦德国际1946手机版,转载请注明出处:对pandas实行多少预管理的实例解说,pandas中对S

关键词: 日记本 我爱编程 伟德1946网页版

上一篇:详解Python使用simplejson模块解析JSON的方法
下一篇:没有了