队列选取,dataframe常见操作方法

作者: 韦德国际1946手机版  发布:2019-05-28

实比方下所示:

SQL中的select是依照列的称号来选拔;Pandas则更为灵活,不但可依照列名称选择,还足以依据列所在的position(数字,在第几行第几列,注意pandas行列的position是从0开首)接纳。相关函数如下:

今天在用dataframe用到的办法

  • 一.取某列某些范围内的数据
    data_total = data_total[(data_total['inTime'] > np.datetime64(date_begin)) & (data_total['inTime'] < np.datetime64(date_end))]
  • 贰.按某列计算数据
   dh = dh['enterprise_id'].sum()
   dh = dh['enterprise_id'].count()
  • 队列选取,dataframe常见操作方法。3.遍历dataframe
    for index,item in pd.iterrows():
  • 四.岁月截取年与日
for index,item in pd.iterrows():
        date = item[9].date()

concat 与其说是连接,更可信赖的乃是拼接。正是把多少个表直接合在共同。于是有2个优良的主题材料,是横向拼接还是纵向拼接,所以concat 函数的入眼参数是axis 。

# -*- coding: utf-8 -*-
import numpy as np
import pandas as pd
from pandas import *
from numpy import *

data = DataFrame(np.arange(16).reshape(4,4),index = list("ABCD"),columns=list('wxyz'))
print data
print data[0:2] #取前两行数据
print'             '

print len(data )  #求出一共多少行
print data.columns.size #求出一共多少列
print'             '

print data.columns #列索引名称
print data.index #行索引名称
print'             '

print data.ix[1]  #取第2行数据
print data.iloc[1]  #取第2行数据
print'             '

print data['x'] #取列索引为x的一列数据
print data.loc['A'] #取第行索引为”A“的一行数据,
print'             '

print data.loc[:,['x','z'] ]  #表示选取所有的行以及columns为a,b的列;
print data.loc[['A','B'],['x','z']] #表示选取'A'和'B'这两行以及columns为x,z的列的并集;
print'             '

print data.iloc[1:3,1:3]  #数据切片操作,切连续的数据块
print data.iloc[[0,2],[1,2]]  #即可以自由选取行位置,和列位置对应的数据,切零散的数据块
print'             '

print data[data>2] #表示选取数据集中大于0的数据
print data[data.x>5] #表示选取数据集中x这一列大于5的所有的行

print'             '
a1=data.copy()
print a1[a1['y'].isin(['6','10'])] #表显示满足条件:列y中的值包含'6','8'的所有行。

print data.mean()  #默认对每一列的数据求平均值;若加上参数a.mean(1)则对每一行求平均值;
print data['x'].value_counts() #统计某一列x中各个值出现的次数:

print data.describe() #对每一列数据进行统计,包括计数,均值,std,各个分位数等。

data.to_excel(r'E:pypracticeYundoc2.xls',sheet_name='Sheet1') #数据输出至Excel

一)loc,基于列label,可挑选一定行(依照行index);

函数的现实参数是:

上述那篇python dataframe常见操作方法:达成取行、列、切成块、总括特征值正是我分享给我们的全体内容了,希望能给大家三个参照,也意在我们多多接济脚本之家。

2)iloc,基于行/列的position;

concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False,keys=None,levels=None,names=None,verigy_integrity=False)

你恐怕感兴趣的小说:

  • python pandas库中DataFrame对行和列的操作实例疏解
  • python pandas中DataFrame类型数据操作函数的点子
  • python DataFrame获取行数、列数、索引及第几行第几列的值方法
  • pandas类别之DataFrame 行列数据筛选实例

3)at,依照内定行index及列label,飞快牢固DataFrame的成分;

objs 是索要拼接的对象会集,一般为列表或许字典

四)iat,与at类似,不相同的是依照position来恒定的;

axis=0 是行拼接,拼接之后行数扩大,列数也根据join来定,join='outer'时,列数是两表并集。同理join='inner',列数是两表交集。

本文由韦德国际1946发布于韦德国际1946手机版,转载请注明出处:队列选取,dataframe常见操作方法

关键词: 我的Pytho... 工作

上一篇:小数位数精度,自定义小数精度
下一篇:没有了