python中count()、values_counts()、size()函数


string 中 某字符 的次数

str.count(sub, start= 0,end=len(string))

Args Annotations
sub 搜索的子字符串
start 字符串开始搜索的位置。默认为第一个字符,第一个字符索引值为0。
end 字符串中结束搜索的位置。字符中第一个字符的索引为 0。默认为字符串的最后一个位置。

list 中 某元素 的次数

list.count(obj)

Args Annotations
obj 搜索的list

实验代码

string 中 某字符 的次数

# coding=utf-8
string = 'Hello World ! Hello Python !'
print "string.count(sub) : ", string.count('H')
print "string.count(sub, 1) : ", string.count('H', 1)
print "string.count(sub, 1, 100) : ", string.count('H', 1, 100) # 随便取个 无限大的 end 参数

打印结果:

string.count(sub) :  2
string.count(sub, 1) :  1
string.count(sub, 1, 100) :  1

list 中 某元素 的次数

list = [10, 20, 30, 'Hello', 10, 20]
print "list.count('Hello') : ", list.count('Hello')
print "list.count(10) : ", list.count(10)

打印结果:

list.count('Hello') :  1
list.count(10) :  2

pandas 的value_counts()函数可以对Series里面的每个值进行计数并且排序。

现有一个DataFrame

如果我们想知道,每个区域出现了多少次,可以简单如下:

每个区域都被计数,并且默认从最高到最低做降序排列。

如果想用升序排列,可以加参数ascending=True:

如果想得出的计数占比,可以加参数normalize=True:

空值是默认剔除掉的。value_counts()返回的结果是一个Series数组,可以跟别的数组进行运算。

value_count()跟透视表里(pandas或者excel)的计数很相似,都是返回一组唯一值,并进行计数。这样能快速找出重复出现的值。

size()和shape () 是numpy模块中才有的函数

size():计算数组和矩阵所有数据的个数
a = np.array([[1,2,3],[4,5,6]])
np.size(a),返回值为 6
np.size(a,1),返回值为 3

shape ():得到矩阵每维的大小
np. shape (a),返回值为 (2,3)

另外要注意的是,shape和size既可以作为函数,也可以作为ndarray的属性
a.size,返回值为 6,
a.shape,返回值为 (2,3)

python中count()、values_counts()、size()函数介绍到这里,更多Python学习 请参考编程字典Python教程 和问答部分,谢谢大家对编程字典的支持。


原文链接:https://blog.csdn.net/qq_20412595/article/details/79921849?ops_request_misc=&request_id=&biz_id=102&utm_term=python&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-4-79921849.nonecase&spm=1018.2226.3001.4187