字符串操作

numpy.char 模块为类型 numpy.string_ 或的数组提供了一组向量化的字符串操作numpy.unicode_。 它们全部基于Python标准库中的字符串方法。

字符串操作

方法 描述
add(x1, x2) 返回两个str或unicode数组的按元素的字符串连接。
multiply(a, i) 返回(a * i),即按元素方式的字符串多重连接。
mod(a, values) 返回(a%i),这是Python 2.6之前的字符串格式(迭代),针对一对str或unicode的array_likes元素。
capitalize(a) 返回的拷贝一个只有资本的每个元素的第一个字符。
center(a, width[, fillchar]) 返回的拷贝一与在长度的字符串居中其元素宽度。
decode(a[, encoding, errors]) 按元素调用str.decode。
encode(a[, encoding, errors]) 逐元素调用str.encode。
expandtabs(a[, tabsize]) 返回每个字符串元素的副本,其中所有制表符都被一个或多个空格替换。
join(sep, seq) 返回一个字符串,该字符串是序列seq中字符串的串联。
ljust(a, width[, fillchar]) 返回与元素的数组一个左对齐的长度的字符串宽度。
lower(a) 返回一个将元素转换为小写的数组。
lstrip(a[, chars]) 对于每一个元素一个,去除了主角返回副本。
partition(a) 将每个元素划分为大约sep。
replacee(a, old, new[, count]) 对于每一个元素一个,返回字符串的副本串中出现的所有旧的换成新的。
rjust(a, width[, fillchar]) 返回与元素的数组一个右对齐的长度的字符串宽度。
rpartition(a, sep) 在最右边的分隔符周围分割(分割)每个元素。
rsplit(a[, sep, maxsplit]) 在每个元件一个,返回的词的列表字符串中,使用月作为分隔符串。
rstrip(a[, chars]) 在每个元件一个,返回与除去尾部字符的副本。
split(a[, sep, maxsplit]) 在每个元件一个,返回的词的列表字符串中,使用月作为分隔符串。
splitlines(a[, keepends]) 在每个元件一个,返回行的列表中的元素,在断裂线边界。
strip(a[, chars]) 在每个元件一个,其中移除了前缘和后字符返回副本。
swapcase(a) 按元素返回字符串的副本,该字符串的大写字符转换为小写,反之亦然。
title(a) 返回字符串或unicode的逐元素标题区分大小写的版本。
translate(a, table[, deletechars]) 对于每一个元素一个,返回其中可选的参数中出现的所有字符的字符串拷贝deletechars被删除,而剩余的字符已经通过给定的转换表映射。
upper(a) 返回一个数组,其中元素转换为大写。
zfill(a, width) 返回用零填充的数字字符串

比较

与标准numpy比较运算符不同,char 模块中的运算符在执行比较之前会删除结尾的空白字符。

方法 描述
equal(x1, x2) 按元素返回(x1 == x2)。
not_equal(x1, x2) 按元素返回(x1!= x2)。
greater_equal(x1, x2) 按元素返回(x1> = x2)。
less_equal(x1, x2) 按元素返回(x1 <= x2)。
greater(x1, x2) 按元素返回(x1> x2)。
less(x1, x2) 按元素返回(x1 < x2)。
compare_chararrays(a, b, cmp_op, rstrip) 使用cmp_op指定的比较运算符对两个字符串数组执行逐元素比较。

字符串信息

方法 描述
count(a, sub[, start, end]) 返回一个数组,该数组的子字符串sub的不重叠出现次数在[ start,end ] 范围内。
endswith(a, suffix[, start, end]) 返回一个布尔值阵列,其是真正的,其中在字符串元素一个结尾的后缀,否则假。
find(a, sub[, start, end]) 对于每个元素,返回找到子字符串sub的字符串中的最低索引。
index(a, sub[, start, end]) 与相似find,但是在未找到子字符串时引发ValueError。
isalpha(a) 如果字符串中的所有字符都是字母并且至少包含一个字符,则对每个元素返回true,否则返回false。
isalnum(a) 如果字符串中的所有字符都是字母数字并且至少包含一个字符,则对每个元素返回true,否则返回false。
isdecimal(a) 对于每个元素,如果元素中只有十进制字符,则返回True。
isdigit(a) 如果字符串中的所有字符都是数字并且至少有一个字符,则对每个元素返回true,否则返回false。
islower(a) 如果字符串中所有大小写的字符均为小写且至少有一个大小写的字符,则对每个元素返回true,否则返回false。
isnumeric(a) 对于每个元素,如果元素中仅包含数字字符,则返回True。
isspace(a) 如果字符串中只有空格字符且至少有一个字符,则对每个元素返回true,否则返回false。
istitle(a) 如果该元素是一个带标题的字符串并且至少包含一个字符,则为每个元素返回true,否则返回false。
isupper(a) 如果字符串中所有大小写的字符均为大写且至少有一个字符,则为每个元素返回true,否则返回false。
rfind(a, sub[, start, end]) 在每个元件一个,在字符串中返回指数最高,其中子子被发现,使得子包含[内开始,结束。
rindex(a, sub[, start, end]) 与相似rfind,但是在未找到子字符串sub时引发ValueError。
startswith(一个,前缀[,开始,结束]) 返回一个布尔数组是真正的地方在字符串元素一个开头前缀,否则假。
str_len(a) 按元素返回len(a)。

便利构造函数

方法 描述
array(obj[, itemsize, copy, unicode, order]) 创建一个 chararray
asarray(obj[, itemsize, unicode, order]) 将输入转换为 chararray ,仅在必要时复制数据。
chararray(shape[, itemsize, unicode, …]) 提供有关字符串和Unicode值数组的便捷视图。