在python数据分析中,经常需要对字符串进行各种处理,例如拼接字符串、检索字符串等。下面我将对python中常用的内置字符串操作函数进行介绍。
1.计算字符串的长度-len()函数
- str1='我爱python'
- length=len(str1)
- print(length)
len()函数在计算字符串的长度时,不区分英文、数字和汉字,所有字符都按一个字符计算。
有时,我们需要获取字符串实际所占的字节,即计算python默认编码UTF-8下的实际字节长度,可以这样做:
- str1='我爱python'
- length=len(str1.encode())
- print(length)
12
和UTF-8编码下一个汉字占3个字节相吻合
2.分割字符串
split()方法可以实现字符串分割,也就是把一个字符串按照指定的分割符分割为字符串列表。具体语法格式如下
- str.split(sep,maxsplit)
参数说明:
- str:表示要分割的字符串
- sep:指定的分割符
- maxsplit:用于指定分割的次数
3.统计某字符出现的次数
count()方法用于检索某字符串在另一字符串中出现的次数,语法格式如下:
- str.count(str1)
参数说明:
- str:表示原字符串
- str1:表示要检索的字符串
4.检索某字符串是否存在(find)
find()方法用于检索是否包含指定的子字符串。如果检索的字符串不存在,则返回-1,否则返回首次出现该子字符串的索引。其语法格式如下:
- str.find(str1)
参数说明:
- str:表示原字符
- str1:表示要检索的子字符串
5.检索某字符串是否存在(index)
index()与find()方法类似,也是用于检索是否包含指定的子字符串。只不过index()方法在指定字符串不存在是会抛出异常。具体语法如下:
- str.index(str1)
参数说明:
- str:表示原字符
- str1:表示要检索的子字符串
6.检索字符串是否已指定字符串开头
这里用到startswith()方法,如果是则返回True,否则返回False,具体语法如下:
- str.startswith(str1)
参数说明:
- str:表示原字符
- str1:表示要检索的子字符串
7.检索字符串是否已指定字符串结尾
这里用到endswith()方法,如果是则返回True,否则返回False,具体语法如下:
- str.endswith(str1)
参数说明:
- str:表示原字符
- str1:表示要检索的子字符串
8.大写字母转小写字母
lower()方法用于价格字符串中的大写字母转换为小写字母,语法格式如下:
- str.lower()
9.小写字母转换为大写字母
upper()方法用于价格字符串中的小写字母转换为大写字母,语法格式如下:
- str.upper()
10.删除空格和特殊字符
strip()方法用于去掉字符串左、右两侧的空格和特殊字符,语法格式如下:
- str.strip([chars])
参数说明:
- str:表示原字符
- chars:为可选参数,用于指定要取出的字符,可以指定多个。如果chars为“@”,则取出左、右两侧包括的“@”“。”。如果不指定chars参数,默认去除空格、制表符“\t”、回车符“\r”、换行符“\n”等
11.去掉字符串左侧的字符
lstrip()方法用于去掉字符串左侧的空格和特殊字符,语法格式如下:
- str.lstrip([chars])
参数说明:
- str:表示原字符
- chars:为可选参数,用于指定要取出的字符,可以指定多个。如果chars为“@”,则取出左、右两侧包括的“@”“。”。如果不指定chars参数,默认去除空格、制表符“\t”、回车符“\r”、换行符“\n”等
12.去掉字符串右侧的字符
rstrip()方法用于去掉字符串右侧的空格和特殊字符,语法格式如下:
- str.rstrip()
参数说明:
- str:表示原字符
- chars:为可选参数,用于指定要取出的字符,可以指定多个。如果chars为“@”,则取出左、右两侧包括的“@”“。”。如果不指定chars参数,默认去除空格、制表符“\t”、回车符“\r”、换行符“\n”等
本文转载自微信公众号「python数据分析之禅」,作者小dull鸟 。转载本文请联系python数据分析之禅公众号。