- 例解Python:Python编程快速入门践行指南
- 张志刚
- 1961字
- 2025-02-23 00:06:02
2.2 字符串
2.2.1 常用的定义字符串的方式
Python中,字符串被定义为引号之间的字符集合。引号既可以使用单引号,也可以使用双引号。无论单引号,还是双引号,表示的含义都完全相同。此外,Python支持三引号(三个连续的单引号或双引号),用于包含特殊字符,保存原始格式。如下所示:
data:image/s3,"s3://crabby-images/22291/2229177f9daf1bc2a917d14665652612dea13792" alt="img"
为了正确地表示字符串中的单引号,需要在字符串两边使用双引号。如果采用了单引号,就会出现语法错误,因为Python将找到的第二个单引号与第一个单引号实行配对,如下所示:
data:image/s3,"s3://crabby-images/bed51/bed51aaf99281885a37737a37399eb2c0186f257" alt="img"
如果字符串中间有回车,则输入时需要使用转义字符:
data:image/s3,"s3://crabby-images/69346/69346e3f0753dc7f2dd2d2ea117fb7fe1c44c53b" alt="img"
三引号能够保存输入时的原始样式,如下所示:
data:image/s3,"s3://crabby-images/c6e84/c6e840f74e4a114d2f4d158fc30cec956cd3d60b" alt="img"
在Python内部保存的时候,并没有分成多行,还是用\n表示回车。不使用print语句,直接输入变量就可以看到Python存储的样式:
data:image/s3,"s3://crabby-images/ad433/ad43399c6389159aba5b2760d3bf4192dbadbc3b" alt="img"
2.2.2 通过字符串切片获取字符或子串
使用索引运算符[ ]来得到一个字符。按照从左到右的顺序取字符,第一个字符的索引(也常被称为下标)是0;按照从右到左的顺序取字符,还可以使用负数,最后一个字符的索引是-1。如果使用的下标已经超出范围,则会出现IndexError的异常:
data:image/s3,"s3://crabby-images/c4f85/c4f85309594fc2c2eb556a73b50f4c8eba1e1b52" alt="img"
使用切片运算符[:]来得到一部分字符串。冒号左侧是起始下标,右侧是结束下标。其中,起始下标对应的字符包含在子串内,而结束下标对应的字符不包含在子串内。所以取出字符串“Python”的前两个字符,需要使用以下方式:
data:image/s3,"s3://crabby-images/2c627/2c627978e12276250c4cca78c9dcd28156d2a24f" alt="img"
那么,如果需要取出“thon”呢?字符“n”的下标是5,从下标为2的第三个字符取到下标为5的子串只能取出“tho”:
data:image/s3,"s3://crabby-images/d2a12/d2a12f17d843a5bf4323eeea800ba6f82f02445d" alt="img"
试一下将结束下标改为6,虽然字符串没有这个下标值:
data:image/s3,"s3://crabby-images/543f7/543f75ce051e9de1a1f816a17e19f2e1ba22d84e" alt="img"
通过上面的例子,可以得到结论:通过索引运算符取出一个字符,如果索引超出范围会发生错误,而通过切片运算符取子串,下标值可以是任意值。既然6都能用,60是不是也能使用呢?如下所示:
data:image/s3,"s3://crabby-images/70414/70414706c0f318ce1ce3d0e9efe5860a4c235c15" alt="img"
在实际使用过程中,如果想取到结尾,结束下标干脆就不用写了:
data:image/s3,"s3://crabby-images/e13e1/e13e1e3dcc7b0ccae00d09cccf4fc533ff66abac" alt="img"
同样的道理,从开头取,起始下标也是不用写的:
data:image/s3,"s3://crabby-images/2cc65/2cc656ce98d96ff5b62bf087aae820db55d64d8f" alt="img"
字符串取切片还支持一个步长值,可以跳跃地取子串,如只想取出“Pto”:
data:image/s3,"s3://crabby-images/c3fbb/c3fbb0a4ce8856f4d4e24d7cffe580e4a77a12cb" alt="img"
起始下标和结束下标都没有写,表示从头取到尾,步长为2表示每隔一个字符取一个字符。如果只需要取出“yhn”,则如下所示:
data:image/s3,"s3://crabby-images/a2830/a2830d8c1064d3c9c47c70a4795a310a2b646e64" alt="img"
步长值也能使用负数,表示自右向左取切片:
data:image/s3,"s3://crabby-images/d957b/d957ba7764d61fe9f6811cc2bd1dda1ab728558b" alt="img"
2.2.3 字符串的拼接与重复
字符串支持+操作,和数字运算不一样,字符“相加”只是简单地将两个字符串拼接到一起:
data:image/s3,"s3://crabby-images/046f2/046f2021ea8cf070846be0dae509b5ade7e0fa2e" alt="img"
只要参与拼接的双方最终都是字符串对象就行,变量py_str是字符串类型,也可以实现拼接操作:
data:image/s3,"s3://crabby-images/f32dc/f32dca15883279488b959176e5b88cdc49e79cca" alt="img"
字符串还支持*操作,字符串的*表示将字符串重复多次:
data:image/s3,"s3://crabby-images/27915/279158db37ba79d30a16d2de1574b5e0384782ec" alt="img"
2.2.4 字符串成员关系判断
判断字符或字符串是否存在于另一个字符串中:
data:image/s3,"s3://crabby-images/0580b/0580bb84b7115c37e4e502410b869a6ef4a34634" alt="img"
data:image/s3,"s3://crabby-images/c646a/c646a7a24e552ffde295e691dd376c1741fca3b0" alt="img"
2.2.5 字符串方法
字符串拥有非常多方法,这里仅仅将常用的方法做一个简单的说明,完整方法请查阅官方文档,或使用help帮助。
➢ str.strip()。
strip()默认用于去除字符串两端的空白字符。空白字符并不是只有空格,全部的空白字符是" \r\t\v\f\n"。如下所示:
data:image/s3,"s3://crabby-images/e45f1/e45f1b0a6f097b6f0f23062c3de3f11d5c4d9d6d" alt="img"
strip()也可以去除两端指定的字符:
data:image/s3,"s3://crabby-images/8de32/8de32673b14323b92f7c7f214c35074494645eaf" alt="img"
如果只是去除左端或右端的字符,则使用lstrip()或rstrip():
data:image/s3,"s3://crabby-images/eadb9/eadb9e553a8532fd4ee727b5920e544a29ad6ac5" alt="img"
➢ str.split()。
split()默认使用空格作为分隔符,将字符串分隔开。
data:image/s3,"s3://crabby-images/46884/4688465b1d5911503952405ea3378604841325dc" alt="img"
也可以指定分隔符:
data:image/s3,"s3://crabby-images/0e694/0e6949f79c1d1465ffee597dc1d1f2b9dde4ab3b" alt="img"
➢ str.replace()。
通过名称就能猜到,它用于字符串的替换操作:
data:image/s3,"s3://crabby-images/e86a2/e86a26d766f22617b0c00fccf23eb66c62f2adbb" alt="img"
➢ str.islower()。
字符串中的字母全部是小写则返回True,不考虑非字母字符:
data:image/s3,"s3://crabby-images/9899c/9899c9cc03330756151a4b998d0ecef62dfd7a0d" alt="img"
➢ str.isupper()。
字符串中的字母全部是大写则返回True,不考虑非字母字符:
data:image/s3,"s3://crabby-images/649a7/649a737fa33c46e9d5f4c54bab2b3c313c67499e" alt="img"
➢ str.isdigit()。
字符串中所有字符全部是数字才返回True:
data:image/s3,"s3://crabby-images/ff346/ff346df657cc435d0526ab40e4d31012a8b6a2f4" alt="img"
➢ str.ljust()。
字符串左对齐:
data:image/s3,"s3://crabby-images/28f63/28f633c3633c3e8c14b5afb7169607d65bdf7e34" alt="img"
data:image/s3,"s3://crabby-images/23dc0/23dc07492da8aa65934020a2cb0ad74fc0736d13" alt="img"
➢ str.rjust()。
字符串右对齐:
data:image/s3,"s3://crabby-images/32b0c/32b0c75474aea6a83275f22d033154b9d07b3c32" alt="img"
➢ str.center()。
字符串居中:
data:image/s3,"s3://crabby-images/0b1dc/0b1dc5a512bdb37cc6f73a34df5a318fccd0204c" alt="img"
➢ str.startswith()。
判断字符串以哪些字符开头:
data:image/s3,"s3://crabby-images/1aca2/1aca240bc4d81b8a9307594d96400e92cef78ee8" alt="img"
➢ str.endswith()。
判断字符串以哪些字符结尾:
data:image/s3,"s3://crabby-images/4ec89/4ec89df5eb71ccc0870798f42d3c6b43e7f7cad5" alt="img"
2.2.6 字符串格式化方法
如果字符串中有变化的数据,则可以用%s进行占位:
data:image/s3,"s3://crabby-images/18ddd/18dddc6ec5f9e041ae9dca082fb344934b81ea48" alt="img"
在中间%的前面有一个字符串,字符串中有两个%s进行占位,这两个%s被后面元组中的字符串“Tom”和数字20替换。
%s表示使用str()函数将相应的数据进行转换。上面的例子中,20是十进制整数,它也可以使用%d进行占位:
data:image/s3,"s3://crabby-images/d40d0/d40d09564206e5563ce93fa2bbbb21eeffc6a0e4" alt="img"
占位符还可以是一个表示宽度的数字:
data:image/s3,"s3://crabby-images/69b52/69b52f8d394cefcce650a0cd2c5ebda9094002ff" alt="img"
第一个%10s表示后面元组中的“name”字符将占据10个字符的宽度,因为“name”的宽度是4,那么需要在它前面补上6个空格。
%s中间的数字,正数表示右对齐,采用负数可以实现左对齐:
data:image/s3,"s3://crabby-images/d2c45/d2c45bbefd249a59f88f469367864d8f176e6bb7" alt="img"
浮点数使用%f:
data:image/s3,"s3://crabby-images/31a3d/31a3d58d71226376fd07a881942b3841ab2f4183" alt="img"
以八进制数进行输出:
data:image/s3,"s3://crabby-images/8ef47/8ef4794f817d7a63d3e2f0edcaa944e2c586d517" alt="img"
以十六进制数进行输出:
data:image/s3,"s3://crabby-images/2b596/2b596afb0cff3bdd70699bbe50bc54c0742f1fca" alt="img"
使用%%输出百分号:
data:image/s3,"s3://crabby-images/9642d/9642dd473a10d74b646139b6967b96a9ec988dce" alt="img"
2.2.7 利用原始字符串表达字面本身的含义
如果你正在使用Windows系统编写程序,很可能会需要定义一个路径,就像这样的:
data:image/s3,"s3://crabby-images/aa1be/aa1be5e158e0eadf8e3ce14917141aeafc3d8eab" alt="img"
接下来我们用print语句进行输出:
data:image/s3,"s3://crabby-images/85a9b/85a9bc002618d38b5643c8c330ddf31c09f633bb" alt="img"
你没有看错,就是这样的!为什么呢?因为\t将会变成Tab键,而\n会被翻译成回车。因此,路径就不得不这么书写:
data:image/s3,"s3://crabby-images/ee8de/ee8def24286ad44c42b0a84c8b314e55191eeda9" alt="img"
现在好了,Windows系统的路径不再出现错误,两个反斜线表示一个真正的反斜线,它不会再和后面的字母t和n组合起来表示其他含义。不过,这种写法很麻烦,每次都要写两个反斜线,这个时候,原始字符串就派上用场了。
原始字符串就是在字符串前面加一个r而已:
data:image/s3,"s3://crabby-images/cf4e6/cf4e6e91baff4e2846dc291871b7644c4acb49a8" alt="img"
有了原始字符串,路径看上去就真的是一个Windows路径了,不再显得那么奇怪。那么,原始字符串是怎么办到的呢?print打印出来的内容是方便给人看的,如果不用print,则Python交互解释器就会显示出它在内部存储的真正的样子:
data:image/s3,"s3://crabby-images/4920c/4920c47d81b6d338d8912e2982876491afaf3f94" alt="img"
原来是加上r后,Python自动把一个反斜线变成两个了!