03-03 字符串类型及操作

一、概述

  • 字符串类型的表示
  • 字符串操作符
  • 字符串处理函数
  • 字符串处理方法
  • 字符串类型的格式化

二、字符串类型的表示

由0个或多个字符组成的有序字符序列

  • 字符串由一对单引号或一对双引号表示:"请输入带有符号的温度值: "或者 'C'
  • 字符串是字符的有序序列,可以对其中的字符进行索引:"请""请输入带有符号的温度值: " 的第0个字符

字符串有 2类共4种 表示方法

  • 由一对单引号或双引号表示,仅表示单行字符串:"请输入带有符号的温度值: "或者 'C'
  • 由一对三单引号或三双引号表示,可表示多行字符串
'''
Python
    语言
'''
  • 如果希望在字符串中包含双引号或单引号呢?:'这里有个双引号(")' 或者 "这里有个单引号(')"
  • 如果希望在字符串中既包括单引号又包括双引号呢?:''' 这里既有单引号(')又有双引号 (") '''

2.1 字符串的序号

正向递增序号 和 反向递减序号

2.2 字符串的使用

使用[ ]获取字符串中一个或多个字符

  • 索引:返回字符串中单个字符 <字符串>[M]"请输入带有符号的温度值: "[0] 或者 TempStr[-1]
  • 切片:返回字符串中一段字符子串 <字符串>[M: N]"请输入带有符号的温度值: "[1:3] 或者 TempStr[0:-1]

2.3 字符串切片高级用法

使用[M: N: K]根据步长对字符串切片

  • <字符串>[M: N],M缺失表示至开头,N缺失表示至结尾:"〇一二三四五六七八九十"[:3] 结果是 "〇一二"
  • <字符串>[M: N: K],根据步长K对字符串切片:
    • "〇一二三四五六七八九十"[1:8:2] 结果是 "一三五七"
    • "〇一二三四五六七八九十"[::-1] 结果是 "十九八七六五四三二一〇

2.4 字符串的特殊字符——转义符

  • 转义符表达特定字符的本意:"这里有个双引号(\")" 结果为 这里有个双引号(")
  • 转义符形成一些组合,表达一些不可打印的含义:"\b"回退 "\n"换行(光标移动到下行首) "\r" 回车(光标移动到本行首)

三、字符串操作符

3.1 由0个或多个字符组成的有序字符序列

操作符及使用 描述
x+y 连接两个字符串x和y
nx 或 xn 复制n次字符串x
x in s 如果x是s的子串,返回True,否则返回False

3.2 获取星期字符串

  • 输入:1-7的整数,表示星期几
  • 输出:输入整数对应的星期字符串
  • 例如:输入3,输出 星期三
# WeekNamePrintV1.py

weekStr = "星期一星期二星期三星期四星期五星期六星期日" 
weekId = eval(input("请输入星期数字(1-7):"))
pos = (weekId – 1 ) * 3
print(weekStr[pos: pos+3])
# WeekNamePrintV2.py

weekStr = "一二三四五六日"
weekId = eval(input("请输入星期数字(1-7):")) 
print("星期" + weekStr[weekId-1])

四、字符串处理函数

一些以函数形式提供的字符串处理功能

函数及使用 描述
len(x) 长度,返回字符串x的长度:len("一二三456") 结果为 6
str(x) 任意类型x所对应的字符串形式:str(1.23)结果为"1.23" str([1,2])结果为"[1,2]"
hex(x) 或 oct(x) 整数x的十六进制或八进制小写形式字符串:hex(425)结果为"0x1a9" oct(425)结果为"0o651"
chr(u) x为Unicode编码,返回其对应的字符
ord(x) x为字符,返回其对应的Unicode编码

4.1 Unicode编码

Python字符串的编码方式

  • 统一字符编码,即覆盖几乎所有字符的编码方式
  • 从0到1114111 (0x10FFFF)空间,每个编码对应一个字符
  • Python字符串中每个字符都是Unicode编码字符

4.1.1 一些有趣的例子

print("1+1=2" + chr(10004))
print("这个字符♈的Unicode值是:" + str(ord("♈")))
for i in range(12):
    print(chr(9800 + i), end="")

"""
♈♉♊♋♌♍♎♏♐♑♒♓
"""

五、字符串处理方法

"方法"在编程中是一个专有名词

  • "方法"特指<a>.<b>()风格中的函数<b>()
  • 方法本身也是函数,但与<a>有关,<a>.<b>()风格使用
  • 字符串及变量也是<a>,存在一些方法

六、字符串内置方法

一些以方法形式提供的字符串处理功能

方法及使用 描述
str.lower() 或 str.upper() 返回字符串的副本,全部字符小写/大写:"AbCdEfGh".lower() 结果为 "abcdefgh"
str.split(sep=None) 返回一个列表,由str根据sep被分隔的部分组成 :"A,B,C".split(",") 结果为[‘A’,’B’,’C’]
str.count(sub) 返回子串sub在str中出现的次数:"a apple a day".count("a") 结果为 4
str.replace(old, new) 返回字符串str副本,所有old子串被替换为new :"python".replace("n","n456") 结果为 "python456"
str.center(width[,fillchar]) 字符串str根据宽度width居中,fillchar可选:"python".center(20,"=") 结果为 ‘=======python=======’
str.strip(chars) 从str中去掉在其左侧和右侧chars中列出的字符:"= python= ".strip(" =np") 结果为

"ytho"str.join(iter)|在iter变量除最后元素外每个元素后增加一个:str ",".join("12345") 结果为 "1,2,3,4,5" #主要用于字符串分隔等

七、字符串类型的格式化

格式化是对字符串进行格式表达的方式

  • 字符串格式化使用.format()方法,用法如下:<模板字符串>.format(<逗号分隔的参数>)
  • 字符串格式化使用f-string方法,用法如下:f<模板{<逗号分隔的参数>}字符串>

7.1 f-string方法的格式控制

{<参数序号> : <格式控制标记>}

: <填充> <对齐> <宽度> <,> <.精度> <类型>
引导符号 用于填充的单个字符 < 左对齐 > 右对齐 ^ 居中对齐 槽设定的输出宽度 数字的千位分隔符 浮点数小数 或 字符串最大输出长度 整数类型 b,c,d,o,x,X 浮点数类型e,E,f,%
"{0:=^20}".format('PYTHON')
'''=======PYTHON======='''

"{0:*>20}".format("BIT")
'''*****************BIT'''

"{:10}".format("BIT")
'''BIT       '''

八、单元小结

  • 正向递增序号、反向递减序号、<字符串>[M:N:K]
  • +、*、len()、str()、hex()、oct()、ord()、chr()
  • .lower()、.upper()、.split()、.count()、.replace()
  • .center()、.strip()、.join()、.format()格式化
上一篇
下一篇
Copyright © 2022 Egon的技术星球 egonlin.com 版权所有 帮助IT小伙伴学到真正的技术