(12) Python 字符串详解、转义字符及常用方法
目录
在Python中,字符串是表示文本的数据类型。
字符串可以包含字母、数字、符号和空格,并且支持多种操作和方法。以下是一些关于Python字符串、转义字符及其方法的详细介绍。
1. 字符串的创建
字符串可以通过单引号('
)、双引号("
)或三引号('''
或 """
)来创建。
s1 = 'Hello, World!'
s2 = "Hello, World!"
s3 = '''This is a
multi-line
string.'''
s4 = """This is also a
multi-line
string."""
注意:单引号(‘)、双引号(”)定义字符串只能定义一行数据;
三引号(’‘’ 或 “””)可以定义多行数据
2. 访问字符串中的值
2.1 访问字符串中的字符(索引值以 0 为开始值)
使用方括号 [] 来获取字符串中的字符
2.2 访问字符串中的字符(索引值以 -1 为开始值)
使用方括号 [] 来获取字符串中的字符
2.3 访问字符串中的子字符串(切片)
使用方括号 [] 来获取字符串中的子字符串
3. 转义字符
转义字符用于在字符串中表示那些无法直接输入的字符,例如换行符、制表符等。常见的转义字符有:
\
:续行符\n
:换行符\t
:横向制表符(Tab)\\
:反斜杠字符本身\'
:单引号\"
:双引号\r
:回车符\b
:退格符\f
:换页符\yyy
:八进制数\xyy
:十六进制数示例:
# 续行符 \ 输出line1line2line3
print("line1 \
... line2 \
... line3")
# 换行符 \n 输出:
# abc
# ef
print("abc\ndef")
# 横向制表符(Tab)
# 输出:Hello World!
print("Hello\tWorld!")
# 反斜杠字符本身
# 输出:Hello\World!
print("Hello\\World!")
# 单引号
# 输出:Hello'World!
print("Hello\'World!")
# 双引号
# 输出:Hello"World!
print("Hello\"World!")
# 回车符
# 输出:World!
print("Hello123 43\rWorld!")
# 退格符
# 输出:hell123
print('hello\b123')
# 八进制数
# 输出:Hello World!
print("\110\145\154\154\157\40\127\157\162\154\144\41")
# 十六进制数
# 输出:Hello World!
print("\x48\x65\x6c\x6c\x6f\x20\x57\x6f\x72\x6c\x64\x21")
4. ASCII码
ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码)是用于表示文本字符的数值编码系统。每个ASCII字符都对应一个介于0到127之间的整数。例如,大写字母A的ASCII码是65,小写字母a的ASCII码是97,数字0的ASCII码是48,ASCII码表如下:
4.1 ord()
函数:
ord()
函数用于获取一个字符的ASCII码值。
char = 'A'
ascii_value = ord(char)
print(ascii_value) # 输出: 65
4.2 chr()
函数:
chr()
函数用于根据ASCII码值获取对应的字符。
ascii_value = 65
char = chr(ascii_value)
print(char) # 输出: A
4.3 字符串的 .encode()
方法:
虽然 .encode()
方法通常用于将字符串编码为字节串(bytes),但你可以指定编码方式为 'ascii'
来获得与ASCII码相关的字节表示。不过,请注意,只有可打印的ASCII字符才能被成功编码为ASCII字节串。
string = "Hello"
ascii_bytes = string.encode('ascii')
print(ascii_bytes) # 输出: b'Hello'
如果字符串包含非ASCII字符,.encode('ascii')
将引发一个 UnicodeEncodeError
异常。
4.4 字节串的 .decode()
方法:
与 .encode()
相反,.decode()
方法用于将字节串解码为字符串。当使用 'ascii'
编码方式时,它期望字节串只包含有效的ASCII字节。
作者:码界领航