【JP】第八章 文本数据

提问前先阅读此贴学习规范,同时要求问题表述清晰,报错相关的问题需以文字而非图片的形式给出代码与重要的错误信息。

似乎Notebook版内容缺了一个标题 2.元字符基础,网页版没问题
image
image

如图是否应为非字符串元素?

是的,谢谢!

编号:10,昵称:天国之影
内容:github中的jupyter notebook内容优化
image
image
image
image
image

记录下学习的坑,避免再踩雷
一.


我们先来看这个正则匹配,|左边匹配的内容是a,a‘\’,\ \表示\,?表示匹配0个或1个\,|右边匹配的内容是* a,再看要匹配的字符串,也就是逗号右边的内容,按照短优先的原则,我们先用a匹配了a,所以[]的第一个字符是a,然后a\ \表示的是a ‘\’,所以第二个字符是a\ ‘\’,后面是我们要先匹配 * 前面的a,所以第三个是a,然后第四个是要匹配的 * a.
二.
这个正则和上一个正则的区别是|右边是a*,所以这次用来匹配的字符是a,a ‘\’,a*,那么我们首先要注意的是短优先原则,所以[]第一个字符依然是a,第二个字符还是a\ \用来匹配a ‘\’,第三个我们要注意的是短优先,我们要匹配的是 * 号前面的a,而不是a*,匹配完第三个字符之后,逗号右边还剩下 * a,由于用来匹配的字符没有 * a,只有a和a*,所以最后一个字符就是a.
三.
最坑的来了,注意这里的问号一定不要打成大写的问号,只有小写的问号前面匹配的才是0个或1个\,大写的没有这个功能。
四注意:
有的斜杠没显示出来,所以带了引号,引号可以忽略掉,只是为了显示这个字符

1赞