백엔드 개발 파이썬 튜토리얼 Python의 문자열 처리 기술 공유

Python의 문자열 처리 기술 공유

Feb 22, 2017 pm 05:07 PM

这篇文章给大家分享了Python中字符串的处理技巧,包括拆分含有多种分隔符的字符串、判断字符串a是否以字符串b开头或结尾、调整字符串中文本的格式已经将多个小字符串拼接成一个大的字符串等,感兴趣的朋友们可以通过阅读下文来学习。

一、如何拆分含有多种分隔符的字符串?

实际案例

我们要把某个字符串依据分隔符号拆分不同的字符段,该字符串包含多种不同的分隔符,例如:

s = 'asd;aad|dasd|dasd,sdasd|asd,,Adas|sdasd;Asdasd,d|asd'
로그인 후 복사

其中<,>,<;>,<|>,<\t>都是分隔符,如何处理?

解决方案

连续使用split()方法,每次处理一种分隔符

# 使用Python2 def mySplit(s,ds): res = [s] for d in ds: t = [] map(lambda x: t.extend(x.split(d)), res) res = t return [x for x in res if x] s = &#39;asd;aad|dasd|dasd,sdasd|asd,,Adas|sdasd;Asdasd,d|asd&#39; result = mySplit(s, ';,|\t') print(result)
로그인 후 복사

C:\Users\Administrator>C:\Python\Python27\python.exe E:\python-intensive-training\s2.py [&#39;asd&#39;, &#39;aad&#39;, &#39;dasd&#39;, &#39;dasd&#39;, &#39;sdasd&#39;, &#39;asd&#39;, &#39;Adas&#39;, &#39;sdasd&#39;, &#39;Asdasd&#39;, &#39;d&#39;, &#39;asd&#39;]
로그인 후 복사

使用正则表达式的re.split()方法,一次性拆分字符串

>>> import re >>> re.split(&#39;[,;\t|]+&#39;,&#39;asd;aad|dasd|dasd,sdasd|asd,,Adas|sdasd;Asdasd,d|asd&#39;) [&#39;asd&#39;, &#39;aad&#39;, &#39;dasd&#39;, &#39;dasd&#39;, &#39;sdasd&#39;, &#39;asd&#39;, &#39;Adas&#39;, &#39;sdasd&#39;, &#39;Asdasd&#39;, &#39;d&#39;, &#39;asd&#39;]
로그인 후 복사

二、如何判断字符串a是否以字符串b开头或结尾?

实际案例

如某目录有如下文件:

quicksort.c graph.py heap.java install.sh stack.cpp ......
로그인 후 복사

现在需要给.sh.py结尾的文件夹上可执行权限

解决方案

使用字符串的startswith()endswith()方法

>>> import os, stat >>> os.listdir(&#39;./&#39;) [&#39;heap.java&#39;, &#39;quicksort.c&#39;, &#39;stack.cpp&#39;, &#39;install.sh&#39;, &#39;graph.py&#39;] >>> [name for name in os.listdir(&#39;./&#39;) if name.endswith((&#39;.sh&#39;,&#39;.py&#39;))] [&#39;install.sh&#39;, &#39;graph.py&#39;] >>> os.chmod(&#39;install.sh&#39;, os.stat(&#39;install.sh&#39;).st_mode | stat.S_IXUSR)
로그인 후 복사

[root@iZ28i253je0Z t]# ls -l install.sh -rwxr--r-- 1 root root 0 Sep 15 18:13 install.sh
로그인 후 복사

三、如何调整字符串中文本的格式?

实际案例

某软件的日志文件,其中日期格式为yyy-mm-dd:

2016-09-15 18:27:26 statu unpacked python3-pip:all 2016-09-15 19:27:26 statu half-configured python3-pip:all 2016-09-15 20:27:26 statu installd python3-pip:all 2016-09-15 21:27:26 configure asdasdasdas:all python3-pip:all
로그인 후 복사

需要把其中日期改为美国日期的格式mm/dd/yyy, 2016-09-15 --> 09/15/2016,要如何处理?

解决方案

使用正则表达式re.sub()方法做字符串替换

利用正则表达式的捕获组,捕获每个部分内容,在替换字符串中各个捕获组的顺序。

>>> log = &#39;2016-09-15 18:27:26 statu unpacked python3-pip:all&#39; >>> import re # 按顺序 >>> re.sub(&#39;(\d{4})-(\d{2})-(\d{2})&#39;, r&#39;\2/\3/\1&#39; , log) &#39;09/15/2016 18:27:26 statu unpacked python3-pip:all&#39; # 使用正则表达式的分组 >>> re.sub(&#39;(?P<year>\d{4})-(?P<month>\d{2})-(?P<day>\d{2})&#39;, r&#39;\g<month>/\g<day>/\g<year>&#39; , log) &#39;09/15/2016 18:27:26 statu unpacked python3-pip:all&#39;
로그인 후 복사

四、如何将多个小字符串拼接成一个大的字符串?

实际案例

在设计某网络程序时,我们自定义了一个基于UDP的网络协议,按照固定次序向服务器传递一系列参数:

hwDetect: "<0112>" gxDepthBits: "<32>" gxResolution: "<1024x768>" gxRefresh: "<60>" fullAlpha: "<1>" lodDist: "<100.0>" DistCull: "<500.0>"
로그인 후 복사

在程序中我们将各个参数按次序收集到列表中:

["<0112>","<32>","<1024x768>","<60>","<1>","<100.0>","<500.0>"]
로그인 후 복사

最终我们要把各个参数拼接成一个数据包进行发送:

"<0112><32><1024x768><60><1><100.0><500.0>"
로그인 후 복사

解决方案

迭代列表,连续使用'+'操作依次拼接每一个字符串

>>> for n in ["<0112>","<32>","<1024x768>","<60>","<1>","<100.0>","<500.0>"]: ... result += n ... >>> result '<0112><32><1024x768><60><1><100.0><500.0>'
로그인 후 복사

使用str.join()方法,更加快速的拼接列表中所有字符串

>>> result = ''.join(["<0112>","<32>","<1024x768>","<60>","<1>","<100.0>","<500.0>"]) >>> result '<0112><32><1024x768><60><1><100.0><500.0>'
로그인 후 복사

如果列表中有数字,可以使用生成器进行转换:

>>> hello = [222,&#39;sd&#39;,232,&#39;2e&#39;,0.2] >>> &#39;&#39;.join(str(x) for x in hello) &#39;222sd2322e0.2&#39;
로그인 후 복사

五、如何对字符串进行左, 右, 居中对齐?

实际案例

某个字典中存储了一系列属性值:

{ &#39;ip&#39;:&#39;127.0.0.1&#39;, &#39;blog&#39;: &#39;www.anshengme.com&#39;, &#39;title&#39;: &#39;Hello world&#39;, &#39;port&#39;: &#39;80&#39; }
로그인 후 복사

在程序中,我们想以以下格式将其内容输出,如何处理?

ip : 127.0.0.1 blog : www.anshengme.com title : Hello world port : 80
로그인 후 복사

解决方案

使用字符串的str.ljust() , str.rjust,str.cente()进行左右居中对齐

>>> info = {&#39;ip&#39;:&#39;127.0.0.1&#39;,&#39;blog&#39;: &#39;www.anshengme.com&#39;,&#39;title&#39;: &#39;Hello world&#39;,&#39;port&#39;: &#39;80&#39;} # 获取字典中的keys最大长度 >>> max(map(len, info.keys())) 5 >>> w = max(map(len, info.keys())) >>> for k in info: ... print(k.ljust(w), &#39;:&#39;,info[k]) ... # 获取到的结果 port : 80 blog : www.anshengme.com ip : 127.0.0.1 title : Hello world
로그인 후 복사

使用format()方法,传递类似'<20','>20','^20'参数完成同样任务

>>> for k in info: ... print(format(k,&#39;^&#39;+str(w)), &#39;:&#39;,info[k]) ... port : 80 blog : www.anshengme.com ip : 127.0.0.1 title : Hello world
로그인 후 복사

六、如何去掉字符串中不需要的字符?

实际案例

过滤掉用户输入卡后多余的空白字符: anshengm.com@gmail.com

过滤某windows下编辑文本中的'\r': hello word\r\n

去掉文本中的unicode组合符号(音调): ‘ní hǎo, chī fàn'

解决方案

字符串strip() , lstrip(),rstrip()方法去掉字符串两端字符

>>> email = &#39; anshengm.com@gmail.com &#39; >>> email.strip() &#39;anshengm.com@gmail.com&#39; >>> email.lstrip() &#39;anshengm.com@gmail.com &#39; >>> email.rstrip() &#39; anshengm.com@gmail.com&#39; >>>
로그인 후 복사

删除某个固定位置的字符,可以使用切片+拼接的方法

>>> s[:3] + s[4:] &#39;abc123&#39;
로그인 후 복사

字符串的replace()方法或正则表达式re.sub()删除任意位置字符

>>> s = &#39;\tabc\t123\txyz&#39; >>> s.replace(&#39;\t&#39;, &#39;&#39;) &#39;abc123xyz&#39;
로그인 후 복사

使用re.sub()删除多个

>>> import re >>> re.sub(&#39;[\t\r]&#39;,&#39;&#39;, string) &#39;abc123xyzopq&#39;
로그인 후 복사

字符串translate()方法,可以同时删除多种不同字符

>>> import string >>> s = &#39;abc123xyz&#39; >>> s.translate(string.maketrans(&#39;abcxyz&#39;,&#39;xyzabc&#39;)) &#39;xyz123abc&#39;
로그인 후 복사

>>> s = &#39;\rasd\t23\bAds&#39; >>> s.translate(None, &#39;\r\t\b&#39;) &#39;asd23Ads&#39;
로그인 후 복사

# python2.7 >>> i = u&#39;ní hǎo, chī fàn&#39; >>> i u&#39;ni\u0301 ha\u030co, chi\u0304 fa\u0300n&#39; >>> i.translate(dict.fromkeys([0x0301, 0x030c, 0x0304, 0x0300])) u&#39;ni hao, chi fan&#39;
로그인 후 복사

总结

以上就是为大家整理的Python中字符串的处理技巧,文中通过案例、解决方案以及实例来演示如何解决,对大家学习或者使用python具有一定的参考借鉴价值。有需要的可以参考借鉴。

更多Python中字符串的处理技巧分享相关文章请关注PHP中文网!


본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Linux 터미널에서 Python 버전을 볼 때 발생하는 권한 문제를 해결하는 방법은 무엇입니까? Linux 터미널에서 Python 버전을 볼 때 발생하는 권한 문제를 해결하는 방법은 무엇입니까? Apr 01, 2025 pm 05:09 PM

Linux 터미널에서 Python 버전을 보려고 할 때 Linux 터미널에서 Python 버전을 볼 때 권한 문제에 대한 솔루션 ... Python을 입력하십시오 ...

한 데이터 프레임의 전체 열을 Python의 다른 구조를 가진 다른 데이터 프레임에 효율적으로 복사하는 방법은 무엇입니까? 한 데이터 프레임의 전체 열을 Python의 다른 구조를 가진 다른 데이터 프레임에 효율적으로 복사하는 방법은 무엇입니까? Apr 01, 2025 pm 11:15 PM

Python의 Pandas 라이브러리를 사용할 때는 구조가 다른 두 데이터 프레임 사이에서 전체 열을 복사하는 방법이 일반적인 문제입니다. 두 개의 dats가 있다고 가정 해

10 시간 이내에 프로젝트 및 문제 중심 방법에서 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법? 10 시간 이내에 프로젝트 및 문제 중심 방법에서 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법? Apr 02, 2025 am 07:18 AM

10 시간 이내에 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법은 무엇입니까? 컴퓨터 초보자에게 프로그래밍 지식을 가르치는 데 10 시간 밖에 걸리지 않는다면 무엇을 가르치기로 선택 하시겠습니까?

문자열을 통해 객체를 동적으로 생성하고 방법을 파이썬으로 호출하는 방법은 무엇입니까? 문자열을 통해 객체를 동적으로 생성하고 방법을 파이썬으로 호출하는 방법은 무엇입니까? Apr 01, 2025 pm 11:18 PM

파이썬에서 문자열을 통해 객체를 동적으로 생성하고 메소드를 호출하는 방법은 무엇입니까? 특히 구성 또는 실행 해야하는 경우 일반적인 프로그래밍 요구 사항입니다.

Uvicorn은 Serving_forever ()없이 HTTP 요청을 어떻게 지속적으로 듣습니까? Uvicorn은 Serving_forever ()없이 HTTP 요청을 어떻게 지속적으로 듣습니까? Apr 01, 2025 pm 10:51 PM

Uvicorn은 HTTP 요청을 어떻게 지속적으로 듣습니까? Uvicorn은 ASGI를 기반으로 한 가벼운 웹 서버입니다. 핵심 기능 중 하나는 HTTP 요청을 듣고 진행하는 것입니다 ...

인기있는 파이썬 라이브러리와 그 용도는 무엇입니까? 인기있는 파이썬 라이브러리와 그 용도는 무엇입니까? Mar 21, 2025 pm 06:46 PM

이 기사는 Numpy, Pandas, Matplotlib, Scikit-Learn, Tensorflow, Django, Flask 및 요청과 같은 인기있는 Python 라이브러리에 대해 설명하고 과학 컴퓨팅, 데이터 분석, 시각화, 기계 학습, 웹 개발 및 H에서의 사용에 대해 자세히 설명합니다.

중간 독서를 위해 Fiddler를 사용할 때 브라우저에서 감지되는 것을 피하는 방법은 무엇입니까? 중간 독서를 위해 Fiddler를 사용할 때 브라우저에서 감지되는 것을 피하는 방법은 무엇입니까? Apr 02, 2025 am 07:15 AM

Fiddlerevery Where를 사용할 때 Man-in-the-Middle Reading에 Fiddlereverywhere를 사용할 때 감지되는 방법 ...

See all articles