Python의 문자열에서 이모티콘을 제거하는 방법은 무엇입니까?

Barbara Streisand
풀어 주다: 2024-10-26 11:35:29
원래의
242명이 탐색했습니다.

How to Remove Emojis from Strings in Python?

Python에서 Emojis 처리: 문자열에서 Emojis 제거

Python의 str.startswith() 함수는 "xf. " 그러나 Python의 문자열에서 이모티콘을 효과적으로 제거하는 대체 방법이 있습니다.

유니코드 문자열 및 re.UNICODE 플래그 사용

Python 2에서 이모티콘을 처리하려면 u'' 리터럴을 사용하여 유니코드 문자열을 만들어야 합니다. 또한 유니코드 지원을 활성화하려면 컴파일 중에 re.UNICODE 플래그를 전달하세요.

<code class="python">import re

emoji_pattern = re.compile(
   u"[\U0001F600-\U0001F64F]"  # emoticons
   u"|\U0001F300-\U0001F5FF]"  # symbols &amp; pictographs
   u"|\U0001F680-\U0001F6FF]"  # transport &amp; map symbols
   u"|\U0001F1E0-\U0001F1FF]"  # flags (iOS)", flags=re.UNICODE)

text = u'This dog \U0001F602'
print(text) # with emoji
print(emoji_pattern.sub(r'', text)) # without emoji</code>
로그인 후 복사

출력:

This dog ?
This dog
로그인 후 복사

컴파일된 정규식 사용

또 다른 접근 방식은 미리 컴파일된 정규식을 사용하는 것입니다.

<code class="python">emoji_patterns = [
   u"[\U0001F600-\U0001F64F]"  # emoticons
   u"|\U0001F300-\U0001F5FF]"  # symbols &amp; pictographs
   u"|\U0001F680-\U0001F6FF]"  # transport &amp; map symbols
   u"|\U0001F1E0-\U0001F1FF]"  # flags (iOS)]
emoji_pattern = re.compile(emoji_pat, flags=re.UNICODE)</code>
로그인 후 복사

이러한 패턴이 모든 이모티콘과 일치하지 않을 수도 있다는 점을 기억하세요. 더 포괄적인 목록을 보려면 유니코드 이모티콘 목록을 참조하세요.

위 내용은 Python의 문자열에서 이모티콘을 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿