> 백엔드 개발 > 파이썬 튜토리얼 > Pandas에서 여러 하위 문자열 포함을 효율적으로 확인하려면 어떻게 해야 합니까?

Pandas에서 여러 하위 문자열 포함을 효율적으로 확인하려면 어떻게 해야 합니까?

Patricia Arquette
풀어 주다: 2024-12-05 01:29:14
원래의
799명이 탐색했습니다.

How Can I Efficiently Check for Multiple Substring Inclusions in Pandas?

Pandas를 사용하여 문자열 하위 문자열 포함 테스트

Pandas에서는 문자열에 목록에 있는 하위 문자열이 포함되어 있는지 확인해야 합니다. 이 문제를 해결하기 위해 df.isin()과 df[col].str.contains()의 조합을 사용할 수 있습니다. 그러나 이 접근 방식은 번거로운 것으로 간주됩니다.

향상된 솔루션

보다 세련된 접근 방식에는 | 여러 하위 문자열을 동시에 일치시키는 정규식의 (파이프) 문자입니다. 이 기술에는 '|'.join()을 사용하여 목록의 하위 문자열을 연결하는 작업이 수반됩니다.

searchfor = ['og', 'at']
s[s.str.contains('|'.join(searchfor))]
로그인 후 복사

이 접근 방식은 지정된 하위 문자열과 일치하는 문자열을 효율적으로 식별하여 세련된 결과를 가져옵니다.

0    cat
1    hat
2    dog
3    fog
dtype: object
로그인 후 복사

특수 문자 처리

$와 같은 특수 문자가 포함된 하위 문자열을 다룰 때는 주의하는 것이 중요합니다. 및 ^는 정규식에서 특정 의미를 갖습니다. 리터럴 일치를 보장하려면 re.escape()를 활용하여 다음 문자를 이스케이프 처리하세요.

import re
matches = ['$money', 'x^y']
safe_matches = [re.escape(m) for m in matches]

s[s.str.contains('|'.join(safe_matches))]
로그인 후 복사

위 내용은 Pandas에서 여러 하위 문자열 포함을 효율적으로 확인하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿