Pandas에서는 문자열에 목록에 있는 하위 문자열이 포함되어 있는지 확인해야 합니다. 이 문제를 해결하기 위해 df.isin()과 df[col].str.contains()의 조합을 사용할 수 있습니다. 그러나 이 접근 방식은 번거로운 것으로 간주됩니다.
보다 세련된 접근 방식에는 | 여러 하위 문자열을 동시에 일치시키는 정규식의 (파이프) 문자입니다. 이 기술에는 '|'.join()을 사용하여 목록의 하위 문자열을 연결하는 작업이 수반됩니다.
searchfor = ['og', 'at'] s[s.str.contains('|'.join(searchfor))]
이 접근 방식은 지정된 하위 문자열과 일치하는 문자열을 효율적으로 식별하여 세련된 결과를 가져옵니다.
0 cat 1 hat 2 dog 3 fog dtype: object
$와 같은 특수 문자가 포함된 하위 문자열을 다룰 때는 주의하는 것이 중요합니다. 및 ^는 정규식에서 특정 의미를 갖습니다. 리터럴 일치를 보장하려면 re.escape()를 활용하여 다음 문자를 이스케이프 처리하세요.
import re matches = ['$money', 'x^y'] safe_matches = [re.escape(m) for m in matches] s[s.str.contains('|'.join(safe_matches))]
위 내용은 Pandas에서 여러 하위 문자열 포함을 효율적으로 확인하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!