예를 들어 정규식을 사용하여 shá의 병음을 일치시킵니다. ps: 앞서 말씀드린 내용이 명확하지 않을 수 있습니다. "예를 들어"라는 단어를 사용했는데, 이는 처리할 텍스트에 병음이 있다는 의미인데, 구체적인 병음이 무엇인지 찾아야 합니다. 처리할 텍스트에는 중국어 및 병음, 기호(,.: 등)가 포함되어 있으므로 re.search(u'shá',text) 단순 고정 문자열이 아닌 일반 문자열이어야 합니다. . .
그렇다면 사전의 병음 색인을 찾아서 모든 병음|을 함께 모아두시면 됩니다. 병음은 일반적인 규칙이나 다른 기계적 규칙에 따라 정의되지 않기 때문에 이렇게 될 수 있습니다. 아무것도 놓치지 않고, 너무 많지도 않고, 어쨌든 많지 않다면 이것이 당신이 할 수 있는 전부입니다.
으아악
일치 결과:
['ís', 'à', 'pìnyin', 'about', 'shá']
기본 병음이 대문자를 제외하고 모두 소문자이므로 첫 번째 Thēs는 일치하지 않습니다.
모든 합법 병음을 일치시키시겠습니까?
그렇다면 사전의 병음 색인을 찾아서 모든 병음
|
을 함께 모아두시면 됩니다. 병음은 일반적인 규칙이나 다른 기계적 규칙에 따라 정의되지 않기 때문에 이렇게 될 수 있습니다. 아무것도 놓치지 않고, 너무 많지도 않고, 어쨌든 많지 않다면 이것이 당신이 할 수 있는 전부입니다.으아아아