여러 구분 기호로 문자열 분할
텍스트를 의미 있는 단위로 나누는 작업을 수행할 때 개발자는 문자열을 단어로 구분해야 하는 경우가 종종 있습니다. 단일 구분 기호에는 기존 방법으로 충분하지만 여러 구분 기호가 포함된 경우 어떤 옵션을 사용할 수 있습니까?
이 문제를 해결하려면 문자열 분할에 여러 구분 기호를 사용하는 기술을 구현할 수 있습니다. 해결책을 자세히 살펴보겠습니다.
C에서 문자열 스트림을 사용하여 단일 구분 기호가 있는 문자열을 구문 분석하는 구문은 다음과 같습니다.
std::stringstream stringStream(inputString); std::string word; while(std::getline(stringStream, word, delimiter)) { wordVector.push_back(word); }
여러 구분 기호를 수용하려면 먼저 다음을 읽어야 합니다. 전체 라인을 버퍼에 넣습니다. 그런 다음 라인을 반복하여 지정된 구분 기호가 나타나는 위치를 식별합니다. 현재 구분 기호 위치에서 이전 위치를 빼면 단어를 나타내는 하위 문자열을 얻어 단어 벡터에 추가합니다.
예를 들어 공백, 아포스트로피, 세미콜론을 구분 기호로 선택하면 다음 코드는 작업을 수행합니다.
std::stringstream stringStream(inputString); std::string line; while(std::getline(stringStream, line)) { std::size_t prev = 0, pos; while ((pos = line.find_first_of(" ';", prev)) != std::string::npos) { if (pos > prev) wordVector.push_back(line.substr(prev, pos-prev)); prev = pos+1; } if (prev < line.length()) wordVector.push_back(line.substr(prev, std::string::npos)); }
위 내용은 C에서 여러 구분 기호를 사용하여 문자열을 어떻게 분할할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!