> 백엔드 개발 > C++ > C에서 문자열 토큰을 효율적으로 구문 분석하려면 어떻게 해야 합니까?

C에서 문자열 토큰을 효율적으로 구문 분석하려면 어떻게 해야 합니까?

Barbara Streisand
풀어 주다: 2024-11-14 11:28:02
원래의
1036명이 탐색했습니다.

How Can I Efficiently Parse String Tokens in C  ?

C에서 문자열 토큰을 효율적으로 구문 분석

문자열을 특정 구분 기호로 구분된 토큰으로 효과적으로 분할하기 위해 C는 강력한 메커니즘을 제공합니다. 예를 들어 문자열이 세미콜론(;)으로 구분된 단어로 구성된 경우 다음 전략을 사용할 수 있습니다.

std::getline() 사용

std ::getline() 함수는 간단하면서도 다양한 접근 방식을 제공합니다. 모든 유형의 구분 기호를 처리할 수 있으므로 라인과 토큰 추출 모두에 적합합니다. 예는 다음과 같습니다.

#include <sstream>
#include <iostream>
#include <vector>

using namespace std;

int main() {
    vector<string> strings;
    istringstream f("denmark;sweden;india;us");
    string s;    
    while (getline(f, s, ';')) {
        cout << s << endl;
        strings.push_back(s);
    }
}
로그인 후 복사

이 코드는 문자열과 벡터를 초기화합니다. 그런 다음 getline()을 사용하여 문자열을 반복하고 각 세미콜론에서 분할합니다. 각 토큰은 인쇄되어 벡터에 추가됩니다.

사용자 정의 분할 함수

또는 토큰화를 처리하는 사용자 정의 함수를 생성할 수도 있습니다.

#include <string>
#include <vector>

using namespace std;

vector<string> split(const string& str, char delimiter) {
    vector<string> tokens;
    string token;
    istringstream iss(str);
    while (getline(iss, token, delimiter)) {
        tokens.push_back(token);
    }
    return tokens;
}
로그인 후 복사

이 함수는 문자열과 구분 기호를 입력으로 사용하고 토큰 벡터를 반환합니다. getline()과 유사하게 작동하지만 모든 구분 기호를 사용할 수 있는 유연성을 제공합니다.

추가 고려 사항

문자열 작업 시 보안 지침을 준수하는 것이 중요합니다. C 스타일 문자열 함수 및 Boost와 같은 오픈 소스 라이브러리는 보안에 영향을 미칠 수 있습니다. 따라서 std::getline()과 같은 표준 C 함수를 사용하거나 사용자 정의 분할 논리를 구현하는 것이 좋습니다.

위 내용은 C에서 문자열 토큰을 효율적으로 구문 분석하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿