프로그래밍을 시작한 이후에는 작업에 보다 실용적이고 직접적인 솔루션이 필요했기 때문에 구조적 및 절차적 패러다임을 주로 사용해 왔습니다. 데이터 추출 작업을 할 때 좀 더 체계적인 코드를 얻기 위해 새로운 패러다임으로 전환해야 했습니다.
스크래핑 작업 중에 처음에는 처리 방법을 알고 있었지만 갑자기 해당 데이터가 존재하지 않거나 캡처 중에 다른 유형으로 나타나는 특정 데이터를 캡처해야 하는 경우가 이러한 필요성의 예입니다. .
결과적으로 if 및 try and catch 블록을 추가하여 데이터가 int인지 문자열인지 확인해야 했습니다. 나중에 아무것도 캡처되지 않았음을 발견했습니다. None 등. 사전을 사용하여 다음과 같은 상황에서 흥미롭지 않은 "기본 데이터"를 저장하게 되었습니다.
data.get(values, 0)
글쎄요, 혼란스러운 오류 메시지가 더 이상 표시되지 않아야 했습니다.
이것이 Python이 역동적인 이유입니다. 변수는 작업 중인 유형에 대해 더 명확해질 때까지 원할 때마다 유형을 변경할 수 있습니다. 그런데 갑자기 많은 정보가 나타납니다. 이제는 IDE에서 제공하는 유형 힌트와 흥미로운 pydantic 라이브러리
를 통해 데이터 유효성 검사를 처리하는 방법에 대해 읽고 있습니다.이제 데이터 조작 및 새로운 패러다임과 같은 작업에서 유형을 명시적으로 선언하는 객체와 이러한 유형의 유효성을 검사할 수 있는 라이브러리를 가질 수 있습니다. 문제가 발생하면 더 잘 설명된 오류 정보를 보고 디버깅하기가 더 쉬울 것입니다.
여기 Pydantic 문서가 있습니다. 더 궁금한 사항은 언제나 상담을 받아보시는 것이 좋습니다.
기본적으로 우리가 이미 알고 있듯이 다음부터 시작합니다.
pip install pydantic
그런 다음 가정적으로 이러한 이메일이 포함된 소스에서 이메일을 캡처하려고 하며 대부분은 "xxxx@xxxx.com"과 같습니다. 그러나 때로는 "xxxx@" 또는 "xxxx"와 같은 형태로 나타날 수도 있습니다. 우리는 캡처해야 하는 이메일 형식에 대해 의심의 여지가 없으므로 Pydantic을 사용하여 이 이메일 문자열을 검증할 것입니다:
from pydantic import BaseModel, EmailStr class Consumer(BaseModel): email: EmailStr account_id: int consumer = Consumer(email="teste@teste", account_id=12345) print(consumer)
pip install pydantic[email]과 함께 설치된 선택적 종속성인 "email-validator"를 사용했다는 점에 주목하세요. 우리가 알고 있듯이 코드를 실행하면 오류는 잘못된 이메일 형식 "teste@teste"로 발생합니다:
Traceback (most recent call last): ... consumer = Consumer(email="teste@teste", account_id=12345) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ ...: 1 validation error for Consumer email value is not a valid email address: The part after the @-sign is not valid. It should have a period. [type=value_error, input_value='teste@teste', input_type=str]
선택적 종속성을 사용하여 데이터를 검증하는 것은 자체 검증을 생성하는 것과 마찬가지로 흥미롭고 Pydantic은 field_validator를 통해 이를 허용합니다. 따라서 우리는 account_id가 양수이고 0보다 커야 한다는 것을 알고 있습니다. 다르다면 Pydantic이 예외, 즉 값 오류가 있음을 경고하는 것이 흥미로울 것입니다. 그러면 코드는 다음과 같습니다.
from pydantic import BaseModel, EmailStr, field_validator class Consumer(BaseModel): email: EmailStr account_id: int @field_validator("account_id") def validate_account_id(cls, value): """Custom Field Validation""" if value <= 0: raise ValueError(f"account_id must be positive: {value}") return value consumer = Consumer(email="teste@teste.com", account_id=0) print(consumer)
$ python capture_emails.py Traceback (most recent call last): ... consumer = Consumer(email="teste@teste.com", account_id=0) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ ...: 1 validation error for Consumer account_id Value error, account_id must be positive: 0 [type=value_error, input_value=0, input_type=int] For further information visit https://errors.pydantic.dev/2.8/v/value_error
이제 올바른 값으로 코드를 실행해 보세요.
from pydantic import BaseModel, EmailStr, field_validator class Consumer(BaseModel): email: EmailStr account_id: int @field_validator("account_id") def validate_account_id(cls, value): """Custom Field Validation""" if value <= 0: raise ValueError(f"account_id must be positive: {value}") return value consumer = Consumer(email="teste@teste.com", account_id=12345) print(consumer)
$ python capture_emails.py email='teste@teste.com' account_id=12345
그렇죠?!
또한 좀 더 간단하고 Pydantic과 몇 가지 유사점이 있는 기본 "dataclasses" 모듈에 대한 내용도 읽었습니다. 그러나 검증이 필요한 더 복잡한 데이터 모델을 처리하는 데에는 Pydantic이 더 좋습니다. 데이터 클래스는 Python에 기본적으로 포함되어 있었지만 Pydantic은 적어도 아직은 포함되어 있지 않습니다.
위 내용은 Pydantic • 데이터 검증 및 삭제 처리의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!