원래 단어 재작성: 원래 버그로 간주되었던 것이 실제로는 Protobuf 설계의 기능이라는 예상치 못한 발견이 있었습니다.-파이썬 튜토리얼-php.cn

protobuf 소개" >protobuf 소개

어떻게 알게 됐나요? " >어떻게 알게 됐나요?

어떻게 해결하나요? " >어떻게 해결하나요?

결론" >결론

집

백엔드 개발

파이썬 튜토리얼

원래 단어 재작성: 원래 버그로 간주되었던 것이 실제로는 Protobuf 설계의 기능이라는 예상치 못한 발견이 있었습니다.

PHPz

May 09, 2023 pm 04:22 PM

분할 protobuf feature

안녕하세요 여러분, 저는 정말 대단해요.

최근 우리 프로젝트에서는 데이터 저장을 위한 캐리어로 protobuf 형식을 사용합니다. 실수로 큰 구멍을 묻었는데 그것을 발견하는 데 오랜 시간이 걸렸습니다.

protobuf 소개

protobuf의 전체 이름은 Protocal 버퍼입니다. 이는 Google에서 개발했으며 데이터 직렬화를 위한 교차 언어, 교차 플랫폼 및 확장 가능한 메커니즘입니다. XML과 비슷하지만 더 작고, 더 빠르고, 더 간단합니다. 데이터를 어떻게 구성할지 한 번만 정의하면 생성 도구를 사용하여 일부 직렬화 및 역직렬화 작업이 포함된 소스 코드를 생성할 수 있습니다. 구조화된 데이터는 다양한 데이터 스트림에서 다양한 프로그래밍 언어를 사용하여 쉽게 쓰고 읽을 수 있습니다.

proto2 버전은 Java, Python, Objective-C 및 C++에서 코드 생성을 지원합니다. 새로운 proto3 언어 버전에서는 Kotlin, Dart, Go, Ruby, PHP, C# 및 더 많은 언어를 사용할 수도 있습니다.

어떻게 알게 됐나요?

새 프로젝트에서는 protobuf 형식을 사용하여 실행되는 프로젝트의 데이터를 저장합니다. 이러한 방식으로 디버깅 과정에서 당사는 현장에 기록된 데이터를 기반으로 로컬 디버깅을 수행할 수 있습니다.

message ImageData {
// ms
int64 timestamp = 1;
int32 id = 2;
Data mat = 3;
}

message PointCloud {
// ms
int64 timestamp = 1;
int32 id = 2;
PointData pointcloud = 3;
}

message State {
// ms
int64 timestamp = 1;
string direction = 2;
}

message Sensor {
repeated PointCloud point_data = 1;
repeated ImageData image_data = 2;
repeated State vehicle_data = 3;
}

로그인 후 복사

저희는 이러한 데이터 세트를 정의한 다음 저장 시 센서의 세 가지 데이터 소스의 프레임 속도가 다르기 때문에 저장할 때 단일 센서에는 실제로 한 세트의 데이터만 포함되고 다른 두 유형의 데이터가 포함됩니다. 포함되지 않습니다.

싱글팩만 녹음했을 때는 문제가 없었어요. 단일 패킷을 오랫동안 기록할 수 없다고 느낄 때까지 패킷을 분할하는 솔루션을 찾아야 합니다.

당시에는 매우 간단할 것이라고 생각하여 패키지가 500M에 도달하면 후속 데이터를 새 패키지에 저장하도록 설정했습니다. 아주 원활하게 작성을 마치고 데이터 기록을 위해 현장에 올렸습니다. 잠시 녹음한 후 패키지를 다시 가져와 새 프로그램 테스트를 시뮬레이션했습니다. 일부 패키지의 데이터를 구문 분석하는 데 문제가 있는 것으로 나타났습니다. 프로그램이 실행 도중에 멈추게 됩니다. 많은 테스트 후에 일부 패키지에 이 문제가 있는 것으로 나타났습니다.

처음에 의심했던 것은 파일 크기를 판단하는 방법이 잘못되어 하도급에 영향을 미쳤다는 것입니다. 파일 크기를 판단하면 파일이 열리기 때문입니다. 그러나 파일을 열지 못하는 다른 여러 가지 방법을 판단한 후 분할이 수행되었습니다. 기록된 패키지 중 일부에 여전히 문제가 발생했습니다.

그때 나는 protobuf에 데이터 저장을 위한 몇 가지 특별한 요구 사항이 있다고 의심했습니다. 나중에 일부 기사를 읽고 protobuf가 여러 데이터 세트를 하나의 파일에 저장하려면 식별자가 필요하다는 것을 알게 되었습니다. 그렇지 않으면 파일에서 다시 구문 분석할 때 protobuf는 단일 데이터의 중지 문자가 어디에 있는지 알지 못해 데이터 구문 분석 오류가 발생합니다.

여기에 이런 구덩이가 나타납니다. 우리는 구분 작업을 수행하지 않고 일련의 데이터를 단일 패키지에 저장합니다. protobuf가 구문 분석할 때 파일의 모든 콘텐츠가 단일 센서로 구문 분석됩니다. 센서에는 모든 데이터가 포함되어 있으며 protobuf는 저장된 모든 데이터를 적극적으로 병합합니다.

이제 이전에 싱글 패킷을 녹음했을 때 데이터가 모두 정확했다는 것을 발견했습니다. 그것은 정말 행운이었습니다. protobuf가 성공적으로 구문 분석되었습니다.

어떻게 해결하나요?

이제 protobuf가 이런 방식으로 동작한다는 것을 알았으니, protobuf를 어떻게 나누는지만 알면 됩니다. 이 방법은 우리처럼 사용하는 사람이 너무 적기 때문에 찾기가 정말 어렵습니다. 중국어 검색에서는 이 콘텐츠를 전혀 찾을 수 없습니다. 아마도 모든 사람이 protobuf를 사용하여 데이터를 저장하지 않을 수도 있습니다.

결국 stackoverflow의 몇 가지 답변을 통해 답을 찾았습니다. 답변에서 이 솔루션은 protobuf 3.3에서만 공식적으로 병합되었다는 것을 알게 되었습니다. 이 기능은 정말 거의 사용하지 않는 것 같습니다.

bool SerializeDelimitedToOstream(const MessageLite& message,
 std::ostream* output);
bool ParseDelimitedFromZeroCopyStream(
MessageLite* message, io::ZeroCopyInputStream* input, bool* clean_eof);

로그인 후 복사

이 두 가지 방법을 통해 데이터 스트림에 따라 파일을 하나씩 저장하고 읽을 수 있습니다. 더 이상 데이터 병합 및 읽기에 대해 걱정할 필요가 없습니다.

물론 이렇게 저장된 데이터는 원래의 파싱 방식으로는 파싱할 수 없으며, 저장 형식도 완전히 바뀌었습니다. 이 방법은 먼저 이진 데이터의 크기를 저장한 다음 이진 데이터를 저장합니다.

결론

고민 끝에 드디어 이 칸막이 피트를 해결했습니다. 사용 시나리오는 상대적으로 틈새적일 수 있으므로 전혀 찾을 수 없는 많은 정보가 발생할 수 있습니다. 소스 코드를 직접 살펴보면서 이러한 문제를 발견했습니다. C++의 소스 코드는 읽기가 정말 어렵습니다. 템플릿 메소드와 템플릿 클래스가 많아 일부 세부 사항을 놓치기 쉽습니다. 마지막으로 이를 완전히 확인하기 위해 C# 코드를 살펴보았습니다.

위 내용은 원래 단어 재작성: 원래 버그로 간주되었던 것이 실제로는 Protobuf 설계의 기능이라는 예상치 못한 발견이 있었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7455

Cakephp 튜토리얼

1375

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

MobileSAM: 모바일 장치를 위한 고성능, 경량 이미지 분할 모델 Jan 05, 2024 pm 02:50 PM

1. 서론 모바일 기기의 대중화와 컴퓨팅 성능의 향상으로 이미지 분할 기술이 연구의 핫스팟이 되었습니다. MobileSAM(MobileSegmentAnythingModel)은 모바일 장치에 최적화된 이미지 분할 모델로, 제한된 리소스를 사용하는 모바일 장치에서 효율적으로 실행되도록 고품질 분할 결과를 유지하면서 계산 복잡성과 메모리 사용량을 줄이는 것을 목표로 합니다. 이 기사에서는 MobileSAM의 원리, 장점 및 적용 시나리오를 자세히 소개합니다. 2. MobileSAM 모델의 디자인 아이디어 MobileSAM 모델의 디자인 아이디어는 주로 다음과 같은 측면을 포함합니다: 경량 모델: 모바일 장치의 리소스 제한에 적응하기 위해 MobileSAM 모델은 경량 모델을 채택합니다.

Python에서 이미지 의미 분할 기술을 사용하는 방법은 무엇입니까? Jun 06, 2023 am 08:03 AM

인공지능 기술이 지속적으로 발전하면서 이미지 의미분할 기술은 이미지 분석 분야에서 인기 있는 연구 방향이 되었다. 이미지 의미론적 분할에서는 이미지의 다양한 영역을 분할하고 각 영역을 분류하여 이미지에 대한 포괄적인 이해를 얻습니다. Python은 잘 알려진 프로그래밍 언어입니다. 강력한 데이터 분석 및 데이터 시각화 기능으로 인해 인공 지능 기술 연구 분야에서 가장 먼저 선택됩니다. 이 기사에서는 Python에서 이미지 의미 분할 기술을 사용하는 방법을 소개합니다. 1. 전제 지식이 심화되고 있습니다.

Python 튜토리얼: Python을 사용하여 대용량 파일을 분할하고 병합하는 방법은 무엇입니까? Apr 22, 2023 am 11:43 AM

가끔 대용량 파일을 다른 사람에게 보내야 할 때가 있는데 이메일 첨부 파일 크기 제한 등 전송 채널의 한계나 네트워크 상태가 좋지 않아 대용량 파일을 작은 크기로 나눠서 보내야 하는 경우가 있습니다. 파일을 여러 번 전송한 다음 이 작은 파일을 병합하세요. 오늘은 Python을 사용하여 대용량 파일을 분할하고 병합하는 방법을 공유하겠습니다. 아이디어 및 구현 텍스트 파일인 경우 줄 수에 따라 구분할 수 있습니다. 텍스트 파일이든 바이너리 파일이든 지정된 크기에 따라 분할될 수 있습니다. Python의 파일 읽기 및 쓰기 기능을 사용하면 파일을 분할 및 병합하고 각 파일의 크기를 설정한 다음 지정된 크기의 바이트를 읽어 새 파일에 쓸 수 있습니다. 바이트는 순서대로 파일에 기록됩니다.

Golang 및 FFmpeg: 오디오 합성 및 분할 구현 방법 Sep 27, 2023 pm 10:52 PM

Golang 및 FFmpeg: 오디오 합성 및 분할을 구현하는 방법, 구체적인 코드 예제가 필요합니다. 요약: 이 기사에서는 Golang 및 FFmpeg 라이브러리를 사용하여 오디오 합성 및 분할을 구현하는 방법을 소개합니다. 독자의 이해를 돕기 위해 몇 가지 구체적인 코드 예제를 사용하겠습니다. 소개: 오디오 처리 기술의 지속적인 개발로 인해 오디오 합성 및 분할은 일상 생활과 업무에서 일반적인 기능 요구 사항이 되었습니다. 빠르고 효율적이며 작성 및 유지 관리가 쉬운 프로그래밍 언어인 Golang은 FFmpeg와 결합되어 있습니다.

win10 화면 녹화 파일 크기를 줄이는 팁 Jan 04, 2024 pm 12:05 PM

많은 친구들이 업무를 위해 화면을 녹화하거나 파일을 전송해야 하는데 때로는 파일이 너무 커서 문제가 많이 발생하는 경우가 있습니다. 다음은 너무 큰 파일의 문제에 대한 해결 방법을 살펴보겠습니다. win10 화면 녹화 파일이 너무 큰 경우 수행할 작업: 1. 소프트웨어 Format Factory를 다운로드하여 파일을 압축합니다. 다운로드 주소 >> 2. 메인 페이지에 들어가서 "Video-MP4" 옵션을 클릭하세요. 3. 변환 형식 페이지에서 "파일 추가"를 클릭하고 압축할 MP4 파일을 선택하세요. 4. 페이지에서 "출력 구성"을 클릭하여 출력 품질에 따라 파일을 압축합니다. 5. 드롭다운 구성 목록에서 "낮은 품질 및 크기"를 선택하고 "확인"을 클릭합니다. 6. "확인"을 클릭하면 비디오 파일 가져오기가 완료됩니다. 7. "시작"을 클릭하여 변환을 시작하세요. 8. 완료 후 다음을 수행할 수 있습니다.

원래 단어 재작성: 원래 버그로 간주되었던 것이 실제로는 Protobuf 설계의 기능이라는 예상치 못한 발견이 있었습니다. May 09, 2023 pm 04:22 PM

안녕하세요 여러분, 저는 정말 놀랍습니다. 최근 우리 프로젝트에서는 데이터 저장을 위한 캐리어로 protobuf 형식을 사용했습니다. 실수로 큰 구멍을 묻었는데 그것을 발견하는 데 오랜 시간이 걸렸습니다. protobuf 소개 protobuf의 전체 이름은 Protocalbuffers입니다. Google에서 개발했으며 데이터 직렬화를 위한 교차 언어, 교차 플랫폼 및 확장 가능한 메커니즘입니다. XML과 비슷하지만 더 작고, 더 빠르고, 더 간단합니다. 데이터를 어떻게 구성할지 한 번만 정의하면 생성 도구를 사용하여 일부 직렬화 및 역직렬화 작업이 포함된 소스 코드를 생성할 수 있습니다. 다양한 데이터 스트림과 다양한 프로그래밍 언어를 사용하여 쉽게 작성할 수 있습니다.

PHP의Explode() 함수를 사용하여 문자열을 배열로 분할 Jun 27, 2023 am 10:18 AM

PHP 개발에서는 데이터 처리를 더 편리하게 하기 위해 문자열을 여러 하위 문자열로 분할해야 하는 경우가 많습니다. 이때 PHP는 이 목표를 달성하는 데 도움이 되는explore() 함수를 제공합니다. 폭발() 함수의 기본 구문은 다음과 같습니다:explod(string$delimiter,string$string[,int$limit=PHP_MAXPATHLEN])where, $delimiter

영상 분할의 마지막! Zhejiang University는 최근 SAM-Track을 출시했습니다: 한 번의 클릭으로 범용 지능형 비디오 분할 May 23, 2023 pm 02:07 PM

최근 Zhejiang University의 ReLER 연구소에서는 SAM과 비디오 분할을 깊이 결합하여 SAM-Track(Segment-and-TrackAnything)을 출시했습니다. SAM-Track은 SAM에 비디오 대상을 추적하는 기능을 제공하고 다양한 상호 작용 방식(포인트, 브러시, 텍스트)을 지원합니다. 이를 기반으로 SAM-Track은 여러 기존 비디오 분할 작업을 통합하고 모든 비디오의 모든 대상에 대한 원클릭 분할 추적을 달성하며 기존 비디오 분할을 범용 비디오 분할로 추정합니다. SAM-Track은 탁월한 성능을 갖추고 있으며, 단 하나의 카드로 복잡한 시나리오에서 수백 개의 대상을 고품질로 안정적으로 추적할 수 있습니다. 프로젝트 주소: https://github.co

See all articles