原话重写:一个意外的发现是,原本被视为 bug 的问题实际上是 Protobuf 设计中的一种特性
大家好,我是了不起。
最近我们在项目中,通过使用 protobuf 格式作为存储数据的一个载体。一个不小心就给自己埋了个大坑,还是过了好久才发现。
protobuf 简介
protobuf 全名叫 Protocal buffers. 它是由 Google 研发的,一种可跨语言、可跨平台、可扩展的序列化数据的机制。类似于 XML ,但是它更小、更快、更简单。你只需要定义一次你希望的数据如何被结构化,然后你可以使用它的生成工具,生成包含一些序列化和反序列化等操作的源代码。可以轻松地从各种数据流和使用各种编程语言写入和读取结构化的数据。
proto2版本支持在Java、Python、Objective-C和C 中生成代码。使用新的proto3语言版本,你还可以使用Kotlin、Dart、Go、Ruby、PHP和C#,还有更多的语言。
怎么发现的?
在我们的新项目中,我们通过使用 protobuf 格式来存储项目运行的数据。这样我们在调试过程中,可能根据现场录制的数据进行本地的调试。
message ImageData { // ms int64 timestamp = 1; int32 id = 2; Data mat = 3; } message PointCloud { // ms int64 timestamp = 1; int32 id = 2; PointData pointcloud = 3; } message State { // ms int64 timestamp = 1; string direction = 2; } message Sensor { repeated PointCloud point_data = 1; repeated ImageData image_data = 2; repeated State vehicle_data = 3; }
我们定义了这样一组数据, 然后存储的时候,因为Sensor 这3个数据源的帧率不一样,因此存储的时候,单个 Sensor 中其实只包含了一组数据,另外两个类型的数据并没有包含进去。
当我们只录制单个 pack 的时候,我们并没有遇到问题。直到我们觉得单个包,不能长时间录制,我们需要找一种解决方法来分割包 。
当时觉得这个一定是很简单的,我们就设定了一个包达到 500M 的时候,我们就让后面的数据存到新的包中。很顺利的写完,然后放到现场进行数据录制。录制一段时间之后,我们把包拿回来进行模拟测试我们的新程序。发现有些包的数据解析出来是有问题的。程序运行到一半会卡在那里不动。经过多次测试,发现是部分包有这个问题。
我们一开始怀疑的是,判断文件大小的方式不对,影响到了分包。因为判断文件大小的时候,会去打开文件。但是经过好几种其他的不打开文件的方式判断,从而进行分割。还是遇到了部分录制的包有问题。
这时我才怀疑到 protobuf 对存储数据会有一些特殊的要求。后来看了一些文章,了解到 protobuf 存储多组数据到一个文件需要有标志符。要不然后面从文件解析回来的时候,protobuf 因为不知道单个数据的停止符在哪里,导致数据解析出错。
到这里,这个坑出现了。我们存储了一系列的数据到单个包中,没有做任何分隔符的操作。protobuf在解析的时候,把文件中所有的内容都解析成了单个Sensor。Sensor 中包含里所有数据, protobuf 主动合并了所有存储的数据。
在这时,我才发现以前单包录制的时候,数据都是对的,那真的是我运气好。protobuf恰好解析成功了。
怎么解决呢?
既然知道 protobuf 会这么操作,那我们就只要知道 protobuf 怎么分割就行了。这个方法还真不好找,因为像我们这样使用的人太少了。中文搜索完全搜不到这一块的内容,可能大家都不会使用protobuf来存储数据吧,大家使用的方式应该都是多个服务中进行交互的场景吧。
最终通过stackoverflow上的一些回答找到了答案,从回答中得知,这个解决办法在 protobuf 3.3 的时候,才正式被合并进去。看起来这个功能真的很少用啊。
bool SerializeDelimitedToOstream(const MessageLite& message, std::ostream* output); bool ParseDelimitedFromZeroCopyStream( MessageLite* message, io::ZeroCopyInputStream* input, bool* clean_eof);
通过这一对方法,可以对文件进行按照数据流一个一个的存储读取。再也不用担心数据被合并读取。
当然通过这种方式存储的数据,不能被原来的解析方式所解析,存储的而进行格式完全变了。这种方式会先存储二进制数据的大小,再存储二进制数据。
结束语
经过一番折腾,终于搞定了这个分割的坑。使用场景可能比较小众,导致了很多资料根本找不到。靠自己看源码才发现这些问题。C 的源码真不好读,有很多的模板方法、模板类容易错过一些细节。最后还是看的C#的代码,才完全确认的。
以上是原话重写:一个意外的发现是,原本被视为 bug 的问题实际上是 Protobuf 设计中的一种特性的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

一、引言随着移动设备的普及和计算能力的提升,图像分割技术成为了研究的热点。MobileSAM(MobileSegmentAnythingModel)是一种针对移动设备优化的图像分割模型,旨在在保持高质量分割结果的同时,降低计算复杂度和内存占用,以便在资源有限的移动设备上高效运行。本文将详细介绍MobileSAM的原理、优势和应用场景。二、MobileSAM模型的设计思路MobileSAM模型的设计思路主要包括以下几个方面:轻量级模型:为了适应移动设备的资源限制,MobileSAM模型采用了轻量级

随着人工智能技术的不断发展,图像语义分割技术已经成为图像分析领域的热门研究方向。在图像语义分割中,我们将一张图像中的不同区域进行分割,并对每个区域进行分类,从而达到对这张图像的全面理解。Python是一种著名的编程语言,其强大的数据分析和数据可视化能力使其成为了人工智能技术研究领域的首选。本文将介绍如何在Python中使用图像语义分割技术。一、前置知识在深入

有时候,我们需要把一个大文件发送给别人,但是限于传输通道的限制,比如邮箱附件大小的限制,或者网络状况不太好,需要将大文件分割成小文件,分多次发送,接收端再对这些小文件进行合并。今天就来分享一下用Python分割合并大文件的方法。思路及实现如果是文本文件,可以按行数分割。无论是文本文件还是二进制文件,都可以按指定大小进行分割。使用Python的文件读写功能就可以实现文件的分割与合并,设置每个文件的大小,然后读取指定大小的字节就写入一个新文件,接收端依次读取小文件,把读取到的字节按序写入一个文件,就

Golang与FFmpeg:如何实现音频合成和分割,需要具体代码示例摘要:本文将介绍如何使用Golang和FFmpeg库来实现音频合成和分割。我们将用到一些具体的代码示例来帮助读者更好地理解。引言:随着音频处理技术的不断发展,音频合成和分割已经成为日常生活和工作中常见的功能需求。而Golang作为一种快速,高效且易于编写和维护的编程语言,加上FFmpeg作

许多的小伙伴都需要录屏进行办公或者传输文件,但是有时候会出现文件过大的问题制造了很多麻烦,下面就给大家带来了文件过大的解决方法,一起看看吧。win10录屏文件太大怎么办:1、下载软件格式工厂来进行压缩文件。下载地址>>2、进入主页面,点击“视频-MP4”选项。3、在转换格式页面中点击“添加文件”,选择要压缩的MP4文件。4、点击页面“输出配置”,通过输出质量来压缩文件。5、下拉配置列表选择“低质量和大小”点击“确定”。6、点击“确定”完成视频文件的导入。7、点击“开始”进行转化。8、完成后即可

大家好,我是了不起。最近我们在项目中,通过使用protobuf格式作为存储数据的一个载体。一个不小心就给自己埋了个大坑,还是过了好久才发现。protobuf简介protobuf全名叫Protocalbuffers.它是由Google研发的,一种可跨语言、可跨平台、可扩展的序列化数据的机制。类似于XML,但是它更小、更快、更简单。你只需要定义一次你希望的数据如何被结构化,然后你可以使用它的生成工具,生成包含一些序列化和反序列化等操作的源代码。可以轻松地从各种数据流和使用各种编程语言写入

在PHP开发中,字符串常常需要被分割成若干个子字符串,以便我们在处理数据时更加方便。此时,PHP提供了explode()函数来帮助我们实现这个目的。explode()函数的基本语法为:explode(string$delimiter,string$string[,int$limit=PHP_MAXPATHLEN])其中,$delimiter

近期,浙江大学ReLER实验室将SAM与视频分割进行深度结合,发布Segment-and-TrackAnything(SAM-Track)。SAM-Track赋予了SAM对视频目标进行跟踪的能力,并支持多种方式(点、画笔、文字)进行交互。在此基础上,SAM-Track统一了多个传统视频分割任务,达成了一键分割追踪任意视频中的任意目标,将传统视频分割外推至通用视频分割。SAM-Track具有卓越的性能,在复杂场景下仅需单卡就能高质量地稳定跟踪数百个目标。项目地址:https://github.co
