如何从单个文件中提取多个 JSON 对象:Pythonic 解决方案
Oct 29, 2024 pm 06:20 PM从单个文件中提取多个 JSON 对象
当遇到包含大量 JSON 对象的 JSON 文件时,必须有一个全面的方法来提取提取特定数据。本文深入研究了从此类文件中提取“时间戳”和“有用性”值的解决方案。
提供的 JSON 文件结构展示了堆叠的 JSON 对象。要解析和检索所需的数据,请考虑使用 json.JSONDecoder.raw_decode 函数。此函数允许解码任意大的 JSON 字符串,同时遵守内存限制。
但是,需要注意的是,Python json 模块不接受带有空格前缀的字符串。因此,使用正则表达式来搜索第一个非空白字符,作为解析的起点。
下面是解决此问题的修订解决方案:
<code class="python">from json import JSONDecoder, JSONDecodeError import re NOT_WHITESPACE = re.compile(r'\S') def decode_stacked(document, pos=0, decoder=JSONDecoder()): while True: match = NOT_WHITESPACE.search(document, pos) if not match: return pos = match.start() try: obj, pos = decoder.raw_decode(document, pos) except JSONDecodeError: # do something sensible if there's some error raise yield obj</code>
登录后复制
修改后的代码片段可以有效地解析给定文档中堆叠的 JSON 对象,并在遇到每个对象时返回该对象。这种方法避免了传统 JSON 解析的限制,使其适合处理大型且可能复杂的 JSON 文件。
以上是如何从单个文件中提取多个 JSON 对象:Pythonic 解决方案的详细内容。更多信息请关注PHP中文网其他相关文章!
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门文章
仓库:如何复兴队友
3 周前
By 尊渡假赌尊渡假赌尊渡假赌
击败分裂小说需要多长时间?
3 周前
By DDD
R.E.P.O.能量晶体解释及其做什么(黄色晶体)
1 周前
By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒险:如何获得巨型种子
3 周前
By 尊渡假赌尊渡假赌尊渡假赌
公众号网页更新缓存难题:如何避免版本更新后旧缓存影响用户体验?
3 周前
By 王林

热门文章
仓库:如何复兴队友
3 周前
By 尊渡假赌尊渡假赌尊渡假赌
击败分裂小说需要多长时间?
3 周前
By DDD
R.E.P.O.能量晶体解释及其做什么(黄色晶体)
1 周前
By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒险:如何获得巨型种子
3 周前
By 尊渡假赌尊渡假赌尊渡假赌
公众号网页更新缓存难题:如何避免版本更新后旧缓存影响用户体验?
3 周前
By 王林

热门文章标签

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)