高效跳到大型文字檔案中的特定行
處理未知行長的海量文字檔案時,無需跳到特定行迭代整個文件可以顯著提高效率。問題中強調的常見方法是迭代,但它不是最佳解決方案。
更優雅、更有效率的替代方案包括識別預處理過程中每行的起始位元組偏移量。這可以透過建立以下偏移清單後,跳到特定行變得微不足道:
<code class="python">line_offset = [] offset = 0 for line in file: line_offset.append(offset) offset += len(line)</code>
其中n 是所需行的索引(第一行是第0 行)。該技術可以直接導航到任何行,而無需掃描整個文件,從而顯著減少大型資料集的處理時間。
以上是如何在大文字檔案中高效跳到特定行?的詳細內容。更多資訊請關注PHP中文網其他相關文章!