Rumah > pembangunan bahagian belakang > C++ > Bagaimanakah Saya Boleh Mendapatkan Kembali 10 Baris Terakhir Fail Teks Raksasa dengan Cekap?

Bagaimanakah Saya Boleh Mendapatkan Kembali 10 Baris Terakhir Fail Teks Raksasa dengan Cekap?

Mary-Kate Olsen
Lepaskan: 2025-01-05 10:23:41
asal
508 orang telah melayarinya

How Can I Efficiently Retrieve the Last 10 Lines of a Gigantic Text File?

Mengambil semula 10 Baris Terakhir Fail Teks Besar-besaran dengan Cekap

Dalam bidang pemprosesan teks berskala besar, mendapatkan semula baris akhir fail yang sangat besar menimbulkan cabaran unik. Satu fail sedemikian, yang bersaiz melebihi 10GB, memberikan halangan yang ketara dalam mendapatkan data ini dengan cekap.

Untuk menangani isu ini, pendekatan yang berkesan melibatkan melintasi fail ke belakang, bermula dari penghujung. Kami menyasarkan untuk mencari sepuluh baris baharu berturut-turut, menunjukkan kehadiran baris yang dikehendaki. Selepas itu, kami membaca ke hadapan untuk menangkap baris ini, dengan mengambil kira kemungkinan variasi pengekodan.

Sebagai contoh, dalam C#, pelaksanaan komprehensif mengendalikan kes di mana fail mengandungi kurang daripada sepuluh baris. Coretan kod berikut menunjukkan pendekatan ini:

public static string ReadEndLines(string path, Int64 numberOfLines, Encoding encoding, string lineSeparator) {

    int sizeOfChar = encoding.GetByteCount("\n");
    byte[] buffer = encoding.GetBytes(lineSeparator);


    using (FileStream fs = new FileStream(path, FileMode.Open)) {
        Int64 lineCount = 0;
        Int64 endPosition = fs.Length / sizeOfChar;

        for (Int64 position = sizeOfChar; position < endPosition; position += sizeOfChar) {
            fs.Seek(-position, SeekOrigin.End);
            fs.Read(buffer, 0, buffer.Length);

            if (encoding.GetString(buffer) == lineSeparator) {
                lineCount++;
                if (lineCount == numberOfLines) {
                    byte[] returnBuffer = new byte[fs.Length - fs.Position];
                    fs.Read(returnBuffer, 0, returnBuffer.Length);
                    return encoding.GetString(returnBuffer);
                }
            }
        }

        // handle case where number of lines in file is less than numberOfLines
        fs.Seek(0, SeekOrigin.Begin);
        buffer = new byte[fs.Length];
        fs.Read(buffer, 0, buffer.Length);
        return encoding.GetString(buffer);
    }
}
Salin selepas log masuk

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mendapatkan Kembali 10 Baris Terakhir Fail Teks Raksasa dengan Cekap?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan