Rumah pembangunan bahagian belakang Golang Bagaimana golang mengendalikan fail besar

Bagaimana golang mengendalikan fail besar

Apr 27, 2023 am 09:11 AM

Dalam pembangunan, kami sering menghadapi situasi di mana kami perlu memproses fail besar Sebagai bahasa yang cekap dan sesuai untuk pemprosesan serentak, bahasa Go secara semula jadi akan melibatkan pemprosesan fail besar. Sama ada anda membaca, menulis atau mengubah suai fail besar, anda perlu mempertimbangkan beberapa isu, seperti: Bagaimana untuk mengelakkan kebocoran memori? Bagaimana untuk menanganinya dengan cekap? Dalam artikel ini, kami akan memperkenalkan beberapa kaedah untuk memproses fail besar dan memberi tumpuan kepada cara menangani fail yang terlalu besar untuk mengelakkan ranap program.

  1. Gunakan pemprosesan berpecah

Secara amnya, sama ada anda membaca, menulis atau mengubah suai fail besar, anda perlu mempertimbangkan cara untuk mengelakkan kebocoran memori dan ranap program. Untuk memproses fail besar dengan berkesan, pemprosesan split sering digunakan untuk membahagikan fail besar kepada berbilang fail kecil, dan kemudian membaca dan menulis fail kecil.

Dalam bahasa Go, kami boleh membahagikan fail melalui kaedah io.LimitReader() dan io.MultiReader(), membahagikan fail besar kepada berbilang fail kecil dan menggunakan pemprosesan berbilang benang.

Baca fail besar melebihi 500MB melalui kod berikut:

var (
    maxSize int64 = 100 * 1024 * 1024 //100MB
)
func readBigFile(filename string) (err error) {
    file, err := os.Open(filename)
    if err != nil {
        return err
    }
    defer file.Close()

    fileInfo, err := file.Stat()
    if err != nil {
        return err
    }

    if fileInfo.Size() <= maxSize {
        _, err = io.Copy(os.Stdout, file)
    } else {
        n := (fileInfo.Size() + (maxSize - 1)) / maxSize
        var err error
        for i := int64(0); i < n; i++ {
            eachSize := maxSize
            if i == n-1 {
                eachSize = fileInfo.Size() - (n-1)*maxSize
            }
            sectionReader := io.NewSectionReader(file, i*maxSize, eachSize)
            _, err = io.Copy(os.Stdout, sectionReader)
            if err != nil {
                return err
            }
        }
    }
    return nil
}
Salin selepas log masuk

Dalam kod di atas, apabila saiz fail dibaca melebihi nilai maksimum yang dibenarkan, kaedah bacaan kompaun akan digunakan , bahagikan besar fail ke dalam berbilang blok dengan saiz yang sama untuk membaca, dan akhirnya menggabungkannya ke dalam hasil akhir.

Kaedah di atas sudah tentu dioptimumkan untuk proses membaca fail yang besar Kadang-kadang kita juga mempunyai keperluan menulis fail.

  1. Tulis fail besar

Cara paling mudah untuk menulis fail besar dalam Go ialah menggunakan fungsi bufio.NewWriterSize() yang dibalut dengan os.File() dan gunakan Tulis Tentukan sama ada penimbal semasa penuh sebelum memanggil kaedah Flush() untuk menulis data dalam penimbal ke cakera keras. Kaedah menulis fail besar ini mudah dan mudah dilaksanakan serta sesuai untuk menulis fail besar.

    writer := bufio.NewWriterSize(file, size)
    defer writer.Flush()
    _, err = writer.Write(data)
Salin selepas log masuk
  1. Mengendalikan Fail CSV Besar

Selain membaca dan menulis fail besar, kami juga mungkin memproses fail CSV yang besar. Apabila memproses fail CSV, jika fail itu terlalu besar, ia akan menyebabkan beberapa ranap program, jadi kami perlu menggunakan beberapa alatan untuk memproses fail CSV yang besar ini. Bahasa Go menyediakan mekanisme yang dipanggil goroutine dan saluran, yang boleh memproses berbilang fail pada masa yang sama untuk mencapai tujuan memproses fail CSV besar dengan cepat.

Dalam bahasa Go, kita boleh menggunakan kaedah csv.NewReader() dan csv.NewWriter() untuk membina pemproses untuk membaca dan menulis fail CSV masing-masing, kemudian mengimbas fail baris demi baris untuk membaca data. Gunakan saluran paip dalam fail CSV untuk memproses cara data disimpan baris demi baris.

func readCSVFile(path string, ch chan []string) {
    file, err := os.Open(path)
    if err != nil {
        log.Fatal("读取文件失败:", err)
    }
    defer file.Close()
    reader := csv.NewReader(file)
    for {
        record, err := reader.Read()
        if err == io.EOF {
            break
        } else if err != nil {
            log.Fatal("csv文件读取失败:", err)
        }
        ch <- record
    }
    close(ch)
}

func writeCSVFile(path string, ch chan []string) {
    file, err := os.Create(path)
    if err != nil {
        log.Fatal("创建csv文件失败:", err)
    }
    defer file.Close()
    writer := csv.NewWriter(file)
    for record := range ch {
        if err := writer.Write(record); err != nil {
            log.Fatal("csv文件写入失败: ", err)
        }
        writer.Flush()
    }
}
Salin selepas log masuk

Dalam kod di atas, gunakan kaedah csv.NewReader() untuk lelaran melalui fail, simpan setiap baris data dalam tatasusunan, dan kemudian hantar tatasusunan ke saluran. Semasa membaca fail CSV, kami menggunakan goroutine dan saluran untuk mengimbas keseluruhan fail secara serentak. Selepas membaca, kami menutup saluran untuk menunjukkan bahawa kami telah selesai membaca fail.

Melalui kaedah di atas, anda tidak perlu lagi membaca keseluruhan data ke dalam memori semasa memproses fail besar, mengelakkan kebocoran memori dan ranap program, dan juga meningkatkan kecekapan operasi program.

Ringkasan:

Dalam pengenalan di atas, kami meneroka beberapa kaedah memproses fail besar, termasuk menggunakan pemprosesan pisah, menulis fail besar dan memproses fail CSV besar. Dalam pembangunan sebenar, kita boleh memilih cara yang sesuai untuk memproses fail besar berdasarkan keperluan perniagaan untuk meningkatkan prestasi dan kecekapan program. Pada masa yang sama, apabila memproses fail besar, kita perlu menumpukan pada isu ingatan, merancang penggunaan memori secara munasabah dan mengelakkan kebocoran memori.

Apabila menggunakan bahasa Go untuk memproses fail besar, kami boleh menggunakan sepenuhnya ciri bahasa Go, seperti goroutine dan saluran, supaya atur cara boleh memproses fail besar dengan cekap dan mengelakkan kebocoran memori dan ranap program. Walaupun artikel ini memperkenalkan kandungan yang agak asas, kaedah ini boleh digunakan untuk pemprosesan fail besar semasa pembangunan, dengan itu meningkatkan prestasi dan kecekapan program.

Atas ialah kandungan terperinci Bagaimana golang mengendalikan fail besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Apakah kelemahan debian openssl Apakah kelemahan debian openssl Apr 02, 2025 am 07:30 AM

OpenSSL, sebagai perpustakaan sumber terbuka yang digunakan secara meluas dalam komunikasi yang selamat, menyediakan algoritma penyulitan, kunci dan fungsi pengurusan sijil. Walau bagaimanapun, terdapat beberapa kelemahan keselamatan yang diketahui dalam versi sejarahnya, yang sebahagiannya sangat berbahaya. Artikel ini akan memberi tumpuan kepada kelemahan umum dan langkah -langkah tindak balas untuk OpenSSL dalam sistem Debian. Debianopenssl yang dikenal pasti: OpenSSL telah mengalami beberapa kelemahan yang serius, seperti: Kerentanan Pendarahan Jantung (CVE-2014-0160): Kelemahan ini mempengaruhi OpenSSL 1.0.1 hingga 1.0.1f dan 1.0.2 hingga 1.0.2 versi beta. Penyerang boleh menggunakan kelemahan ini untuk maklumat sensitif baca yang tidak dibenarkan di pelayan, termasuk kunci penyulitan, dll.

Bagaimana anda menggunakan alat PPROF untuk menganalisis prestasi GO? Bagaimana anda menggunakan alat PPROF untuk menganalisis prestasi GO? Mar 21, 2025 pm 06:37 PM

Artikel ini menerangkan cara menggunakan alat PPROF untuk menganalisis prestasi GO, termasuk membolehkan profil, mengumpul data, dan mengenal pasti kesesakan biasa seperti CPU dan isu memori.

Bagaimana anda menulis ujian unit di GO? Bagaimana anda menulis ujian unit di GO? Mar 21, 2025 pm 06:34 PM

Artikel ini membincangkan ujian unit menulis di GO, meliputi amalan terbaik, teknik mengejek, dan alat untuk pengurusan ujian yang cekap.

Perpustakaan apa yang digunakan untuk operasi nombor terapung di GO? Perpustakaan apa yang digunakan untuk operasi nombor terapung di GO? Apr 02, 2025 pm 02:06 PM

Perpustakaan yang digunakan untuk operasi nombor terapung dalam bahasa Go memperkenalkan cara memastikan ketepatannya ...

Bagaimana anda menggunakan ujian yang didorong oleh jadual di GO? Bagaimana anda menggunakan ujian yang didorong oleh jadual di GO? Mar 21, 2025 pm 06:35 PM

Artikel ini membincangkan menggunakan ujian yang didorong oleh jadual di GO, satu kaedah yang menggunakan jadual kes ujian untuk menguji fungsi dengan pelbagai input dan hasil. Ia menyoroti faedah seperti kebolehbacaan yang lebih baik, penurunan duplikasi, skalabiliti, konsistensi, dan a

Terangkan tujuan Pakej Refleksi Go. Bilakah anda akan menggunakan refleksi? Apakah implikasi prestasi? Terangkan tujuan Pakej Refleksi Go. Bilakah anda akan menggunakan refleksi? Apakah implikasi prestasi? Mar 25, 2025 am 11:17 AM

Artikel ini membincangkan pakej GO's Reflect, yang digunakan untuk manipulasi kod runtime, bermanfaat untuk siri, pengaturcaraan generik, dan banyak lagi. Ia memberi amaran tentang kos prestasi seperti pelaksanaan yang lebih perlahan dan penggunaan memori yang lebih tinggi, menasihati penggunaan yang bijak dan terbaik

Bagaimana anda menentukan kebergantungan dalam fail go.mod anda? Bagaimana anda menentukan kebergantungan dalam fail go.mod anda? Mar 27, 2025 pm 07:14 PM

Artikel ini membincangkan menguruskan kebergantungan modul Go melalui Go.Mod, meliputi spesifikasi, kemas kini, dan resolusi konflik. Ia menekankan amalan terbaik seperti versi semantik dan kemas kini biasa.

Berubah dari front-end ke pembangunan back-end, adakah lebih menjanjikan untuk belajar Java atau Golang? Berubah dari front-end ke pembangunan back-end, adakah lebih menjanjikan untuk belajar Java atau Golang? Apr 02, 2025 am 09:12 AM

Laluan Pembelajaran Backend: Perjalanan Eksplorasi dari Front-End ke Back-End sebagai pemula back-end yang berubah dari pembangunan front-end, anda sudah mempunyai asas Nodejs, ...

See all articles