Rumah pembangunan bahagian belakang Golang Cara tukar golang pdf ke txt

Cara tukar golang pdf ke txt

Apr 24, 2023 am 09:10 AM

Hari ini, saya ingin berkongsi dengan anda cara menukar fail PDF kepada fail teks, khususnya menggunakan perpustakaan PDF kepada TXT di Golang. PDF ialah format yang sangat biasa dalam kesusasteraan moden, tetapi dalam beberapa kes, untuk pemprosesan dan analisis teks, mungkin menyusahkan untuk menggunakan dokumen dalam format PDF. Oleh itu, kita perlu menukarnya kepada format teks untuk kegunaan selanjutnya. Walaupun terdapat banyak perisian yang boleh melakukan ini, lebih cekap dan fleksibel menggunakan perpustakaan untuk menukar PDF kepada teks dalam persekitaran pengaturcaraan.

Pertama, kita perlu memuat turun PDF Golang ke perpustakaan TXT. Terdapat banyak perpustakaan PDF ke TXT yang tersedia, tetapi kami menggunakan salah satu daripada beberapa perpustakaan yang paling popular - go-pdf-to-text. Perpustakaan ini adalah pilihan yang baik kerana ia mudah digunakan dan mempunyai dokumentasi yang baik.

Memasang perpustakaan go-pdf-to-text adalah mudah, cuma jalankan arahan berikut dalam baris arahan:

go get -u github.com/lu4p/unipdf/extract
go get -u github.com/lu4p/unipdf/model/textencoding
go get -u github.com/lu4p/unipdf/model/textlayout
go get -u github.com/lu4p/unipdf/model/textencoding/simplenc
Salin selepas log masuk

Selepas memuat turun perpustakaan ini, kami boleh menulis kod dan menukar ia untuk teks. Berikut ialah beberapa contoh kod untuk menukar fail PDF kepada format teks:

package main

import (
    "fmt"
    "os"

    pdf "github.com/lu4p/unipdf/v3/model"
    "github.com/lu4p/unipdf/v3/extractor"
)

func main() {
    f, err := os.Open("example.pdf")
    if err != nil {
        fmt.Println(err)
        os.Exit(1)
    }
    defer f.Close()

    pdfReader, err := pdf.NewPdfReader(f)
    if err != nil {
        fmt.Println(err)
        os.Exit(1)
    }

    numPages, err := pdfReader.GetNumPages()
    if err != nil {
        fmt.Println(err)
        os.Exit(1)
    }

    ex := extractor.New(pdfReader)

    for i := 1; i <= numPages; i++ {
        pageText, err := ex.ExtractPageText(i)
        if err != nil {
            fmt.Println(err)
            os.Exit(1)
        }
        fmt.Println(pageText)
    }
}
Salin selepas log masuk

Dalam contoh ini, kami mula-mula membuka fail PDF dan kemudian memuatkannya ke dalam pdfReader. Kami kemudian menggunakan fungsi Baharu daripada pakej ekstrak untuk mencipta pengekstrak yang memuatkan kandungan halaman ke dalam memori untuk pengekstrakan teks. Dengan menggunakan gelung, kami melingkari semua halaman dan menukarnya kepada teks.

Kita dapat lihat bahawa menggunakan perpustakaan ini tidak sukar sama sekali. Teruskan dan cuba pustaka ini untuk penukaran PDF.

Selain pustaka go-pdf-to-text, terdapat beberapa perpustakaan lain yang boleh digunakan untuk menukar PDF kepada TXT. Namun begitu, setiap perpustakaan mempunyai kelebihan dan batasan yang berbeza dalam beberapa aspek. Sebagai contoh, sesetengah perpustakaan ini mungkin menukar lebih cepat, manakala yang lain mungkin menyediakan pengekstrakan teks yang lebih tepat. Oleh itu, anda perlu membuat pertukaran apabila memilih perpustakaan berdasarkan keperluan projek anda dan ketepatan output teks yang anda inginkan.

Secara keseluruhannya, PDF ke TXT boleh menjadi alat yang sangat berguna, terutamanya apabila kandungan dalam PDF perlu dianalisis dan diproses. Menggunakan Golang, anda boleh menukar fail PDF kepada format TXT dengan mudah dan mengekstrak data teks yang diperlukan daripadanya. Pustaka go-pdf-to-text yang kami gunakan berfungsi dengan baik, tetapi anda boleh menggunakan perpustakaan lain untuk tugas ini, bergantung pada keperluan projek anda dan output yang diingini.

Atas ialah kandungan terperinci Cara tukar golang pdf ke txt. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Apakah kelemahan debian openssl Apakah kelemahan debian openssl Apr 02, 2025 am 07:30 AM

OpenSSL, sebagai perpustakaan sumber terbuka yang digunakan secara meluas dalam komunikasi yang selamat, menyediakan algoritma penyulitan, kunci dan fungsi pengurusan sijil. Walau bagaimanapun, terdapat beberapa kelemahan keselamatan yang diketahui dalam versi sejarahnya, yang sebahagiannya sangat berbahaya. Artikel ini akan memberi tumpuan kepada kelemahan umum dan langkah -langkah tindak balas untuk OpenSSL dalam sistem Debian. Debianopenssl yang dikenal pasti: OpenSSL telah mengalami beberapa kelemahan yang serius, seperti: Kerentanan Pendarahan Jantung (CVE-2014-0160): Kelemahan ini mempengaruhi OpenSSL 1.0.1 hingga 1.0.1f dan 1.0.2 hingga 1.0.2 versi beta. Penyerang boleh menggunakan kelemahan ini untuk maklumat sensitif baca yang tidak dibenarkan di pelayan, termasuk kunci penyulitan, dll.

Bagaimana anda menggunakan alat PPROF untuk menganalisis prestasi GO? Bagaimana anda menggunakan alat PPROF untuk menganalisis prestasi GO? Mar 21, 2025 pm 06:37 PM

Artikel ini menerangkan cara menggunakan alat PPROF untuk menganalisis prestasi GO, termasuk membolehkan profil, mengumpul data, dan mengenal pasti kesesakan biasa seperti CPU dan isu memori.

Bagaimana anda menulis ujian unit di GO? Bagaimana anda menulis ujian unit di GO? Mar 21, 2025 pm 06:34 PM

Artikel ini membincangkan ujian unit menulis di GO, meliputi amalan terbaik, teknik mengejek, dan alat untuk pengurusan ujian yang cekap.

Perpustakaan apa yang digunakan untuk operasi nombor terapung di GO? Perpustakaan apa yang digunakan untuk operasi nombor terapung di GO? Apr 02, 2025 pm 02:06 PM

Perpustakaan yang digunakan untuk operasi nombor terapung dalam bahasa Go memperkenalkan cara memastikan ketepatannya ...

Apakah masalah dengan thread giliran di crawler colly go? Apakah masalah dengan thread giliran di crawler colly go? Apr 02, 2025 pm 02:09 PM

Masalah Threading Giliran di GO Crawler Colly meneroka masalah menggunakan Perpustakaan Colly Crawler dalam bahasa Go, pemaju sering menghadapi masalah dengan benang dan permintaan beratur. � ...

Berubah dari front-end ke pembangunan back-end, adakah lebih menjanjikan untuk belajar Java atau Golang? Berubah dari front-end ke pembangunan back-end, adakah lebih menjanjikan untuk belajar Java atau Golang? Apr 02, 2025 am 09:12 AM

Laluan Pembelajaran Backend: Perjalanan Eksplorasi dari Front-End ke Back-End sebagai pemula back-end yang berubah dari pembangunan front-end, anda sudah mempunyai asas Nodejs, ...

Bagaimana anda menentukan kebergantungan dalam fail go.mod anda? Bagaimana anda menentukan kebergantungan dalam fail go.mod anda? Mar 27, 2025 pm 07:14 PM

Artikel ini membincangkan menguruskan kebergantungan modul Go melalui Go.Mod, meliputi spesifikasi, kemas kini, dan resolusi konflik. Ia menekankan amalan terbaik seperti versi semantik dan kemas kini biasa.

Bagaimana anda menggunakan ujian yang didorong oleh jadual di GO? Bagaimana anda menggunakan ujian yang didorong oleh jadual di GO? Mar 21, 2025 pm 06:35 PM

Artikel ini membincangkan menggunakan ujian yang didorong oleh jadual di GO, satu kaedah yang menggunakan jadual kes ujian untuk menguji fungsi dengan pelbagai input dan hasil. Ia menyoroti faedah seperti kebolehbacaan yang lebih baik, penurunan duplikasi, skalabiliti, konsistensi, dan a

See all articles