Pembaca yang dihormati, hari ini saya akan bercakap tentang skrip jurnal yang saya tulis. ?
Masalah yang saya cuba selesaikan ialah saya ingin menyelamatkan fikiran saya.
Saya tiada masalah membaca apa yang saya tulis, tetapi saya tidak seronok menunggu. Saya boleh imlak, tetapi saya tidak mahu menyimpan atau mendengar suara saya.
Setiap kali saya menghadapi situasi sedemikian, saya masuk ke mod kejuruteraan, dan jika ia sesuatu yang boleh saya tangani dalam masa beberapa jam bekerja, saya akan melakukannya.
Mula-mula, saya meneliti perpustakaan suara-ke-teks yang mudah digunakan dan saya menjumpai Vosk. Ia mempunyai perpustakaan model yang besar. Saya memilih dua yang kecil kerana saya mahu menggunakan aplikasi semasa saya mengekod. Mereka memberikan hasil yang agak baik.
Kemudian, dengan keajaiban pelbagai model AI, saya mendapat penyelesaian dalam Python. Ia menstrimkan mikrofon dan bunyi sistem saya ke model Vosk, yang menyediakan transkripsi yang ditulis dengan cap masa dalam fail dengan tarikh semasa.
Ia memenuhi tujuan, tetapi ia tidak sesuai untuk kegunaan harian. Salah satu moto saya ialah: jika ia tidak mudah dan segera, saya tidak akan menggunakannya. Jadi, saya membungkus skrip ke dalam modul Python dan menulis *.fail desktop untuk mendaftarkannya sebagai aplikasi Linux biasa dalam kes saya, Pop!_OS.
Hanya satu sentuhan tambahan yang pantas ialah menambahkan pintasan papan kekunci dan lihatlah keajaiban ia berfungsi!
Pemberitahuan menggunakan notify-send ada untuk memberitahu anda keadaan semasa apl.
Satu perkara yang mengganggu saya ialah apabila aplikasi berjalan dalam konsol kerana ia mengacaukan ruang kerja saya. Untuk mengelakkan ini, saya memerlukan cara mudah untuk memulakan dan menghentikan aplikasi tanpa bergantung pada terminal. Penyelesaian saya ialah melaksanakan sistem fail kunci.
Apabila apl dimulakan, ia mencipta fail kunci yang mengandungi ID prosesnya (PID). Jika kunci sudah wujud, skrip menggunakannya untuk menghantar isyarat KeyboardInterrupt untuk menghentikan contoh yang sedang berjalan dan keluar. Dengan cara ini, panggilan pertama memulakan apl dan mula menyalin, manakala panggilan kedua menghentikannya.
Saya harap artikel ini mencetuskan hasrat seseorang untuk menyelesaikan masalah mereka sendiri dengan cara yang unik, inventif dan agak digilap.
Sila semak artikel serupa saya yang lain:
Mengautomasikan Pengekstrakan Teks daripada Tangkapan Skrin
Juga jangan ragu untuk menyemak kod:
pada Github
Selamat hari raya ?
Atas ialah kandungan terperinci Penterjemah Jurnal: Tulis jurnal dengan mendiktekannya. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!