Dalam artikel ini, kami berhasrat untuk menyiasat mengapa membaca baris data rentetan daripada input standard (stdin ) menggunakan C pada umumnya lebih perlahan daripada rakan sejawat Pythonnya. Kami mulakan dengan memeriksa kod yang disediakan, mengenal pasti kawasan yang berpotensi menjadi kebimbangan.
string input_line; long line_count = 0; time_t start = time(NULL); int sec; int lps; while (cin) { getline(cin, input_line); if (!cin.eof()) line_count++; }
Kod ini menggunakan getline() untuk membaca baris teks daripada stdin dan mengira bilangan baris dalam fail. Walau bagaimanapun, ia membaca setiap aksara fail satu demi satu dalam gelung dalaman. Pendekatan ini tidak cekap dan membawa kepada panggilan sistem yang berlebihan, mengakibatkan pelaksanaan yang perlahan.
Tidak seperti Python, strim C mempunyai tetapan lalai yang mengutamakan penyegerakan dengan standard gaya C fungsi input dan output. Penyegerakan ini memastikan bahawa kedua-dua aliran C dan C mengakses sumber input dan output secara konsisten. Walau bagaimanapun, penyegerakan ini juga menghalang strim C daripada menggunakan mekanisme penimbalan yang lebih cekap.
cin disegerakkan dengan stdio, yang menyebabkannya mengelakkan sebarang penimbalan input. Akibatnya, cin hanya membaca satu aksara pada satu masa, menjadikan proses itu lebih memakan masa.
Untuk meningkatkan prestasi kod C, kita boleh melumpuhkan penyegerakan antara cin dan stdio. Dengan menambahkan pernyataan cin.sync_with_stdio(false) pada permulaan program, kami boleh membenarkan aliran C menimbal I/O mereka secara bebas, yang membawa kepada peningkatan kelajuan yang ketara.
Satu lagi pendekatan berkesan untuk meningkatkan prestasi ialah menggunakan fgets() sebaliknya daripada getline(). fgets ialah fungsi C yang membaca bilangan aksara tertentu daripada stdin ke dalam tatasusunan aksara, memberikan kawalan yang lebih besar ke atas proses penimbalan.
Untuk menunjukkan perbezaan prestasi, fail yang mengandungi 100 juta baris telah digunakan untuk penanda aras. Keputusan menggunakan kod C asal (disegerakkan), C dengan penyegerakan dilumpuhkan dan Python adalah seperti berikut:
Implementation | Lines per Second |
---|---|
Python (default) | 3,571,428 |
cin (default/naive) | 819,672 |
cin (no sync) | 12,500,000 |
fgets | 14,285,714 |
wc (not a fair comparison) | 54,644,808 |
Melumpuhkan penyegerakan dalam C menghasilkan peningkatan yang ketara, manakala penggunaan fgets menawarkan prestasi yang lebih baik. Adalah penting untuk ambil perhatian bahawa menggunakan wc bukanlah perbandingan yang adil kerana ia direka khusus untuk mengira baris.
Dengan memahami tetapan lalai strim C dan melaksanakan pengoptimuman yang sesuai, seperti melumpuhkan penyegerakan strim atau menggunakan fgets, prestasi kod C untuk membaca baris daripada stdin boleh dipertingkatkan secara mendadak, menjadikannya setanding atau lebih pantas daripada rakan Pythonnya.
Atas ialah kandungan terperinci Mengapa Bacaan Baris `stdin` C Jauh Lebih Lambat Daripada Python dan Bagaimana Ia Boleh Diperbaiki?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!