object-c - C++ を使用してファイルから 5,000 万のデータを読み取り、それをベクトルに保存する速度を向上させるにはどうすればよいですか?

Question

txt ファイルから 5,000 万の double データを読み取り、ベクトルに格納する必要があります。最初は、ファイル io が遅すぎるのではないかと考えたので、ファイル メモリ マッピングを使用して、すべてのファイルの内容をブロックとしてメモリに読み込みました。次に、ベクトルに 1 つずつプッシュバックしますが、ファイルから直接...

漂亮男人 · Answer

デバッグモードで実行するのは意味がありません。コードを使用してリリースモードで実行すると、所要時間はわずか 14 秒です。

問題を解決するには、まず問題を見つけて、次のようにコードを変更し、まずどこに時間がかかっているかを見つけます

リーリー

つまり、ボトルネックは「ss_sim >> fVecSim」という文にあります。 atofは十分速いです。

つまり、私の結論は次のとおりです。究極の最適化ソリューションは、ストレージ形式から始めて、データを文字列ではなくバイナリとして保存することです。これにより、文字列 IO と変換関数のオーバーヘッドが回避され、数秒でデータを取得できるようになります。

phpcn_u1582 · Answer

現時点で最も効率的な方法はストリームを使用することですが、それはコード実装からもわかります。すべてのファイルの内容を一度にバッファーに読み取ることになりますが、これは最良の方法ではありません。毎回平均してバッファ[1024] (1K またはその他の値) を読み取ることをお勧めします。読み取り後、ポインターは次の行に移動し、EOF 位置の終わりまで読み取りを続けます

天蓬老师 · Answer

1. データ間に依存関係がない場合は、ブロック単位でマルチスレッドの読み取りを試みることができます。
2. さらに、後続の走査がランダムアクセスでない場合は、リストを使用する方が効率的です。かなりの数です。

天蓬老师 · Answer

Cスタイルに切り替えることができますscanfお試しください

わあ、なぜ私の答えをこのように扱うのですか？私を報告したネチズンは、なぜこの答えに何か問題があるのか尋ねたいと思います。