SQL テーブルから順序なしマップの欠損値を埋める効率的な方法 (SQL/C++)

Question

質問 現在、一意の識別子 (ID) とそれに関連付けられたデータセットを SQL テーブルから順序なしマップに読み取るシステムがあります。データセットは id1 から始まりましたが、データセットの追加と削除には約 10 ミリ秒かかりました。すべてのデータセットが常に RAM にロードされるわけではないことに注意してください。プログラムが開始されると、データベースから SELECTMAX(id) を読み取り、カウンター変数に +1 を追加します。これは、追加されたデータセットの ID として使用されます。削除されたデータセットの ID はどこでも使用されなくなります。これにより、必然的に ID シーケンスにギャップが生じ、

P粉252423906 · Answer

10 ミリ秒ごとにデータベースが変更される場合、1 秒あたり 100 件の変更が行われることになります。署名付き int は、約 2,147,483,648 個の値、または 21,474,846 秒、つまり約 8 か月を保持できます。それ以降は新たにIDを取得することはできなくなります。

最初の解決策は、int の代わりに 64bit 型を使用することです。これにより、約 13,600 年 (署名された 64b の場合) が得られ、これで十分だと思われます :)

他の解決策は、考えられるすべての ID を含むベクトルを用意することです。ベクトルストレージ bool(ID 使用/未使用)。新しい ID の要求は、ベクトルを未使用としてマークされた最初の位置に移動することによって行われます。
このベクトルは大量の RAM を使用しますが、必要な RAM が少ない bool 専用の std::vector のバージョンがあります。

3 番目の解決策 は、削除された (再利用可能な) ID のリンクされたリスト (おそらく二重リンク) を保存することです。

新しい ID が要求されると、リストはそのヘッダー、またはリストが空の場合はテーブルのサイズを提供します。
データセットが削除されると、その ID がリストに正しく挿入されるため、リストは常に並べ替えられます。
ID が再利用されると、リストから削除されます。
テーブルの最後のレコードを削除すると、リストの最後のノードも不要になるため削除される可能性があります (ケース ID > テーブルサイズ)。このため、最後のノードをすぐに削除できるように、二重リンクリストを使用することをお勧めします。

そのため、リストはノード上で「new」と「delete」を素早く使用し、また (デュアルリンクの場合) 頻繁に上下に実行して新しいノードを挿入します。
これは少し遅いですが、リストが大きすぎず、必要な時間がそれほど長くないことを願っています。

また、このリストには、必要なギャップの配列が示されていることに注意してください。