Inhaltsverzeichnis
Improving small document performance
Single allocation for nested documents
Parsing BSON documents from network buffers
Generating BSON documents into network buffers
Generating Object Ids without Synchronization

Libbson

Jun 07, 2016 pm 04:30 PM
lib new

Libbson is a new shared library written in C for developers wanting to work with the BSON serialization format. Its API will feel natural to C programmers but can also be used as the base of a C extension in higher-level MongoDB drivers. T

Libbson is a new shared library written in C for developers wanting to work with the BSON serialization format.

Its API will feel natural to C programmers but can also be used as the base of a C extension in higher-level MongoDB drivers.

The library contains everything you would expect from a BSON implementation. It has the ability to work with documents in their serialized form, iterating elements within a document, overwriting fields in place, Object Id generation, JSON conversion, data validation, and more. Some lessons were learned along the way that are beneficial for those choosing to implement BSON themselves.

Improving small document performance

A common use case of BSON is for relatively small documents. This has a profound impact on the memory allocator in userspace, causing what is commonly known as “memory fragmentation”. Memory fragmentation can make it more difficult for your allocator to locate a contiguous region of memory.

In addition to increasing allocation latency, it increases the memory requirements of your application to overcome that fragmentation.

To help with this issue, the bson_t structure contains 120 bytes of inline space that allows BSON documents to be built directly on the stack as opposed to the heap.

When the document size grows past 120 bytes it will automatically migrate to a heap allocation.

Additionally, bson_t will grow it’s buffers in powers of two. This is standard when working with buffers and arrays as it amortizes the overhead of growing the buffer versus calling realloc() every time data is appended. 120 bytes was chosen to align bson_t to the size of two sequential cachelines on x86_64 (each 64 bytes).

This may change based on future research, but not before a stable ABI has been reached.

Single allocation for nested documents

One strength of BSON is it’s ability to nest objects and arrays. Often times when serializing these nested documents, each sub-document is serialized independently and then appended to the parents buffer.

As you might imagine, this takes quite the toll on the allocator. It can generate many small allocations which were only created to have been immediately discarded after appending to the parents buffer. Libbson allows for building sub-documents directly into the parent documents buffer.

Doing so helps avoid this costly fragmentation. The topmost document will grow its underlying buffers in powers of two each time the allocation would overflow.

Parsing BSON documents from network buffers

Another common area for allocator fragmentation is during BSON document parsing. Libbson allows parsing and iteration of BSON documents directly from your incoming network buffer.

This means the only allocations created are those needed for your higher level language such as a PyDict if writing a Python extension.

Developers writing C extensions for their driver may choose to implement a “generator” style parsing of documents to help keep memory fragmentation low.

A technique we’re yet to explore is implementing a hashtable-esque structure backed by BSON, only deserializing the entire buffer after a threshold of keys have been accessed.

Generating BSON documents into network buffers

Much like parsing BSON documents, generating documents and placing them into your network buffers can be hard on your memory allocator. To help keep this fragmentation down, Libbson provides support for serializing your document to BSON directly within a buffer of your choosing.

This is ideal for situations such as writing a sequence of BSON documents into a MongoDB message.

Generating Object Ids without Synchronization

Applications are often doing ObjectId generation, especially in high insert environments. The uniqueness of generated ObjectIds is critical to avoiding duplicate key errors across multiple nodes.

Highly threaded environments create a local contention point slowing the rate of generation. This is because the threads must synchronize on the increment counter of each sequential ObjectId. Failure to do so could cause collisions that would not be detected until after a network round-trip. Most drivers implement the synchronization with an atomic increment or a mutex if atomics are not available.

Libbson will use atomic increments and in some cases avoid synchronization altogether if possible. One such case is a non-threaded environment.

Another is when running on Linux as both threads and processes are in the same namespace.

This allows the use of the thread identifier as the pid within the ObjectId.

You can find Libbson at https://github.com/mongodb/libbson and discuss design choices with its author, Christian Hergert, who can be found on twitter as @hergertme.

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

So führen Sie ein lokales Abhängigkeits-JAR-Paket in das Springboot-Projekt ein und packen es in den lib-Ordner So führen Sie ein lokales Abhängigkeits-JAR-Paket in das Springboot-Projekt ein und packen es in den lib-Ordner May 11, 2023 am 11:37 AM

Vorwort: Bei der Arbeit bin ich auf ein Javaweb-Projekt gestoßen, das mit dem Springboot-Framework erstellt wurde und Push-Funktionen von Drittanbietern integrieren musste. Daher habe ich den Xiaomi-Push-Dienst verwendet und das entsprechende JAR-Paket heruntergeladen. Die Einführung lokaler Jars in das Projekt stellt kein großes Problem dar. Nach dem Schreiben des Codes ist es kein Problem, den Testklassentest zu bestehen. Bereiten Sie dann das Paketieren und Bereitstellen auf dem Entwicklungsserver vor. Da das Projekt über Tomcat bereitgestellt wird, handelt es sich bei der Verpackungsmethode um ein Kriegspaket. Laden Sie es nach dem Packen auf den Entwicklungsserver hoch. Nach dem erfolgreichen Start habe ich die geschriebene Push-Schnittstelle getestet und festgestellt, dass sie fehlgeschlagen ist. Durch die Analyse wurde festgestellt, dass das lib-Verzeichnis im Paketkrieg, in dem die abhängigen JAR-Dateien des Projekts gespeichert sind, keine lokal eingeführten Push-bezogenen JAR-Pakete enthält. Nach einer halben Stunde Mühe war das Problem gelöst. lösen

Worauf bezieht sich lib unter Linux? Worauf bezieht sich lib unter Linux? May 23, 2023 pm 07:20 PM

Unter Linux ist lib das Bibliotheksdateiverzeichnis, das alle für das System nützlichen Bibliotheksdateien enthält; Bibliotheksdateien sind Dateien, die für die korrekte Ausführung von Anwendungen, Befehlen oder Prozessen erforderlich sind. Die Rolle von lib ähnelt der der DLL-Datei in Windows. Fast alle Anwendungen müssen die gemeinsam genutzten Bibliotheksdateien im lib-Verzeichnis verwenden. lib ist die Abkürzung für Library (Bibliothek). In diesem Verzeichnis wird die grundlegendste gemeinsam genutzte dynamische Linkbibliothek des Systems gespeichert. Ihre Funktion ähnelt der DLL-Datei in Windows. Fast alle Anwendungen erfordern die Verwendung dieser gemeinsam genutzten Bibliotheken. Der Ordner /lib ist das Verzeichnis der Bibliotheksdateien und enthält alle für das System nützlichen Bibliotheksdateien. Einfach ausgedrückt handelt es sich um eine Datei, die für die korrekte Ausführung einer Anwendung, eines Befehls oder eines Prozesses erforderlich ist. in/bi

Was ist der Unterschied zwischen make und new in der Go-Sprache? Was ist der Unterschied zwischen make und new in der Go-Sprache? Jan 09, 2023 am 11:44 AM

Unterschiede: 1. Make kann nur zum Zuweisen und Initialisieren von Daten der Typen Slice, Map und Chan verwendet werden, während new jeden Datentyp zuordnen kann. 2. Die neue Zuweisung gibt einen Zeiger vom Typ „*Type“ zurück, während make eine Referenz vom Typ „Type“ zurückgibt. 3. Der von new zugewiesene Speicherplatz wird gelöscht. Nachdem make den Speicherplatz zugewiesen hat, wird er initialisiert.

So verwenden Sie das neue Schlüsselwort in Java So verwenden Sie das neue Schlüsselwort in Java May 03, 2023 pm 10:16 PM

1. Konzept In der Java-Sprache ist der „neue“ Ausdruck für die Erstellung einer Instanz verantwortlich. Der Konstruktor wird aufgerufen, um die Instanz zu initialisieren „Objektreferenz“, aber der Wert des neuen Ausdrucks ist eine Referenz auf das neu erstellte Objekt. 2. Zweck: Erstellen Sie ein Objekt einer neuen Klasse. 3. Arbeitsmechanismus: Allokieren Sie Speicherplatz für Objektmitglieder und geben Sie Standardwerte explizit an, führen Sie Konstruktionsmethodenberechnungen durch und geben Sie häufig Referenzwerte zurück bedeutet, neue im Speicher zu öffnen. Der Speicherplatz wird im Heap-Bereich im Speicher zugewiesen. Er wird von JVM gesteuert und verwaltet den Speicher. Hier verwenden wir die String-Klasse als Beispiel. Pu

Wie funktioniert der neue Operator in js? Wie funktioniert der neue Operator in js? Feb 19, 2024 am 11:17 AM

Wie funktioniert der neue Operator in js? Es werden spezifische Codebeispiele benötigt. Der neue Operator in js ist ein Schlüsselwort, das zum Erstellen von Objekten verwendet wird. Seine Funktion besteht darin, ein neues Instanzobjekt basierend auf dem angegebenen Konstruktor zu erstellen und einen Verweis auf das Objekt zurückzugeben. Bei Verwendung des neuen Operators werden tatsächlich die folgenden Schritte ausgeführt: Erstellen eines neuen leeren Objekts; Verweisen des Prototyps des leeren Objekts auf das Prototypobjekt des Konstruktors; Zuweisen des Gültigkeitsbereichs des Konstruktors auf das neue Objekt Objekt); Führen Sie den Code im Konstruktor aus und geben Sie das neue Objekt an

Was tun, wenn Linux lib nicht finden kann? Was tun, wenn Linux lib nicht finden kann? Feb 28, 2023 am 09:59 AM

Lösung dafür, dass Linux lib nicht findet: 1. Kopieren Sie die lib-Bibliothek im Programm in das Verzeichnis „/lib“ oder „/usr/local/lib“ und führen Sie dann „ldconfig“ aus. 2. In „ld.so.conf“; Fügen Sie das Verzeichnis hinzu, in dem sich die Bibliotheksdatei befindet, und aktualisieren Sie dann die Datei „ld.so.cache“.

Die neue GFX-Kamera mit festem Objektiv von Fujifilm stellt den neuen Mittelformatsensor vor und könnte den Auftakt einer völlig neuen Serie geben Die neue GFX-Kamera mit festem Objektiv von Fujifilm stellt den neuen Mittelformatsensor vor und könnte den Auftakt einer völlig neuen Serie geben Sep 27, 2024 am 06:03 AM

Fujifilm war in den letzten Jahren sehr erfolgreich, vor allem aufgrund seiner Filmsimulationen und der Beliebtheit seiner kompakten Kameras im Rangefinger-Stil in den sozialen Medien. Laut Fujirumors scheint sich das Unternehmen jedoch nicht auf seinen Lorbeeren auszuruhen. Die u

See all articles