Dieser Artikel ist eine Übersetzung der „Best Open Source Software List“, die von InfoWorld im 2021Jahr veröffentlicht wurde. InfoWorld ist ein Informationstechnologie-Medienunternehmen, das 1978 gegründet wurde und derzeit Teil von IDG ist. Jedes Jahr wählt InfoWorld die „Beste Open-Source-Software“ (BOSSIE) des Jahres basierend auf dem Beitrag der Software zur Open-Source-Community und ihrem Einfluss in der Branche. Diese Auszeichnung wird seit mehr als zehn Jahren vergeben.Zu den 29 Open-Source-Projekten, die diese Auszeichnung gewonnen haben, gehören: Softwareentwicklung, Entwicklung, Cloud-Native-Computing, maschinelles Lernen und andere Arten, schauen wir uns unten um, gibt es bekannte? ! 1, Svelte und SvelteKit Svelte hat den Status quo auf den Kopf gestellt, indem es von Anfang an Strategien zur Kompilierzeit eingeführt hat, und ist mit großartiger Leistung, fortlaufender Entwicklung und einer großartigen Entwicklererfahrung vorangekommen.Jetzt in der öffentlichen Betaversion setzt SvelteKit die Svelte-Tradition fort, den Sprung zu wagen, indem es die neuesten Tools nutzt und die Bereitstellung in serverlosen Umgebungen zu einer integrierten Funktion macht. Adresse: https://github.com/sveltejs/svelte
2, Minikube
Minikube ist ein einfaches Tool, um Kubernetes lokal auszuführen -Einzelner Kubernetes-Cluster innerhalb einer virtuellen Maschine auf Ihrem Laptop. Einfach Kubernetes auszuprobieren oder Kubernetes für die tägliche Entwicklung zu verwenden.Adresse: https://github.com/kubernetes/minikube
3, Pixie
Pixie ist ein Observability-Tool für Kubernetes-Anwendungen, das Cluster auf hoher Ebene anzeigen kann Leistungsstatus, wie Service-Maps, Cluster-Ressourcen und Anwendungsverkehr; Sie können auch einen Drilldown zu detaillierteren Ansichten durchführen, wie zum Beispiel Pod-Status, Flame-Diagramme und einzelne vollständige Anwendungsanforderungen. Pixie sammelt automatisch Telemetriedaten mithilfe von eBPF, das alle Telemetriedaten lokal im Cluster sammelt, speichert und abfragt und dabei weniger als 5 % der Cluster-CPU beansprucht. Zu den Anwendungsfällen für Pixie gehören In-Cluster-Netzwerküberwachung, Infrastrukturzustand, Serviceleistung und Datenbankabfrageprofilierung. Adresse: https://github.com/pixie-io/pixie
4. FastAPI
FastAPI ist ein leistungsstarkes Web-Framework zum Erstellen von APIs. Hauptmerkmale:
Schnell: Sehr hohe Leistung, auf Augenhöhe mit NodeJS und Go
Schnelle Codierung: Erhöht die Geschwindigkeit der Funktionsentwicklung um etwa 200 % bis 300 %
Weniger Fehler: Ungefähr 40 % weniger menschliche Fehler
Intuitiv: Leistungsstarke Editorunterstützung, automatische Vervollständigung überall, weniger Debugging-Zeit
Einfach: Einfach zu verwenden und zu erlernen, reduziert die Zeit zum Lesen des Dokuments.
Kurz: Codeduplizierung reduzieren.
Robust: Erhalten Sie produktionsbereiten Code mit automatischer interaktiver Dokumentation
-
Standardbasiert: Basiert auf den offenen API-Standards OpenAPI und JSON Schema und ist vollständig kompatibel mit diesen
Crystal befindet sich seit mehreren Jahren in der Entwicklung als Projekt, um einer Programmiersprache die Geschwindigkeit von C und die Ausdruckskraft von Ruby zu verleihen. Mit der Veröffentlichung von Crystal 1.0 Anfang dieses Jahres ist die Sprache nun stabil genug, um für allgemeine Arbeitslasten verwendet zu werden. Crystal nutzt statische Typisierung und den LLVM-Compiler, um eine hohe Geschwindigkeit zu erreichen und häufige Probleme wie Nullreferenzen zur Laufzeit zu vermeiden. Crystal kann mit vorhandenem C-Code kommunizieren, um die Geschwindigkeit und den Komfort weiter zu erhöhen, und es kann auch Makros zur Kompilierungszeit verwenden, um die Syntax der Basissprache zu erweitern.
Adresse: https://github.com/crystal-lang/crystal6. Windows Terminal
Windows Terminal ist ein brandneues, beliebtes und leistungsstarkes Befehlszeilen-Terminaltool. Es enthält viele Funktionen, die von der Community stark nachgefragt wurden, wie zum Beispiel: Multi-Tab-Unterstützung, Rich Text, mehrsprachige Unterstützung, konfigurierbare Themen und Stile, Unterstützung für Emoji und GPU-basierte Textwiedergabe usw. Gleichzeitig erfüllt das Terminal weiterhin unsere Ziele und Anforderungen, um sicherzustellen, dass es schnell und effizient bleibt und keine großen Mengen an Speicher und Strom verbraucht. Folgen Sie der chinesischen Linux-CommunityAdresse: https://github.com/Microsoft/Terminal
7, OBS Studio
Hochleistungsfähige Video-/Audioaufnahme und -mischung in Echtzeit. Erstellen Sie Szenen, die aus mehreren Quellen bestehen, einschließlich Fensteraufnahmen, Bildern, Text, Browserfenstern, Webcams, Aufnahmekarten und mehr. Legen Sie eine unbegrenzte Anzahl von Szenen fest, zwischen denen Benutzer mit benutzerdefinierten Übergängen nahtlos wechseln können.
- Intuitiver Audiomixer mit Filtern für jede Quelle, wie Noise Gate, Rauschunterdrückung und Verstärkung. Volle Kontrolle über die VST-Plug-in-Unterstützung.
- Leistungsstarke und benutzerfreundliche Konfigurationsoptionen. Fügen Sie neue Quellen hinzu, kopieren Sie vorhandene Quellen und passen Sie deren Eigenschaften einfach an.
- Ein optimiertes Einstellungsfeld bietet Benutzern Zugriff auf eine Vielzahl von Konfigurationsoptionen, um jeden Aspekt der Übertragung oder Aufnahme anzupassen.
- Die modulare „Dock“-Benutzeroberfläche ermöglicht es Benutzern, das Layout genau nach Bedarf neu anzuordnen. Benutzer können sogar jedes einzelne Dock in ein eigenes Fenster einfügen.
-
Adresse: https://github.com/obsproject/obs-studio
8, Shotcut
Shotcut ist ein plattformübergreifendes Videobearbeitungstool, mit dem man alle Standardkorrekturen an Audio- und Videospuren vornehmen und gleichzeitig Effekte und Ebenen anwenden kann. Shotcut hat eine sehr aktive Community und bietet jede Menge Anleitungsvideos und Tutorials, um sowohl Anfängern als auch fortgeschrittenen Videofilmern zu helfen. Es läuft auf Mac, Linux, BSD und Windows – und obwohl es plattformübergreifend ist, ist seine Benutzeroberfläche im Vergleich zu ähnlichen Tools schnell und relativ einfach zu bedienen. Adresse: https://github.com/mltframework/shotcut
9, Weave GitOps Core
Weave GitOps unterstützt effiziente GitOps-Workflows für die kontinuierliche Bereitstellung von Anwendungen in Kubernetes-Clustern. Es basiert auf der führenden GitOps-Engine CNCF Flux. Adresse: https://github.com/weaveworks/weave-gitops
10, Apache Solr
Apache Solr ist ein Volltextsuchserver, der auf Lucene basiert und die beliebteste Suchmaschine auf Unternehmensebene ist. Apache Lucene ist die zugrunde liegende Suchtechnologie hinter den Suchfunktionen der meisten von Ihnen verwendeten Software – einschließlich anderer Suchmaschinen wie Elasticsearch. Im Gegensatz zu Elasticsearch hat Solr seine Open-Source-Lizenz aufgegeben, bleibt aber weiterhin kostenlos. Solr ist Cluster-fähig, in der Cloud einsetzbar und leistungsstark genug, um Suchdienste im Cloud-Maßstab zu erstellen. Es enthält sogar einen LTR-Algorithmus zur automatischen Anpassung und Gewichtung der Ergebnisse. Adresse: https://github.com/apache/solr
11, MLflow
MLflow wurde von Databricks erstellt und von der Linux Foundation gehostet. Es handelt sich um eine MLOps-Plattform, die es Menschen ermöglicht, verschiedene Modelle und Experimente für maschinelles Lernen zu verfolgen, zu verwalten und zu warten einsetzen. Es bietet Ihnen Tools zum Aufzeichnen und Abfragen von Experimenten (Code, Daten, Konfigurationen, Ergebnisse), zum Packen von Data-Science-Code in Projekte und zum Verknüpfen dieser Projekte mit Workflows. Adresse: https://github.com/mlflow/mlflow
12, Orange
Orange möchte Data Mining „produktiv und unterhaltsam“ machen. Mit Orange können Benutzer einen Datenanalyse-Workflow erstellen, der verschiedene maschinelle Lern- und Analysefunktionen sowie Visualisierungen ausführt. Im Vergleich zu programmgesteuerten oder textbasierten Tools wie R Studio und Jupyter ist Orange sehr intuitiv. Sie können Widgets auf die Leinwand ziehen, um Dateien zu laden, die Daten mit Modellen zu analysieren und die Ergebnisse zu visualisieren. Adresse: https://github.com/biolab/orange3
13, Flutter
Flutter wurde vom Google-Ingenieurteam entwickelt, um leistungsstarke, plattformübergreifende mobile Apps zu erstellen. Flutter ist für aktuelle und zukünftige Mobilgeräte optimiert und konzentriert sich auf Eingaben mit geringer Latenz und hohen Bildraten für Android und iOS. Es bietet Entwicklern eine einfache und effiziente Möglichkeit, plattformübergreifende, leistungsstarke mobile Anwendungen zu erstellen und bereitzustellen bietet Benutzern ein schönes, schnelles und störungsfreies App-Erlebnis. Adresse: https://github.com/flutter
14, Apache Superset Dieses Tool wird in der Visualisierung verwendet. Es zeichnet sich durch Benutzerfreundlichkeit und Interaktivität aus und Benutzer können problemlos eine visuelle Analyse von Daten durchführen. Apache Superset ist auch eine Business-Intelligence-Webanwendung der Enterprise-Klasse.
Adresse: https://github.com/apache/superset
15, Presto
Presto ist eine verteilte Open-Source-SQL-Engine für die Online-Analyseverarbeitung, die in einem Cluster ausgeführt wird. Presto kann eine Vielzahl von Datenquellen abfragen, von Dateien bis zu Datenbanken, und Ergebnisse an viele Business-Intelligence- und Analyseumgebungen zurückgeben. Darüber hinaus ermöglicht Presto die Abfrage von Daten überall dort, wo sie sich befinden, einschließlich Hive, Cassandra, relationalen Datenbanken und proprietären Datenspeichern. Eine Presto-Abfrage kann Daten aus mehreren Quellen kombinieren. Facebook verwendet Presto, um interaktive Abfragen für mehrere interne Datenspeicher durchzuführen, einschließlich seines 300PB-Data-Warehouse . Adresse: https://github.com/prestodb/presto
16, Apache Arrow
Apache Arrow definiert ein sprachunabhängiges spaltenorientiertes Speicherformat für flache und hierarchische Daten, organisiert für effiziente Analysevorgänge auf modernen CPUs und GPUs. Das Arrow-Speicherformat unterstützt auch Zero-Copy-Lesevorgänge für einen blitzschnellen Datenzugriff ohne Serialisierungsaufwand. Pfeilbibliotheken sind für C, C++, C#, Go, Java, JavaScript, Julia, MATLAB, Python, R, Ruby und Rust verfügbar.
Adresse: https://github.com/apache/arrow
17、InterpretML
InterpretML 是一个开源的 Explainable AI(XAI)包,其中包含了几个最先进的机器学习可解释性技术。InterpretML 让你训练可解释的 glassbox 模型并解释黑盒系统。InterpretML 可帮助你了解模型的全局行为,或了解个别预测背后的原因。在它的许多功能中,InterpretML 有一个来自 Microsoft Research 的"glass box"模型,称为 Explainable Boosting Machine,它支持用黑盒模型的近似值进行 post-hoc 解释的 Lime。地址:https://github.com/interpretml/interpret
18、Lime
Lime(local interpretable model-agnostic explanations 的简称)是一种 post-hoc 技术,通过扰动输入的特征并检查预测结果来解释任何机器学习分类器的预测。Lime 能够解释任何具有两个或更多类的黑盒分类器,其同时适用于文本和图像领域。Lime 也被包含在 InterpretML 中。地址:https://github.com/marcotcr/lime
19、Dask
Dask 是一个用于并行计算的开源库,可以将 Python 包扩展到多台机器上。Dask 可以将数据和计算分布在多个 GPU 上,无论是在同一个系统中还是在一个多节点集群中。Dask 与 Rapids cuDF、XGBoost 和 Rapids cuML 集成,用于 GPU 加速的数据分析和机器学习。它还与 NumPy、Pandas 和 Scikit-learn 集成,以并行化其工作流程
地址:https://github.com/dask/dask
20、BlazingSQL
BlazingSQL 是一个基于 RAPIDS 生态系统构建的 GPU 加速 SQL 引擎。RAPIDS 基于 Apache Arrow 柱状内存格式,cuDF 是一个 GPU DataFrame 库,用于加载、连接、聚合、过滤和操作数据。它是 cuDF 的 SQL 接口,具有支持大规模数据科学工作流和企业数据集的各种功能。地址:https://github.com/BlazingDB/blazingsql
21、Rapids
Nvidia 的 Rapids 开源软件库和 API 套件让你有能力完全在 GPU 上执行端到端的数据科学和分析管道。Rapids 使用 Nvidia CUDA 基元进行底层计算优化,并通过用户友好的 Python 接口暴露了 GPU 的并行性和高带宽内存速度。Rapids 依赖于 Apache Arrow 柱状内存格式,包括 cuDF,一个类似 Pandas 的 DataFrame 库;cuML,一个机器学习库集合,提供 Scikit-learn 中大多数算法的 GPU 版本;以及 cuGraph,一个类似 NetworkX 的加速图分析库
地址:https://github.com/rapidsai/cudf
22、PostHog
PostHog 是一个为开发人员构建的开源产品分析平台。自动收集你网站或应用程序上的每个事件,无需向第三方发送数据。它在用户级别提供基于事件的分析,捕获你产品的使用数据以查看哪些用户在你的应用程序中执行了哪些操作。它会自动捕获点击次数和综合浏览量,以分析你的用户在做什么,而无需手动推送事件。地址:https://github.com/PostHog/posthog
23、LakeFS
LakeFS 提供了一种"以管理代码的方式管理你的数据湖"的方法,为对象存储增加了一层类似于 Git 的版本控制。这种对 Git 语义的应用让用户可以创建自己的隔离的、零拷贝的数据分支,在上面工作、实验和建模分析,而没有破坏共享对象的风险。LakeFS 为你的数据带来了有用的 commit notes、元数据字段和 rollback 选项,同时也带来了维护数据完整性和质量的验证 hooks--在一个未提交的分支被意外地合并回生产中之前,运行格式和模式检查。通过 LakeFS,管理和保护代码库的熟悉技术可以扩展到现代数据库,如 Amazon S3 和 Azure Blob 存储。地址:https://github.com/treeverse/lakeFS
24、Meltano
Meltano 是今年从 GitLab 中分离出来的,一个免费的开源 DataOps 替代传统 ELT(提取、加载、转换)的工具链。Meltano 的数据仓库框架使得为你的项目建模、提取和转换数据变得容易,并通过内置的分析工具和简化报告的仪表盘来补充集成和转换管道。Meltano提供了一个可靠的提取器和加载器库,以及对 Singer 标准的 data extracting taps 和 data loading targets 的支持,Meltano 已经是一个数据编排的动力源。25、Trino
Trino(原名 PrestoSQL)是一个分布式 SQL 分析引擎,能够对大型分布式数据源运行极快的查询。Trino 允许你同时对数据湖、关系型存储或多个不同来源执行查询,而不需要复制或移动数据进行处理。而且 Trino 与你的数据科学家可能使用的任何商业智能和分析工具配合得很好,无论是交互式的还是临时性的,最大限度地减少了学习曲线。随着数据工程师努力支持越来越多的数据源的复杂分析,Trino 提供了一种优化查询执行和加速不同来源的结果的方法。地址:https://github.com/trinodb/trino
26、StreamNative
StreamNative 是一个高度可扩展的消息和事件流平台,大大简化了实时报告和分析工具以及企业应用流的数据管道铺设。StreamNative 将 Apache Pulsar 强大的分布式流处理架构与 Kubernetes 和混合云支持等企业额外功能、大型数据连接器库、简易认证和授权以及用于健康和性能监控的专用工具相结合,既简化了基于 Pulsar 的实时应用程序的开发,又简化了大规模消息传递背板的部署和管理。地址:https://github.com/streamnative
27、Hugging Face
Hugging Face 提供了最重要的开源深度学习资源库,它本身并不是一个深度学习框架。Hugging Face 的目标是扩展到文本之外,支持图像、音频、视频、物体检测等。Infoworld 指出,深度学习从业者应在未来几年内密切关注这个 repo。地址:https://github.com/huggingface/transformers
28、EleutherAI
EleutherAI 是一个由机器学习研究人员组成的分布式小组,旨在将 GPT-3 带给所有人。2021 年伊始,EleutherAI 发布了 The Pile,是一个 825 GB 的用于训练的多样化文本数据集;并在 6 月公布了 GPT-J,一个 60 亿参数的模型,大致相当于 OpenAI 的 GPT-3 的 Curie variant。随着 GPT-NeoX 的出现,EleutherAI计划将参数一直提高到 1750 亿,以与目前最广泛的 GPT-3 模型竞争。地址:https://github.com/EleutherAI/gpt-neo
29、Colab notebooks for generative art
首先是 OpenAI 的 CLIP(对比语言-图像预训练)模型,一个用于生成文本和图像矢量嵌入的多模态模型。虽然 CLIP 是完全开源的,但 OpenAI 的生成性神经网络 DALL-E 却不是。为了填补这一空白,Ryan Murdoch 和 Katherine Crowson 开发了 Colab notebooks, CLIP 与其他开源模型(如 BigGAN 和 VQGAN)结合起来,制作 prompt-based 生成性艺术作品。这些 notebooks 基于 MIT 许可,于过去几十年间在互联网上进行了广泛传播,被重新混合、改变、翻译,并被用来生成了惊人的艺术作品。
Das obige ist der detaillierte Inhalt vonDie beste Open-Source-Softwareliste des Jahres 2021. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!