Cet article est réimprimé du compte public WeChat « Vivre à l'ère de l'information ». L'auteur vit à l'ère de l'information. Pour réimprimer cet article, veuillez contacter le compte public Vivre à l’ère de l’information.
Pour les étudiants familiarisés avec les opérations de base de données, écrire de belles instructions SQL et trouver des moyens de trouver les données dont vous avez besoin dans la base de données est une opération de routine.
Pour les étudiants familiarisés avec l'apprentissage automatique, il s'agit également d'une opération de routine consistant à obtenir des données, à prétraiter les données, à construire un modèle, à déterminer l'ensemble d'entraînement et l'ensemble de test, et à utiliser le modèle entraîné pour faire une série de prédictions sur le avenir. .
Alors, peut-on combiner les deux technologies ? Nous voyons que les données sont stockées dans la base de données et que les prédictions doivent être basées sur des données passées. Si nous interrogeons les données futures à travers les données existantes dans la base de données, est-ce réalisable ?
C'est sur cette idée que MindsDB est né.
MindsDB est un outil qui apporte l'apprentissage automatique aux bases de données SQL existantes, en connectant les données et les modèles. Il intègre des modèles d'apprentissage automatique dans des tables virtuelles de la base de données via des tables d'intelligence artificielle (AI-Tables), afin que des prédictions puissent être créées et que des requêtes puissent être effectuées à l'aide d'instructions SQL simples. Les prévisions de séries chronologiques, de régression et de classification peuvent être effectuées directement dans la base de données presque instantanément.
Avec le développement des technologies de l'information, de nombreuses industries passent lentement de « ce qui s'est passé et pourquoi cela s'est produit » basé sur l'analyse des données historiques à « ce que nous prévoyons qui se produira et comment y parvenir » basé sur des modèles de prédiction d'apprentissage automatique. MindsDB est un outil pour atteindre cet objectif.
MindsDB peut effectuer une modélisation directement dans la base de données, éliminant ainsi les maux de tête liés au traitement des données, à la création de modèles d'apprentissage automatique et à d'autres étapes. Les analystes de données et les analystes commerciaux n'ont pas besoin de connaissances approfondies en ingénierie ou en modélisation de données pour les utiliser immédiatement.
Voyons donc comment MindsDB implémente une telle opération.
Par exemple, nous avons un tableau de données qui stocke les données sur les prix des logements et le PIB d'une ville. Ensuite, si nous voulons interroger les prix des logements et le PIB. Vous pouvez utiliser du SQL similaire à celui-ci pour interroger :
select gdp, houseprice from city;
Ensuite, nous pouvons voir que le PIB et les prix de l'immobilier peuvent avoir une relation linéaire. Si nous voulons interroger le prix du logement correspondant à une certaine valeur du PIB, nous pouvons écrire
select gdp, houseprice from city where gdp=10000;
. Cependant, que se passe-t-il si les données du PIB interrogées n'existent pas dans la base de données ?
A ce moment, le tableau de l'intelligence artificielle apparaît.
Nous pouvons d'abord créer un modèle de prévision du prix de l'immobilier :
create predictor mindsdb.price_model from city predict houseprice;
De cette façon, MindsDB créera automatiquement le modèle en arrière-plan. À l’heure actuelle, nous pouvons utiliser ce modèle pour interroger la valeur prévue des prix de l’immobilier correspondant aux données du PIB qui ne figurent pas dans la base de données.
sélectionnez le prix du logement dans mindsdb.price_model où gpd=20000;
De cette façon, nous obtiendrons la valeur de prédiction du modèle basée sur les données historiques.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!