Maison > développement back-end > Tutoriel Python > La curiosité d'un enfant : un fondement surprenant pour la science des données

La curiosité d'un enfant : un fondement surprenant pour la science des données

Mary-Kate Olsen
Libérer: 2025-01-04 02:12:39
original
116 Les gens l'ont consulté

The Curiosity of a Child: A Surprising Foundation for Data Science

Si vous me demandiez d’expliquer la science des données à un enfant de 5 ans, je dirais probablement quelque chose comme ceci : « C’est comme être un détective ! Vous collectez des indices (données), déterminez comment ils s’articulent (analysez et nettoyez les données) et utilisez-les pour résoudre des mystères ou deviner ce qui pourrait se passer ensuite (prédire les résultats). »

La science des données n'est pas réservée aux détectives ou aux adultes titulaires de diplômes sophistiqués. Il y a de fortes chances que vous ayez probablement appliqué les principes de la science des données dans votre vie quotidienne, même sans vous en rendre compte. Prenez-moi, par exemple.

En grandissant, j'étais un enfant curieux et calme qui n'arrêtait jamais de réfléchir. Extérieurement, je ne disais pas grand-chose, mais dans ma tête, c’était tout un marché. J'ai connecté des points que personne d'autre ne semblait remarquer et j'ai posé des questions sans fin, et pas seulement le typique « Pourquoi est-ce comme ça ? » mais les plus curieux : « Quand est-ce que ça arrivera ? Qu’est-ce qui pourrait faire en sorte que cela se produise ? Même maintenant, en tant qu’adulte, j’ai la mauvaise habitude de poser trop de questions. Un ami m’a dit un jour : « Tu poses des questions comme un enfant ! » Je l'ai pris comme un compliment.

C'est cette curiosité qui m'a amené à adopter sans le savoir les principes de la science des données lorsque j'étais enfant, en particulier lorsqu'il s'agissait de quelque chose d'aussi imprévisible que la NEPA (maintenant PHCN). Si vous avez déjà vécu au Nigeria, vous savez que les pannes de courant étaient si fréquentes que l’allumage de la lumière ressemblait à une mini fête. Je détestais l’imprévisibilité de tout cela, alors j’ai commencé à y prêter attention. J'ai pris sur moi de déchiffrer le code NEPA.

Mon carnet est devenu ma mini base de données. J’ai observé les schémas de comportement de la NEPA et j’ai enregistré chaque fois que le courant était coupé et quand il était rétabli. (Collecte de données). Je rentrais de l'école et je demandais immédiatement à ma mère ou à quiconque était à la maison : « Est-ce qu'ils ont apporté la lumière ? Quand l’ont-ils pris ? J'écrivais ce que j'avais remarqué : combien de temps la lumière restait allumée, à quelle heure elle s'allumait et quand elle s'éteignait. C'était comme un rituel ; J'avais besoin de connaître la "mise à jour de l'état" de l'alimentation.

Au fil du temps, j'ai pris en compte des modèles et des facteurs externes tels que les jours fériés, les périodes de fêtes, les conditions météorologiques, les matchs de football, etc. Cela a pris un certain temps, mais j'ai commencé à remarquer des tendances. Par exemple, s’il y avait une forte averse, je savais qu’ils n’apporteraient pas de lumière pendant des heures parce que, eh bien, les fils avaient besoin de temps pour « sécher ». Ou si le Nigeria jouait un match de football, il y avait de fortes chances que la NEPA se montre généreuse. Si je construisais le modèle NEPA aujourd’hui, je devrais tenir compte de variables plus complexes, comme le nombre de fois où le réseau national s’effondre (ce qui semble être une semaine sur deux).

En utilisant ces modèles, j'ai créé un « modèle mental ». Aussi imprévisible que soit l'alimentation électrique, je pouvais encore la prédire dans une certaine mesure. Mes frères et sœurs et mes voisins ont commencé à me traiter comme si j'avais des informations privilégiées et j'ai gagné le titre officieux de « prévisionniste NEPA ». la lumière revient ? et je répondrais avec assurance : « Donnez-leur deux heures, ça viendra. »

Bien sûr, les données n’étaient pas parfaites. La NEPA m'est « tombée entre les mains » à plusieurs reprises. Parfois, le courant ne revenait pas quand je le pensais, ou il se coupait de manière inattendue. Mais pour la plupart, mes prédictions étaient étonnamment exactes. J'ai donc filtré ces cas incohérents (nettoyage des données) et me suis concentré sur la recherche de modèles.

Avec le recul, je me rends compte que j'appliquais depuis le début les processus de base de la science des données :
Collecte de données : j'ai recueilli des informations sur l'alimentation électrique : quand elle est arrivée, quand elle est tombée et combien de temps elle est restée.
Nettoyage et préparation des données : j'ai supprimé les détails non pertinents et me suis concentré sur des variables clés, comme les conditions météorologiques ou l'heure de la journée.
Analyse exploratoire des données (EDA) : j'ai recherché des modèles dans mes notes pour comprendre comment fonctionnait l'alimentation électrique.
Modélisation des données : j'ai créé un « modèle mental » pour prédire quand le courant reviendrait en fonction des modèles que j'avais identifiés.
Évaluation du modèle : j'ai testé mes prédictions par rapport à la réalité. Si la lumière ne s’allumait pas au moment prévu, j’ajustais mon modèle.
Déploiement du modèle : mon « modèle » est devenu utile aux autres : mes frères et sœurs et mes voisins se sont appuyés sur mes prévisions pour prendre des décisions.

Aussi drôle que cela puisse paraître, cette expérience d'enfance avec NEPA a été mon premier aperçu de la science des données. La science des données ne se résume pas à des chiffres, des graphiques et des algorithmes. Il s’agit de résoudre des problèmes du monde réel, tout comme je l’ai fait avec mes prédictions de pouvoir lorsque j’étais enfant. Oui, la science des données peut être compliquée, mais à la base, il s’agit simplement d’une curiosité structurée – quelque chose que nous avons tous en nous. Et pour moi, tout a commencé avec NEPA et un cahier.

Au fil du temps, nous explorerons non seulement les différents concepts et processus de la science des données, mais également les problèmes que nous pouvons résoudre et les solutions que nous pouvons créer. Qu'il s'agisse d'analyser un ensemble de données ou de trouver des informations pour améliorer la vie, la science des données est un outil que nous pouvons tous utiliser pour prendre de meilleures décisions.

Plongeons ensemble : un indice, un modèle et une prédiction à la fois !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:dev.to
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal