> 백엔드 개발 > 파이썬 튜토리얼 > 어린이의 호기심: 데이터 과학의 놀라운 기초

어린이의 호기심: 데이터 과학의 놀라운 기초

Mary-Kate Olsen
풀어 주다: 2025-01-04 02:12:39
원래의
178명이 탐색했습니다.

The Curiosity of a Child: A Surprising Foundation for Data Science

만약 5살 아이에게 데이터 과학을 설명하라고 하면 아마도 이렇게 대답할 것입니다. “마치 탐정이 된 것 같아요! 단서(데이터)를 수집하고, 단서가 어떻게 결합되는지 파악하고(데이터 분석 및 정리), 이를 사용하여 미스터리를 풀거나 다음에 무슨 일이 일어날지 추측합니다(결과 예측).”

데이터 과학은 탐정이나 높은 학위를 가진 성인만을 위한 것이 아닙니다. 아마도 당신은 자신도 모르게 데이터 과학 원리를 일상 생활에 적용했을 것입니다. 저를 예로 들어보겠습니다.

저는 자라면서 생각을 멈추지 않는 호기심 많고 조용한 아이였습니다. 겉으로는 별 말을 하지 않았지만 머릿속으로는 온통 시장이었다. 누구도 눈치 채지 못할 것 같은 점들을 연결하고, “이게 왜 이럴까?”라는 평범한 질문이 아닌 끝없는 질문을 던졌습니다. 하지만 좀 더 호기심이 많은 사람들은 “언제 그런 일이 일어날까요? 무엇이 일어날 수 있습니까?” 어른이 된 지금도 질문을 너무 많이 하는 나쁜 버릇이 있어요. 한 친구가 나에게 “아이처럼 질문하는군요!”라고 말한 적이 있습니다. 칭찬으로 받아들였어요.

어렸을 때 특히 NEPA(현재 PHCN)처럼 예측할 수 없는 것에 관해서는 무의식적으로 데이터 과학 원칙을 받아들이게 된 것은 이러한 호기심 때문이었습니다. 나이지리아에 살아본 적이 있다면 정전이 너무 흔해서 불빛이 들어오는 것이 작은 축하 행사처럼 느껴졌다는 것을 아실 것입니다. 나는 그 모든 것이 예측 불가능하다는 것을 싫어했기 때문에 관심을 갖기 시작했습니다. NEPA 코드를 해독하는 일은 제가 직접 맡았습니다.

내 노트가 나의 미니 데이터베이스가 되었습니다. 나는 NEPA의 행동 패턴을 관찰하고 전원이 꺼질 때와 다시 켜질 때마다 기록했습니다. (데이터 수집). 저는 학교에서 집에 오면 즉시 엄마나 집에 있는 누구에게나 “그들이 조명을 가져왔나요?”라고 물었습니다. 언제 가져갔나요?” 나는 내가 알아차린 것을 기록했습니다. 즉, 빛이 얼마나 오래 머물렀는지, 언제 켜졌는지, 언제 꺼졌는지 기록했습니다. 그것은 마치 의식과 같았습니다. 전원 공급 장치의 "상태 업데이트"를 알아야 했습니다.

시간이 지남에 따라 공휴일, 축제 시즌, 기상 조건, 축구 경기 등 패턴과 외부 요인을 고려했습니다. 시간이 좀 걸렸지만 트렌드를 알아차리기 시작했습니다. 예를 들어, 폭우가 내리면 전선이 "건조"되는 데 시간이 필요하기 때문에 몇 시간 동안 조명을 가져오지 못할 것이라는 것을 알았습니다. 또는 나이지리아가 축구 경기를 한다면 NEPA가 관대하다고 느낄 가능성이 높았습니다. 오늘 NEPA 모델을 구축한다면 국가 전력망이 붕괴되는 횟수(격주로 느껴짐)와 같은 더 복잡한 변수를 고려해야 합니다.

이러한 패턴을 사용하여 '멘탈 모델'을 만들었습니다. 전원 공급 장치는 예측할 수 없었지만 어느 정도 예측할 수 있었습니다. 형제자매와 이웃은 저를 내부 정보를 갖고 있는 것처럼 대하기 시작했고 저는 "NEPA 예보관"이라는 비공식 직함을 얻었습니다. 빛이 돌아오나요?” 그러면 저는 "2시간만 주면 될 거예요."라고 자신있게 대답했습니다.

물론, 데이터가 완벽하지는 않았습니다. NEPA는 여러 번 "내 손을 잡았습니다". 가끔 생각했던 대로 전원이 들어오지 않거나, 갑자기 전원이 꺼지는 경우도 있었습니다. 하지만 대부분의 경우 내 예측은 놀라울 정도로 정확했습니다. 그래서 이러한 불일치 사례를 걸러내고(데이터 클리닝) 패턴을 찾는 데 집중했습니다.

돌이켜보면 핵심 데이터 과학 프로세스를 계속 적용하고 있었다는 것을 깨달았습니다.
데이터 수집: 전원 공급 장치가 언제, 언제, 얼마나 오래 머물렀는지에 대한 정보를 수집했습니다.
데이터 정리 및 준비: 관련 없는 세부 정보를 제거하고 기상 조건이나 시간과 같은 주요 변수에 집중했습니다.
탐색적 데이터 분석(EDA): 전원 공급 장치가 어떻게 작동하는지 이해하기 위해 노트에서 패턴을 찾았습니다.
데이터 모델링: 제가 파악한 패턴을 바탕으로 언제 힘이 돌아올지 예측하는 '멘탈 모델'을 만들었습니다.
모델 평가: 현실과 비교하여 예측을 테스트했습니다. 예상대로 불이 들어오지 않으면 모델을 조정했습니다.
모델 배포: 내 "모델"은 다른 사람들에게 유용해졌습니다. 내 형제자매와 이웃은 내 예측에 의존하여 결정을 내렸습니다.

웃기게 들리겠지만 어린 시절 NEPA를 사용한 이 실험은 제가 처음으로 데이터 과학을 접한 순간이었습니다. 데이터 과학은 단순한 숫자, 차트, 알고리즘 그 이상입니다. 제가 어렸을 때 권력 예측을 했을 때와 마찬가지로 실제 문제를 해결하는 것입니다. 예, 데이터 과학은 복잡할 수 있지만 그 핵심은 구조화된 호기심일 뿐입니다. 즉 우리 모두가 우리 안에 가지고 있는 것입니다. 그리고 저에게는 이 모든 것이 NEPA와 노트북에서 시작되었습니다.

시간이 지남에 따라 데이터 과학의 다양한 개념과 프로세스뿐만 아니라 해결할 수 있는 문제와 만들 수 있는 솔루션도 탐색해 보겠습니다. 데이터 세트를 분석하든, 삶을 개선하기 위한 통찰력을 찾든, 데이터 과학은 우리 모두가 더 나은 결정을 내리는 데 사용할 수 있는 도구입니다.

한 번에 하나의 단서, 하나의 패턴, 하나의 예측을 함께 살펴보세요!

위 내용은 어린이의 호기심: 데이터 과학의 놀라운 기초의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿