Python/Pandas가 도입된 이후 Excel을 사용하여 테이블을 처리하고 시각화하는 데 속도가 매우 빠르다는 개발자가 많습니다. 하지만 이는 여전히 큰 결점을 갖고 있다. 수술은 시각적인 형태가 아니기 때문에 더 높은 수준의 기술이 필요하다. 최근 개발자들은 Python과 Excel의 장점을 완벽하게 결합한 웹 기반 스프레드시트 애플리케이션인 Grid studio라는 오픈 소스 프로젝트를 구축했습니다.
네, 하나의 인터페이스에서 시각적인 테이블과 코드를 동시에 표시하고, 동시에 테이블과 코드를 통해 데이터를 수정하는 것은 파이썬과 엑셀의 조합 아닌가요?
프로젝트 주소: https://github.com/ricklamers/gridstudio
먼저 그리드 스튜디오의 효과가 어떤지 살펴보겠습니다. 일반적으로 Python을 통해 데이터를 로드하고 처리할 수 있으며 Excel을 통해 데이터를 조작할 수 있습니다.
파이썬에서 데이터를 처리하는 것이 이해하기 쉽습니다. 테이블에서 데이터를 처리하는 것은 실제로 Excel과 매우 유사합니다.
테이블의 일부 데이터를 변경한 다음 이를 NumPy 배열로 가져와 추가 작업을 수행할 수도 있습니다.
관련 추천: "Python Video Tutorial"
이 도구를 만드는 이유는 무엇입니까?
저자는 주로 데이터 사이언스 프로젝트에서 분산된 워크플로 문제를 해결하기 위해 그리드 스튜디오를 만들었다고 말했습니다. 이러한 프로젝트에서는 R 스튜디오와 Excel 등 여러 도구를 전환해야 합니다.
수백만 번째 CSV 파일을 내보낼 때 행 수가 너무 많으면 응용 프로그램 창이 정지됩니다. JSON 파일을 읽는 것만큼 간단한 일이라도 누군가를 미치게 만들 수 있습니다. 기존 도구는 효율적인 작업에 필요한 환경 및 관련 워크플로우를 제공하지 않기 때문에 저자는 이 도구를 구축하기로 결정했습니다. 그는 데이터 과학 워크플로를 통합할 수 있는 사용하기 쉬운 애플리케이션을 만들고 싶었습니다.
이 도구의 주요 특징은 무엇입니까?
Grid studio는 Google Sheets 및 Microsoft Excel과 유사한 웹 기반 애플리케이션입니다. 그러나 그 킬러 기능은 Python 언어의 통합입니다.
테이블을 사용하여 데이터를 보고 편집하는 것은 컴퓨터를 사용해 본 거의 모든 사람에게 자연스러운 일입니다. 이 간단한 UI를 Python과 같은 성숙한 프로그래밍 언어와 결합하는 것은 사용하기 쉽지 않습니다.
Python에서 스크립트를 작성하는 것은 매우 쉽습니다. 코드 몇 줄을 작성하고 직접 실행하면 됩니다.
핵심 통합: 읽기, 쓰기
이 Python 통합의 핵심은 스프레드시트에 대한 읽기 및 쓰기 인터페이스로, Python 프로세스 연결에서 스프레드시트 데이터와 데이터 간에 고성능 인터페이스를 구축할 수 있습니다.
다음과 같은 방법으로 테이블에 데이터를 쓸 수 있습니다:
sheet("A1:A3", [1, 2, 3])
다음 방법으로 테이블에서 데이터를 읽습니다.
my_matrix = sheet ( "A1:A3")
데이터 입력, 추출, 시각화 및 기타 프로세스를 자동화하는 간단하고 효율적인 방법으로 테이블에서 직접 데이터를 읽거나 쓸 수 있습니다.
맞춤형 테이블 함수 작성
간단한 인터페이스를 통해 읽고 쓰는 것은 매우 유연하지만 때로는 직접 호출할 수 있는 맞춤 함수를 작성하는 것도 중요합니다.
AVERAGE, SUM, IF 등 기본 함수 외에 다른 함수도 필요할 수 있으니 그냥 적어두세요!
def UPPERCASE(a):
return str(a).uppercase()
이 코드 줄을 작성한 후 일반 함수를 호출하는 것처럼 테이블의 함수를 호출합니다.
Python 생태계 활용
Python 생태계의 다양하고 강력한 소프트웨어 패키지를 활용하여 최신 데이터 과학 도구에 즉시 액세스할 수 있으므로 선형 회귀 및 지원 벡터 머신 등과 같은 강력한 모델에 빠르게 액세스할 수 있습니다.
그리드 스튜디오는 주로 표 형식의 데이터를 처리하기 때문에 이를 기능으로 사용하면 SVM과 같은 모델을 빠르게 호출하여 이러한 데이터 뒤에 숨겨진 기능을 탐색할 수 있습니다.
데이터 시각화
데이터 과학에서 매우 일반적인 작업은 데이터를 시각화하여 데이터에 대한 "사전 지식"을 얻는 것입니다. 대화형 플로팅 라이브러리 Plotly.js와 Python 표준 시각화 라이브러리 Matplotlib를 통합함으로써 Grid studio에는 이제 고급 플로팅 기능이 내장되어 있습니다. 아래와 같이 벡터 테이블 형식에서 고급 그리기 기능을 사용할 수 있습니다.
Grid 스튜디오의 기능을 사용하여 시각적 아이콘을 만드는 방법을 더 자세히 설명하기 위해 프로젝트 작성자는 웹 페이지 크롤링과 데이터 시각화라는 두 가지 사례도 보여주었습니다. 분포이지만 여기서는 주로 첫 번째 경우를 보여줍니다.
사례: 정규 분포 추정
다음 사례는 Plotly.js를 통해 정규 분포를 더 높은 정확도로 시각화하는 방법을 보여줍니다.
사용 및 설치
이전에 소개된 기능이 이렇게 많은데 어떻게 사용할까요? Grid studio는 설치 및 사용이 매우 간단하며 간단한 명령줄로 수행할 수 있습니다.
git clone https://github.com/ricklamers/gridstudio
cd Gridstudio && ./run.sh
위와 같이 프로젝트를 다운로드하고 설치 스크립트를 실행하면 브라우저에서 로컬 포트를 열 수 있고, 그러면 행복하게 사용하실 수 있습니다.
위 내용은 Python이 있으면 Excel이 여전히 필요합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!