stata 패널 데이터 회귀 단계:
1단계: 데이터 가져오기
명령:
insheet using 文件路径
예:
insheet using C:STUDYpapertaxi.csv
참고: 테이블, 그렇지 않으면 실수로 나타날 것입니다. 패널 데이터에는 null 값이 있을 수 없습니다. 데이터가 없는 위치를 0으로 바꿔주세요.
그림과 같이 데이터를 직접 stata의 데이터 편집기에 복사하여 붙여넣을 수도 있습니다.
2단계: 형식 조정
먼저 샘플을 나타내는 var1의 이름을 변경하세요
명령:
rename var1样本名
예:
rename var1 province
다음으로 데이터를 패널 데이터 형식으로 변환합니다
명령:
reshape long var,i(样本名)
예:
reshape long var,i(province)
여기서 var는 모든 연도(var2, var3, var4...)를 나타냅니다.
변환된 형식은 다음과 같습니다. 그림:
변환이 성공한 후 계속 이름을 바꿉니다. 여기서 _j는 원본 테이블의 연도를 나타내고, var는 변수 이름을 나타내며, 명령은 다음과 같습니다.
rename _j year rename var taxi
Step 3: Sort
명령: sort 변수 이름
예:
sort province year
는 그림과 같이 지방을 오름차순으로 정렬한 다음 배열된 지방 번호 순서에 따라 연도 열을 정렬하는 것을 의미합니다.
(정렬을 실행하기 전에 이미 데이터가 일치하는 경우가 많았지만 혹시 모르니 이렇게 하세요)
마지막으로 저장합니다.
이제 하나의 변수에 대한 예비 데이터 처리가 완료되었습니다. 모든 변수를 동일한 방식으로 처리해 주세요. 새 변수를 처리하기 전에 상태를 재설정하려면 다음 명령을 사용하십시오.
여기에서는 편의상 so2라는 변수를 처리합니다. 그림과 같이:
관련 권장사항: "FAQ"
4단계: 데이터 병합
처리된 변수의 dta 파일을 기본 테이블로 엽니다(dta 사용을 권장함)
명령: 파일 경로를 사용하여 샘플 이름 시간 병합
예:
merge province year using C:STUDYpapertaxi.csv
는 다음과 같이 so2의 데이터 테이블에 택시 데이터를 추가한다는 의미입니다. 그림:
그런 다음 다음 명령을 사용하십시오.
tab _merge
데이터의 차이를 확인하십시오. 일반적인 상황에서는 그림에 표시된 대로 _merge: 3 열의 백분율이 100%여야 합니다.
그런 다음 drop _merge 명령을 사용하여 데이터 테이블에서 _merge 열을 제거합니다.
그런 다음 다음 명령을 다시 사용하세요. sort 샘플 이름 시간
예: sort Province year를 사용하여 새로 생성된 테이블을 정렬하세요.
마찬가지로 그림과 같이 기본 테이블에 모든 변수를 추가합니다.
Regression
먼저 xtset 샘플 이름 시간 명령을 사용하여 패널 데이터를 정의합니다.
예:
xtset province year
표시된 바와 같이:
그런 다음 다음 명령을 사용하십시오.
xtreg 종속 변수 독립 변수로 회귀 분석을 수행합니다.
예:
xtreg so2 taxi busload drivers roadlength
표시된 바와 같이:
위 내용은 Stata 패널 데이터 회귀 단계는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!