본문 바로가기

경제학/계량경제학(Econometrics)

계량경제 분석에 이용되는 자료들

1.횡단면 자료(cross-sectional data)

 

 

 

 어느 한 시점에서 경제주체들로부터 얻은 자료를 말한다. 계량경제1 혹은 introduction에서 다루는 데이터는 대부분 횡단면 자료이고 횡단면 자료를 토대로 OLS를 도입한다. 아례 예시에서 볼 수 있듯이 한 시점에 관측되는 주체들의 임금(wage), 교육수준(educ), 노동경력(exper), 여성 여부(female), 결혼상태(married)등이 있다.

 

 

 

<임금과 개인 특성 변수들의 횡단면 자료>

obsno wage educ exper female married
1 3.10 11 2 1 0
2 3.24 12 22 1 1
3 3.00 11 2 0 0
4 6.00 8 44 0 1
. . . . . .
. . . . . .
. . . . . .
525 11.56 16 5 0 1
526 3.50 14 5 1 0

 

 

 

 

 

 

2.시계열 자료(time series data)

 

 

 

 time series data는 변수들을 시간에 걸쳐 관측하여 얻는 자료이다. 주가, 통화량, 소비자 물가지수, GDP, 연간 범죄율, 자동차 판매 대수 등등 경제 분석에 사용되는 다양한 변수들로 시계열 자료를 구성할 수있다, 그런데 횡단면 자료와 다른 점은 시계열 자료는 시간이 중요한 고려 요소이다. 즉, 어느 시점 t의 자료가 존재한다면 t시점 이전의 과거의 자료가 t시점에 영향을 끼칠 수 있는 것이다. 이는 시계열 자료의 중요한 특성으로서 좀 더 고오급의 통계 및 계량 지식을 필요로 한다.
 혹은 빈도(data frequency), 계절성(seasonality)등의 이슈가 시계열 분석에 주의를 요한다. 아래의 표는 연도에 따른 평균 최저임금, 최저임금제의 영향을 받는 노동자의 비율, 실업률, 해당 연도의 실질 GDO이다. 이 자료를 이용하여 최저임금이 고용에 미친 영향에 대한 시계열 분석을 할 수 있을 것이다.

 

 

 

<푸에르토리코의 최저임금과 실업 및 기타 변수들의 자료>

obsno year avgmin avgcov prunemp prgnp
1 1950 0.20 20.1 15.4 878.7
2 1951 0.21 20.7 16.0 925.0
3 1952 0.23 22.6 14.9 1015.9
. . . . . .
. . . . . .
. . . . . .
37 1986 3.35 58.1 18.9 4281.6
38 1987 3.35 58.2 16.8

4496.7

 

 

 

 

 

 

3.통합된 횡단면 자료(pooled cross section data)

 

 

 

 횡단면으로서의 성질과 시계열로서의 성질을 모두 가지고 있는 데이터이다. 이를 테면 횡단면 가계조사가 1985년과 1990년에 각각 한 번 씩 두 차례 진행되었다고 한다면 이 둘 데이터를 통합한 것이 pooled cross section data이다. 통합된 횡단면은 일반 횡단면의 경우와 유사하게 분석되지만, 시간에 걸친 차이를 고려해야 하는 경우가 많다.

 

 

 

<2개년의 주택 매매가격>

obsno year hprice proptax sqrft bdrms bthrms
1 1993 85500 42 1600 3 2.00
2 1993 67300 36 1400 3 2.5
3 1993 134000 38 2000 4 2.5
. . . . . . .
. . . . . . .
. . . . . . .
250 1993 243600 41 2600 4 3.0
251 1995 65000 16 1250 2 1.0
252 1995 182400 20 2200 4 2.0
253 1995 97500 15 1540 3 2.0
. . . . . . .
. . . . . . .
520 1995 57200 16 1100 2 1.5

 

 

 

 

 

 

4.패널 자료(panel data) 또는 종단 자료(longitudinal data)

 

 

 

 마찬가지로 횡단면과 시계열 데이터를 합친 것이다. 앞선 pooled cross section data와의 차이점은 동일한 횡단면 개체들이 일정 기간 동안 추적된다는 것이다. 이를 테면 위의 2개년의 주택 매매가격의 예시는 동일한 주택이 관측된 것이 아니기 때문에 panel data가 아니다. 아래의 예시를 보면 도시에 넘버링을 부여하고 2개 연도를 관측하여 데이터를 만들었다. panel data는 동일한 개체에 대하여 여러 관측값을 갖게 되어 개체들의 어떤 비관측 특성들을 통제할 수 있다는 이점과 단일 횡단면으로는 인과관계를 추론하기 어려울때 panel data는 인과적 추론을 할 수 있게된다. 또한 행동 또는 의사결정 결과에 보이는 시차의 중요성을 연구할 수 있도록 해준다. 많은 경제 정책의 효과는 어느 정도 시간이 지난 후에나 나타날 것으로 기대되므로 이러한 정보는 중요할 수 있다.

 time series data와 마찬가지로 panel data를 다루는 지식은 횡단면 자료를 다루는 그것보다 복잡하고 방대하다.

 

 

 

<2개 연도의 도시별 범죄 통계>

obsno city year murder population unem police
1 1 1986 5 350000 8.7 440
2 1 1990 8 359200 7.2 471
3 2 1986 2 64300 5.4 75
4 2 1990 1 65100 5.5 75
. . . . . . .
. . . . . . .
. . . . . . .
297 149 1986 10 260700 9.6 286
298 149 1990 6 245000 9.8 334
299 150 1986 25 543000 4.3 520
300 150 1990 32 546200 5.2 493

 

 

 

 

 

 

 

 

 

 

참고도서 : 계량경제학1(Wooldridge)