https://bkshin.tistory.com/category/%EB%8D%B0%EC%9D%B4%ED%84%B0%20%EB%B6%84%EC%84%9D

'통계학 공부' 카테고리의 다른 글

Bayesian Statistics  (0) 2021.07.08

https://blog.naver.com/ssm6410/221742589179

'통계학 공부' 카테고리의 다른 글

기본 통계 정리  (0) 2021.07.09

www.index.go.kr/unify/idx-info.do?idxCd=8040

 

국가지표체계 - 자살률

인구 10만 명당 자살 사망자수임. 통계청 「사망원인통계」로 집계함.

www.index.go.kr

그래프/통계표

자살률 그래프
자살률 통계표

정의

  • 인구 10만 명당 자살 사망자수임. 통계청 「사망원인통계」로 집계함

 

해설

  • 모든 자살이 삶의 만족도가 낮기 때문에 발생한다고 보기는 어렵지만, 대체로 삶의 만족도와 자살률은 서로 관계가 있다.
  • 2010년을 전후로 인구 10만 명당 30명을 넘은 적도 있으나 이후 감소 추세로 돌아서 2019년 현재 26.9명으로 집계되고 있다. 
  • 한국은 다른 나라들에 비해 자살률이 월등히 높다. 한국의 자살률은 비교대상 국가들 가운데 최상위 수준으로 OECD 평균보다 두 배 가량 높다. 
  • 자살률은 남자가 여자보다 두 배 이상 높고 나이가 들수록, 특히 70대 이상에서 높다.

 

출저

  • 통계청, 「사망원인통계」, 행정안전부, 「주민등록인구현황」 *자료 : 통계청, 「사망원인통계」 각 연도, 행정안전부, 「주민등록인구현황」 각 연도

 

마르코프 체인이란

을 만족하는 확률변수들의 수열들을 말한다.

위에 식은 MDP(Markov Decision Process)에서 전이 확률(transition probability)을 나타낸다.

 

Markov definition

마르코프 체인의 정의는 마르코프 성질을 가진 이산 확률과정을 말한다.

A stochastic process, it is a discrete time Markov Chains (DTMC) i,j ∈ Ω

- Ω is discrete 

- Indexed by discrete sequence of times

- Countable number of states / [ Ω ⊆ Ζ ] / Omega subset integers

 

Markov Property

마르코프의 성질은 '특정 상태의 확률은 오직 과거의 상태에 의존한다'라는 것이다.

The probability of Xn+1, given all past values of {Xn} is equal to the probability of Xn+1 given only Xn

즉, The probability of future event depends only on the current value not on past values.

미래의 확률은 과거의 가치에 상관 없이 오직 현재의 가치에 의해서 결정된다.

 

Markov Chain often assume the process is time-homogeneous

P(Xn+1 = j | Xn = i) is the same for all times n. <- this is called the one-step transition probability.

- Pij = P(Xn+1=j | Xn = i) , i is current state j is state of system 1 step later.

 

쉽게 설명을 하자면, 오늘 비가 왔으니 내일 비가 올지 안올지 확률적으로 표현 할 수가 있는데

이처럼 연속적인 현상을 단순히 표현할 때 마르코프 체인을 가정하여 사용 가능하다는 것

 

Three important properties of a Markov Chain:

1. Transient Distribution: Marginal distin of Xn, or fixed n

2. Occupancy Times: Expected amount of time the DTMC spends in a given state

3. Limiting Behavior: what happens as t -> ∞

WHY? 사용하는가?

- we can represent a lot of simple stochastic system as MCs.

ex) biology, inventory system, queueing systems, computer and telecomm, economics, physics, etc.

- DTMCs are often the building block for more complex stochastic models.

종종 단순한 모델이 강력한 효과를 발휘하기 때문에, 실제로 예측을 하려면 엄청나게 복잡한 변수들과

모델링을 거쳐서 엄선해야하는데, 마르코프 체인을 사용함으로써 기회 비용을 크게 줄이면서 이에 근접한

효과를 낼 수 있기 때문

 

markov chain image

 

마르코프 체인 계산 방법

마르코프 행렬은 전이행렬을 가지고 있는데

전이행렬의 각 상태의 확률은 일반적으로 행을 취합니다

X(t+1) = P *X(t)

 

X(0)

X(1) = P*X(0)

X(2) = P*X(1) = P * P * X(0) = P^2 * X(0)

X(t) = P^t * X(0)

 

X(t) <- 상태행렬 : 모든 성분의 합이 1

P <- 전이행렬(추이 행렬)

 

마르코프 체인의 성질

전이행렬을 계속 곱해주다 보면 변하지 않는 상태가 오는데 (수렴한다)

시간이 지나면 확률의 일정한 값에 수렴해가고 변하지 않는다. 안정상태 (Steady state)

 

상태행렬은 어떤 행렬 X로 수렴한다

이 행렬 X는 P를 곱해도 변하지 않는다

 

즉, PX = X

X 를 안전상태의 확률행렬이라 한다

 

How to get X?

1. 전이행렬 P를 계속 곱해주기

2. X(t) = p^t * X(0), 대각화로 P^t 계산 후에 X(t)를 구하기    ----- 대각화 공부하기

3. PX = X, X는 연립일차방정식 (P-1)X = 0의 해이다.

 

마르코프 체인 사용 예시

example 1 : forcasting the Weather

example 2 : Random Walk

example 3 : A Gambler

구글 페이지 랭크 알고리즘 - 마지막에 머무는 페이지의 퍼센트를 확인해서 랭크로 표시.

http://www.index.go.kr/potal/main/EachDtlPageDetail.do?idx_cd=1080

 

e-나라지표 지표조회상세

--> 그래프/통계표 ○ 그래프 - 주가지수 추이 한국거래소「증권선물」 ○ 통계표 - 주가지수 ○ 통계표 목록 의미분석 ○ 지표설명 [지표 설명] ■ 주가지수 및 코스닥종합지수 개념 및 의

www.index.go.kr

그래프/통계표

단위 P 2016 2017 2018 2019 2020/01 2020/02 2020/03 2020/04 2020/05
코스피 2,026.46 2,467.49 2,041.04 2,197.67 2,119.01 1,987.01 1,754.64 1,947.56 2,029.60
코스닥 631.44 798.42 675.65 669.83 642.48 610.73 596.07 654.18 713.68

 

의미 분석

지표설명

 

주가지수 및 코스닥종합지수 개념 및 의의

 

  ㅇ 주가지수 및 코스닥 종합지수란 한국거래소에 상장 및 등록되어 있는 주식의 시장가격을 토대로 작성되며, 전반적인 주가의 동향을 가장 잘 나타내주는 대표적인 지수

 

  ㅇ 지수의 산출은 기준시점의 주가수준을 주가지수의 경우 100,코스닥 종합지수의 경우 1,000으로 하여 비교시점의 주가변동을 시가총액 방식으로 측정하게 되는데 현재의 주가지수 및 코스닥 종합지수는 각각 1980년 1월 4일, 1996년 7월1일을 기준시점으로 하여 산출

 

※  시가총액방식 주가지수 = 비교시점의 주식 시가총액 / 기준시점의 주식 시가총액 x 100

 

지표해석

 

■ 주가지수 변동

 

 ㅇ 코스피 지수 : 2019년 12월말 2,197.67pt로 전년말 대비 156.63pt(7.67%) 상승

 

 ㅇ 코스닥 지수 : 2019년 12월말 669.83pt로 전년말 대비 5.82pt(0.9%) 하락

 

 

■ 추이분석

 

 ㅇ 코스피 지수 : 미중 무역협상 진전 영향 등으로 대형주 중심으로 상승

 

   * 대형주 +11.7% > 소형주 +4.3% > 중형주 △5.6%

  

 ㅇ 코스닥 지수 : 소재,부품,장비 기업 지원 정책 등으로 관련 업종이 상승

 

   * 종이,목재 +61.8%, 반도체 +40.8%, 통신장비 +37.8%

 

■ '20년 전망

 

 ㅇ 코스피 지수 : 미중 무역분쟁 등 대내외 불확실성 완화 등으로 지수 상승 예상

 

 ㅇ 코스닥 지수 : 국내외 경기 반등으로 지수 상승 예상

 

○ 유의사항

  • o 시가총액의 규모가 큰 일부 대형주의 등락이 전체 주가지수의 변동에 영향을 미쳐 시장의 전반적인 흐름을 반영하지 못하는 경우가 있음

○ 용어해설

  • 코스피지수 : 유가증권시장에 상장된 보통주를 기준으로 산출하는 시가총액식 주가지수- 1980년 1월 4일을 100으로 하여 산출
  • 코스닥지수 : 코스닥시장에 상장된 보통주를 기준으로 산출하는 시가총액식 주가지수- 1996년 7월 1일을 1,000으로 하여 산출

지표정보

○ 작성방법

  • 기준년도의 시가총액을 분모로 하고 산출시점의 시가총액을 분자로 하여 지수화

○ 자료출처

  • 출처 : 한국거래소 홈페이지
  • 통계생산기관 : 한국거래소
  • 통계주기 : 생산주기(일), 관리주기(월)

 

 

 

http://www.index.go.kr/unify/idx-info.do?idxCd=8084

 

국가지표체계

대학졸업자 취업률 · · 최근 갱신일 : 2020-03-30 그래프 출처: 한국교육개발원, 취업통계연보 정의 고등교육기관을 졸업한 취업대상자 중에서 취업자가 차지하는 비율임(고등교육기관: 전문대학,

www.index.go.kr

 

대학졸업자 취업률 [단위 : %]  

              2011 2012 2013 2014 2015 2016 2017 2018

     취업률 67.6   68.1 67.4   67    67.5 67.7  66.2  67.7

성별  남자 70.7   70.6 69.9   69    69    69    67.8  69.6

        여자 64.5   65.7 65.1  65.2  66.1  66.4  64.8  66

 

출처: 한국교육개발원, 취업통계연보

주석: 1) 대학졸업자 취업률 = (취업자 ÷ 고등교육기관 졸업자 중 취업대상자) × 100

2) 고등교육기관에는 대학, 전문대학, 산업대학, 교육대학, 각종 학교 등이 포함됨

3) 취업률은 건강보험 및 국제DB를 연계하여 산출함

4) 각 연도 졸업자(2월, 전년7월)를 대상으로 그 해 12월 31일 기준의 취업률임

 

정의

고등교육기관을 졸업한 취업대상자 중에서 취업자가 차지하는 비율임(고등교육기관: 전문대학, 대학, 산업대학, 교육대학, 각종대학 등 포함)

 

해설

학교교육의 효과를 노동시장으로의 이행이라는 측면을 압축적으로 보여주는 지표로, 고등교육체제의 인적자원개발이 노동시장의 요구에 얼마나 적절히 조응하고 있는지를 가늠할 수 있다.

대학졸업자의 취업률은 2018년 67.7%로 집계되었다. 지난 8년간(2011~2018년) 최고 68.1%에서 최저 66.2% 사이에서 미미하게 등락하고 있다. 2018년 남자 대학졸업자의 취업률은 69.6%이고, 여자는 66.0%로  차이를 보이나 이러한 성별 격차는 매년 줄어들고 있다.

 

관련 용어

취업대상자: 졸업자-(진학자+입대자+취업불가능자+외국인유학생+제외인정자)

취업자: 조사기준일(12월 31일) 당시 직장건강보험가입자, 교내취업자, 해외취업자, 농림어업종사자, 개인창작활동종사자, 1인창(사)업자, 프리랜서

http://www.index.go.kr/unify/idx-info.do?idxCd=4201

 

국가지표체계

경제성장률 · 최근 갱신일 : 2020-06-02 (입력 예정일 : 2021-01-31) 그래프 출처: 한국은행, 「국민계정」 *자료 : 한국은행, 「국민계정」 주석: 1) 경제성장률 = {(금년도 실질 GDP - 전년도 실질 GDP) ÷

www.index.go.kr

시계열 그래프(Time plot,Line graph)

출처: 한국은행, 「국민계정」

*자료 : 한국은행, 「국민계정」

 

주석:

1) 경제성장률 = {(금년도 실질 GDP - 전년도 실질 GDP) ÷ 전년도 실질 GDP} × 100.

2) 실질 GDP는 2015년 기준임.

3) 최근 연도는 잠정치임.

 

경제성장률 [단위 : %]  

               1970 1980 1990 2000 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019

경제성장률 10.1  -1.6   9.9    9.1    6.8    3.7  2.4    3.2   3.2    2.8   2.9    3.2    2.9    2

 

정의

경제성장률은 실질 국내총생산(Gross Domestic Product, GDP)의 연간 증가율을 백분율로 나타낸 것임. 즉, 금년의 실질 GDP가 작년보다 얼마나 더 증가 혹은 감소하였는지를 나타내는 지표임.

 

해설

 국내총생산(GDP)은 한 나라 안의 모든 경제주체가 1년 동안 생산한 최종재의 시장가치를 모두 더한 것으로 한 국가의 전반적인 생산활동 수준과 경제규모를 나타낸다. 특히 실질 GDP는 물가수준의 변동을 제거하고 생산량의 변동만을 반영하도록 만든 지표로서 서로 다른 기간의 생산량을 비교하는 데 사용될 수 있다. GDP의 증가율, 즉 경제성장률은 국가경제의 경기상황과 성장잠재력을 직접적으로 나타내는 지표라고 할 수 있다.

한국의 경제성장률은 1998년 외환위기 이전까지는 7% 이상의 높은 수준을 유지하였으나 2000년대 이후에는 약 4%로 감소하였다. 2008년 이후에는 글로벌금융위기와 유럽 재정위기의 여파로 세계경기가 침체됨에 따라 한국의 성장률도 3% 내외로 하락하였다. 이처럼 장기적으로 성장률이 하락하는 것은 경제가 성숙 단계에 진입하면서 일반적으로 나타나는 현상이다. 다른 조건들이 일정하다면, 아직 개발이 충분히 이루어지지 않은 경제일수록 고도성장의 여지가 많다. 현재 한국의 경제성장률은 주요 선진국에 비해서는 높은 편이나 신흥 개발도상국에 비해서는 낮은 편이다. 2000년대 이후 주요국의 평균 성장률을 보면 미국은 2.0%, 일본은 0.8%였으며 중국은 9.0%를 기록하였다.

 

관련 용어

경제성장률: 실질국내총생산의 전년대비 증감률. 일정기간(분기 또는 연간) 중 한 나라의 경제 규모, 즉 국민소득 규모가 얼마나 커졌는가를 파악하기 위한 지표.

국내총생산(GDP): 일정기간(보통 1년) 동안 한 나라 영토 안에서 가계, 기업, 정부 등 모든 경제 주체가 생산 활동에 참여하여 창출한 부가가치 또는 최총생산물의 시장가치의 합계. 국내에 거주하는 비거주자(외국인)에게 지불되는 소득도 포함.

국민계정: 국제적으로 합의된 개념, 정의, 분류, 회계규정을 근거로 일관적이고 통합적으로 만들어진 거시경제계정표, 대차대조표를 말함. 경제분석, 의사결정, 정책입안을 위해 경제데이터를 이용하여 제공될 수 있는 종합적인 회계체계를 제공.

실질국내총생산(GDP): 국내경제의 생산활동 동향을 나타내는 경제성장률 산정에 이용되는 지표로 국내에서 생산된 최종생산물의 수량에 기준년도 가격을 곱하여 산출한 물량측정치임. 이에 따라 실질 GDP의 변동분은 가격 변화분을 제거한 순수한 생산수량의 변동분만을 나타냄.

http://www.index.go.kr/potal/main/EachDtlPageDetail.do?idx_cd=1403

기후 평년 값(과거 30년 통계) 추이

 

[단위: c,mm,hr]

기온/기온증감/강수량/강수량증감/일조시간/일조시간증감

 

의미 분석

지표 설명

평년값(normal) 개념

  • 기후표준평년값: 1931~1960년, 1961~1990년, 1991~2020년 등과 같이 고정된 30년간의 누년평균값
  • 기후평년값: 그 밖의 임의의 30년간의 누년 평균값

* 세계기상기구에서는 '기후표준평년값'을 이용하도록 권고하고 있으나 최근 기후변화를 조사하려는

목적으로 각 나라에서 새로운 '기후평년값'을 산출하고 있음

 

평년값을 산출하는 30년간 또는 위의 30년 미만의 통계 기간에 결측이 있는 경우는, 이것을 제외한

나머지의 값들로부터 누년평균값을 계산 30년 미만인 자료에 대해 산출한 누년평균값은 그 자료 기간이

25년 이상인 경우는 '평년값', 자료 기간이 8년 이상 24년 이하인 경우는 '준평년값'이라 하고, 평년값에 준하여 사용

 

기후 평년값 통계

전국 평균은 45개 지점의 평균값 사용

2011년부터는 1981~2010년까지의 30년 자료 활용

 

의의 및 활용도

이 통계는 전국 45개 지점의 평균값이며, 전국 평균값은 전문자료로 사용하기보다는 참고용으로  사용하는 값

기온, 강수량, 일조시간 평년값(30년 평균값)의 변화 현황을 통해 기후변화 경향을 파악할 수 있음

 

지표 해석

 

평년값 분석

기후평년값<기온>

  • 신기후평년값에 따르면, 우리나라의 전국 연평균기온은 12.5C로 구 기후평년값(1971~2000년)과 비교하면 0.2도 상승했고, 최고기온은 18.1C, 최저기온은 7.7C로 각각 0.2도, 0.3도 상승했다.

- 지난 30년 중 평균기온이 가장 높았던 해는 1998년(13.5C), 가장 낮았던 해는 1981년(11.4C)

 

* 신 기후평년값은 최소 10년 이상 연속 관측을 실시한 총 73개 지점의 값이 각각 산출되었음.

전국 평균값은 73개 지점 중 30년 이상 연속적으로 관측된 45개 지점(도서지역 제외)의 평균값임.

 

- 서울의 평균기온은 12.5C이며, 가장 높았던 해는 1998년(13.8C), 가장 낮았던 해는 1981년(11.2C)

  • 계절별 평균기온은 봄철 11.7C, 여름철 23.6C, 가을철 14.1C, 겨울철 0.5C로 구 기후평년값에 비해 모두 상승했으며  겨울철(+0.3도)의 기온 상승폭이 여름철(+0.1도)보다 크다
  • 월별 평균기온은 모든 월에서 상승했으며, 2월에 가장 크게 상승했고(평균기온 +0.5, 최고기온 +0.6, 최저기온 +0.4) 7월에 가장 적게 상승했다(평균기온과 최고기온 0.0도, 최저기온 +0.1도).

 

기후평년값<강수량>

  • 전국 연 강수량은 1307.7mm로 구 기후평년값에 비해 43.3mm(3.4%) 증가했다.

- 지난 30년 중 연 강수량이 가장 많았던 해는ㄴ 2003년(1861.0mm),

가장 적었던 해는 1988(848.5mm)으로 강수량의 차는 1012.5mm.

-  서울의 연 강수량은 1450.5mm이며, 연강수량이 가장 많았던 해는 1990년(2355.5mm),

가장 적었던 해는 1988(760.8mm)으로 강수량의 차는 1594.7mm

 

  • 계절별 강수량은, 여름철이 723.5mm로 연 강수량의 55%를 차지하고 있으며, 가을철이 259.7mm(20%),봄철이 236.6mm(18%), 겨울철 88.2mm(7%)이다.

- 구 기후 평년값과 비교하면 여름철(+45.2mm)과 가을철(+9.2mm)에는 증가했으며, 봄철(-9.7mm)과 겨울철(-1.4mm)에는 감소했음.

  • 강수량이 가장 많은 달은 7월(289.7mm)이며, 가장 적은 달은 12월(24.5mm)이다.

- 구 기후평년값과 비교하면, 7월(+34.9mm)이 가장 많이 증가했고, 그 다음은 9월(+17.2mm), 8월(+14.9mm)임.

- 구 기후평년값에서는 8월(260.0mm) 강수량이 가장 많았으나, 신 기후평년값에서는 7월(289.7mm)이 최대가 되었음   

 

 

--------------------------------------------------------------------------------------------------------------------------------

 

기후 평년 값은 평균 값을 구해서 산출하는 자료로 양적(수치) 데이터이다

numerical data는 막대 도표나 원 그래프로 표현할 수 없다

line graph, time plot인 선 그래프를 이용하면 이렇게 시간 대별로 분류 된 평균값인

기후평년값을 표현하기 쉽다

 

+ Recent posts