'통계학 공부' 카테고리의 다른 글
Bayesian Statistics (0) | 2021.07.08 |
---|
Bayesian Statistics (0) | 2021.07.08 |
---|
www.index.go.kr/unify/idx-info.do?idxCd=8040
지표 분석 4 주가지수 - 코스닥 종합지수 (1) | 2020.06.17 |
---|---|
지표 분석 3 대학 졸업자 취업률 (0) | 2020.06.17 |
지표 분석 2 경제 성장률 (0) | 2020.06.17 |
지표분석 1 기후평년 (0) | 2020.06.16 |
을 만족하는 확률변수들의 수열들을 말한다.
위에 식은 MDP(Markov Decision Process)에서 전이 확률(transition probability)을 나타낸다.
마르코프 체인의 정의는 마르코프 성질을 가진 이산 확률과정을 말한다.
A stochastic process, it is a discrete time Markov Chains (DTMC) i,j ∈ Ω
- Ω is discrete
- Indexed by discrete sequence of times
- Countable number of states / [ Ω ⊆ Ζ ] / Omega subset integers
마르코프의 성질은 '특정 상태의 확률은 오직 과거의 상태에 의존한다'라는 것이다.
The probability of Xn+1, given all past values of {Xn} is equal to the probability of Xn+1 given only Xn
즉, The probability of future event depends only on the current value not on past values.
미래의 확률은 과거의 가치에 상관 없이 오직 현재의 가치에 의해서 결정된다.
Markov Chain often assume the process is time-homogeneous
P(Xn+1 = j | Xn = i) is the same for all times n. <- this is called the one-step transition probability.
- Pij = P(Xn+1=j | Xn = i) , i is current state j is state of system 1 step later.
쉽게 설명을 하자면, 오늘 비가 왔으니 내일 비가 올지 안올지 확률적으로 표현 할 수가 있는데
이처럼 연속적인 현상을 단순히 표현할 때 마르코프 체인을 가정하여 사용 가능하다는 것
Three important properties of a Markov Chain:
1. Transient Distribution: Marginal distin of Xn, or fixed n
2. Occupancy Times: Expected amount of time the DTMC spends in a given state
3. Limiting Behavior: what happens as t -> ∞
- we can represent a lot of simple stochastic system as MCs.
ex) biology, inventory system, queueing systems, computer and telecomm, economics, physics, etc.
- DTMCs are often the building block for more complex stochastic models.
종종 단순한 모델이 강력한 효과를 발휘하기 때문에, 실제로 예측을 하려면 엄청나게 복잡한 변수들과
모델링을 거쳐서 엄선해야하는데, 마르코프 체인을 사용함으로써 기회 비용을 크게 줄이면서 이에 근접한
효과를 낼 수 있기 때문
마르코프 행렬은 전이행렬을 가지고 있는데
전이행렬의 각 상태의 확률은 일반적으로 행을 취합니다
X(t+1) = P *X(t)
X(0)
X(1) = P*X(0)
X(2) = P*X(1) = P * P * X(0) = P^2 * X(0)
X(t) = P^t * X(0)
X(t) <- 상태행렬 : 모든 성분의 합이 1
P <- 전이행렬(추이 행렬)
전이행렬을 계속 곱해주다 보면 변하지 않는 상태가 오는데 (수렴한다)
시간이 지나면 확률의 일정한 값에 수렴해가고 변하지 않는다. 안정상태 (Steady state)
상태행렬은 어떤 행렬 X로 수렴한다
이 행렬 X는 P를 곱해도 변하지 않는다
즉, PX = X
X 를 안전상태의 확률행렬이라 한다
1. 전이행렬 P를 계속 곱해주기
2. X(t) = p^t * X(0), 대각화로 P^t 계산 후에 X(t)를 구하기 ----- 대각화 공부하기
3. PX = X, X는 연립일차방정식 (P-1)X = 0의 해이다.
example 1 : forcasting the Weather
example 2 : Random Walk
example 3 : A Gambler
구글 페이지 랭크 알고리즘 - 마지막에 머무는 페이지의 퍼센트를 확인해서 랭크로 표시.
http://www.index.go.kr/potal/main/EachDtlPageDetail.do?idx_cd=1080
단위 P | 2016 | 2017 | 2018 | 2019 | 2020/01 | 2020/02 | 2020/03 | 2020/04 | 2020/05 |
코스피 | 2,026.46 | 2,467.49 | 2,041.04 | 2,197.67 | 2,119.01 | 1,987.01 | 1,754.64 | 1,947.56 | 2,029.60 |
코스닥 | 631.44 | 798.42 | 675.65 | 669.83 | 642.48 | 610.73 | 596.07 | 654.18 | 713.68 |
주가지수 및 코스닥종합지수 개념 및 의의
ㅇ 주가지수 및 코스닥 종합지수란 한국거래소에 상장 및 등록되어 있는 주식의 시장가격을 토대로 작성되며, 전반적인 주가의 동향을 가장 잘 나타내주는 대표적인 지수
ㅇ 지수의 산출은 기준시점의 주가수준을 주가지수의 경우 100,코스닥 종합지수의 경우 1,000으로 하여 비교시점의 주가변동을 시가총액 방식으로 측정하게 되는데 현재의 주가지수 및 코스닥 종합지수는 각각 1980년 1월 4일, 1996년 7월1일을 기준시점으로 하여 산출
※ 시가총액방식 주가지수 = 비교시점의 주식 시가총액 / 기준시점의 주식 시가총액 x 100
■ 주가지수 변동
ㅇ 코스피 지수 : 2019년 12월말 2,197.67pt로 전년말 대비 156.63pt(7.67%) 상승
ㅇ 코스닥 지수 : 2019년 12월말 669.83pt로 전년말 대비 5.82pt(0.9%) 하락
■ 추이분석
ㅇ 코스피 지수 : 미중 무역협상 진전 영향 등으로 대형주 중심으로 상승
* 대형주 +11.7% > 소형주 +4.3% > 중형주 △5.6%
ㅇ 코스닥 지수 : 소재,부품,장비 기업 지원 정책 등으로 관련 업종이 상승
* 종이,목재 +61.8%, 반도체 +40.8%, 통신장비 +37.8%
■ '20년 전망
ㅇ 코스피 지수 : 미중 무역분쟁 등 대내외 불확실성 완화 등으로 지수 상승 예상
ㅇ 코스닥 지수 : 국내외 경기 반등으로 지수 상승 예상
지표 분석 5 대한민국 자살률 (0) | 2021.05.11 |
---|---|
지표 분석 3 대학 졸업자 취업률 (0) | 2020.06.17 |
지표 분석 2 경제 성장률 (0) | 2020.06.17 |
지표분석 1 기후평년 (0) | 2020.06.16 |
http://www.index.go.kr/unify/idx-info.do?idxCd=8084
대학졸업자 취업률 [단위 : %]
2011 2012 2013 2014 2015 2016 2017 2018
취업률 67.6 68.1 67.4 67 67.5 67.7 66.2 67.7
성별 남자 70.7 70.6 69.9 69 69 69 67.8 69.6
여자 64.5 65.7 65.1 65.2 66.1 66.4 64.8 66
출처: 한국교육개발원, 취업통계연보
주석: 1) 대학졸업자 취업률 = (취업자 ÷ 고등교육기관 졸업자 중 취업대상자) × 100
2) 고등교육기관에는 대학, 전문대학, 산업대학, 교육대학, 각종 학교 등이 포함됨
3) 취업률은 건강보험 및 국제DB를 연계하여 산출함
4) 각 연도 졸업자(2월, 전년7월)를 대상으로 그 해 12월 31일 기준의 취업률임
고등교육기관을 졸업한 취업대상자 중에서 취업자가 차지하는 비율임(고등교육기관: 전문대학, 대학, 산업대학, 교육대학, 각종대학 등 포함)
학교교육의 효과를 노동시장으로의 이행이라는 측면을 압축적으로 보여주는 지표로, 고등교육체제의 인적자원개발이 노동시장의 요구에 얼마나 적절히 조응하고 있는지를 가늠할 수 있다.
대학졸업자의 취업률은 2018년 67.7%로 집계되었다. 지난 8년간(2011~2018년) 최고 68.1%에서 최저 66.2% 사이에서 미미하게 등락하고 있다. 2018년 남자 대학졸업자의 취업률은 69.6%이고, 여자는 66.0%로 차이를 보이나 이러한 성별 격차는 매년 줄어들고 있다.
취업대상자: 졸업자-(진학자+입대자+취업불가능자+외국인유학생+제외인정자)
취업자: 조사기준일(12월 31일) 당시 직장건강보험가입자, 교내취업자, 해외취업자, 농림어업종사자, 개인창작활동종사자, 1인창(사)업자, 프리랜서
지표 분석 5 대한민국 자살률 (0) | 2021.05.11 |
---|---|
지표 분석 4 주가지수 - 코스닥 종합지수 (1) | 2020.06.17 |
지표 분석 2 경제 성장률 (0) | 2020.06.17 |
지표분석 1 기후평년 (0) | 2020.06.16 |
http://www.index.go.kr/unify/idx-info.do?idxCd=4201
출처: 한국은행, 「국민계정」
*자료 : 한국은행, 「국민계정」
주석:
1) 경제성장률 = {(금년도 실질 GDP - 전년도 실질 GDP) ÷ 전년도 실질 GDP} × 100.
2) 실질 GDP는 2015년 기준임.
3) 최근 연도는 잠정치임.
경제성장률 [단위 : %]
1970 1980 1990 2000 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
경제성장률 10.1 -1.6 9.9 9.1 6.8 3.7 2.4 3.2 3.2 2.8 2.9 3.2 2.9 2
경제성장률은 실질 국내총생산(Gross Domestic Product, GDP)의 연간 증가율을 백분율로 나타낸 것임. 즉, 금년의 실질 GDP가 작년보다 얼마나 더 증가 혹은 감소하였는지를 나타내는 지표임.
국내총생산(GDP)은 한 나라 안의 모든 경제주체가 1년 동안 생산한 최종재의 시장가치를 모두 더한 것으로 한 국가의 전반적인 생산활동 수준과 경제규모를 나타낸다. 특히 실질 GDP는 물가수준의 변동을 제거하고 생산량의 변동만을 반영하도록 만든 지표로서 서로 다른 기간의 생산량을 비교하는 데 사용될 수 있다. GDP의 증가율, 즉 경제성장률은 국가경제의 경기상황과 성장잠재력을 직접적으로 나타내는 지표라고 할 수 있다.
한국의 경제성장률은 1998년 외환위기 이전까지는 7% 이상의 높은 수준을 유지하였으나 2000년대 이후에는 약 4%로 감소하였다. 2008년 이후에는 글로벌금융위기와 유럽 재정위기의 여파로 세계경기가 침체됨에 따라 한국의 성장률도 3% 내외로 하락하였다. 이처럼 장기적으로 성장률이 하락하는 것은 경제가 성숙 단계에 진입하면서 일반적으로 나타나는 현상이다. 다른 조건들이 일정하다면, 아직 개발이 충분히 이루어지지 않은 경제일수록 고도성장의 여지가 많다. 현재 한국의 경제성장률은 주요 선진국에 비해서는 높은 편이나 신흥 개발도상국에 비해서는 낮은 편이다. 2000년대 이후 주요국의 평균 성장률을 보면 미국은 2.0%, 일본은 0.8%였으며 중국은 9.0%를 기록하였다.
경제성장률: 실질국내총생산의 전년대비 증감률. 일정기간(분기 또는 연간) 중 한 나라의 경제 규모, 즉 국민소득 규모가 얼마나 커졌는가를 파악하기 위한 지표.
국내총생산(GDP): 일정기간(보통 1년) 동안 한 나라 영토 안에서 가계, 기업, 정부 등 모든 경제 주체가 생산 활동에 참여하여 창출한 부가가치 또는 최총생산물의 시장가치의 합계. 국내에 거주하는 비거주자(외국인)에게 지불되는 소득도 포함.
국민계정: 국제적으로 합의된 개념, 정의, 분류, 회계규정을 근거로 일관적이고 통합적으로 만들어진 거시경제계정표, 대차대조표를 말함. 경제분석, 의사결정, 정책입안을 위해 경제데이터를 이용하여 제공될 수 있는 종합적인 회계체계를 제공.
실질국내총생산(GDP): 국내경제의 생산활동 동향을 나타내는 경제성장률 산정에 이용되는 지표로 국내에서 생산된 최종생산물의 수량에 기준년도 가격을 곱하여 산출한 물량측정치임. 이에 따라 실질 GDP의 변동분은 가격 변화분을 제거한 순수한 생산수량의 변동분만을 나타냄.
지표 분석 5 대한민국 자살률 (0) | 2021.05.11 |
---|---|
지표 분석 4 주가지수 - 코스닥 종합지수 (1) | 2020.06.17 |
지표 분석 3 대학 졸업자 취업률 (0) | 2020.06.17 |
지표분석 1 기후평년 (0) | 2020.06.16 |
http://www.index.go.kr/potal/main/EachDtlPageDetail.do?idx_cd=1403
기후 평년 값(과거 30년 통계) 추이
[단위: c,mm,hr]
기온/기온증감/강수량/강수량증감/일조시간/일조시간증감
지표 설명
평년값(normal) 개념
* 세계기상기구에서는 '기후표준평년값'을 이용하도록 권고하고 있으나 최근 기후변화를 조사하려는
목적으로 각 나라에서 새로운 '기후평년값'을 산출하고 있음
평년값을 산출하는 30년간 또는 위의 30년 미만의 통계 기간에 결측이 있는 경우는, 이것을 제외한
나머지의 값들로부터 누년평균값을 계산 30년 미만인 자료에 대해 산출한 누년평균값은 그 자료 기간이
25년 이상인 경우는 '평년값', 자료 기간이 8년 이상 24년 이하인 경우는 '준평년값'이라 하고, 평년값에 준하여 사용
기후 평년값 통계
전국 평균은 45개 지점의 평균값 사용
2011년부터는 1981~2010년까지의 30년 자료 활용
의의 및 활용도
이 통계는 전국 45개 지점의 평균값이며, 전국 평균값은 전문자료로 사용하기보다는 참고용으로 사용하는 값
기온, 강수량, 일조시간 평년값(30년 평균값)의 변화 현황을 통해 기후변화 경향을 파악할 수 있음
기후평년값<기온>
- 지난 30년 중 평균기온이 가장 높았던 해는 1998년(13.5C), 가장 낮았던 해는 1981년(11.4C)
* 신 기후평년값은 최소 10년 이상 연속 관측을 실시한 총 73개 지점의 값이 각각 산출되었음.
전국 평균값은 73개 지점 중 30년 이상 연속적으로 관측된 45개 지점(도서지역 제외)의 평균값임.
- 서울의 평균기온은 12.5C이며, 가장 높았던 해는 1998년(13.8C), 가장 낮았던 해는 1981년(11.2C)
기후평년값<강수량>
- 지난 30년 중 연 강수량이 가장 많았던 해는ㄴ 2003년(1861.0mm),
가장 적었던 해는 1988(848.5mm)으로 강수량의 차는 1012.5mm.
- 서울의 연 강수량은 1450.5mm이며, 연강수량이 가장 많았던 해는 1990년(2355.5mm),
가장 적었던 해는 1988(760.8mm)으로 강수량의 차는 1594.7mm
- 구 기후 평년값과 비교하면 여름철(+45.2mm)과 가을철(+9.2mm)에는 증가했으며, 봄철(-9.7mm)과 겨울철(-1.4mm)에는 감소했음.
- 구 기후평년값과 비교하면, 7월(+34.9mm)이 가장 많이 증가했고, 그 다음은 9월(+17.2mm), 8월(+14.9mm)임.
- 구 기후평년값에서는 8월(260.0mm) 강수량이 가장 많았으나, 신 기후평년값에서는 7월(289.7mm)이 최대가 되었음
--------------------------------------------------------------------------------------------------------------------------------
기후 평년 값은 평균 값을 구해서 산출하는 자료로 양적(수치) 데이터이다
numerical data는 막대 도표나 원 그래프로 표현할 수 없다
line graph, time plot인 선 그래프를 이용하면 이렇게 시간 대별로 분류 된 평균값인
기후평년값을 표현하기 쉽다
지표 분석 5 대한민국 자살률 (0) | 2021.05.11 |
---|---|
지표 분석 4 주가지수 - 코스닥 종합지수 (1) | 2020.06.17 |
지표 분석 3 대학 졸업자 취업률 (0) | 2020.06.17 |
지표 분석 2 경제 성장률 (0) | 2020.06.17 |