평균, 중앙값, 편차, 표준편차, 분산에 대해서

https://bcho.tistory.com/972

 

평균,표준편차,분산의 개념

표준 편차의 개념 쉽게 말하면 평균(mean) 에 대한 오차이이다. 즉 , 실제 데이타 값이 평균을 기준으로 할때 얼마나 들쭉 날쭉하냐를 나타내는 것이다. 평균이 m이고, 표준편차가 3이라고 할때, 실

bcho.tistory.com

 

엑셀 데이터베이스 함수에 나오는 개념이라 가져옴

 

https://namu.wiki/w/%EB%B6%84%EC%82%B0

 

분산

分 散 / variance 분산의 국립국어원 표준국어대사전의 정의는 '갈라져 흩어짐, 또는 그렇게 되게 함.'으로

namu.wiki

 

https://namu.wiki/w/%ED%91%9C%EC%A4%80%20%ED%8E%B8%EC%B0%A8

 

표준 편차

標 準 偏 差 / standard deviation 표준 편차(standard deviation)는 자료의 관찰값

namu.wiki

 

https://namu.wiki/w/%EC%82%B0%ED%8F%AC%EB%8F%84?from=%ED%8E%B8%EC%B0%A8#s-5

 

산포도

산포도 ( 散 布 度 ) 또는 변산도( 變 散 度 )는 변량 이 흩어져 있는 정도를 하나의 수로 나타낸 값이다.

namu.wiki

 

https://depotceffio.tistory.com/entry/%ED%8F%89%EA%B7%A0%EA%B3%BC-%EC%A4%91%EC%95%99%EA%B0%92%EC%9D%98-%EC%B0%A8%EC%9D%B4%EC%99%80-%EA%B0%81%EA%B0%81%EC%9D%98-%EC%9D%98%EB%AF%B8

 

평균과 중앙값의 차이와 각각의 의미

평균은 데이터의 대표값을 계산하는 가장 일반적인 방법입니다. 중앙값도 만만치 않게 유명한 방법이지만 평균의 명성에는 못 미치죠. 두 방법의 계산상과 의미의 차이점을 알아보겠습니다. 평

depotceffio.tistory.com

 

쉽게 정리하자면

- 평균(Mean) : 전체의 합 / 전체 개수 (산술평균)

- 중앙값(Median) : 전체를 나열했을 때 중간에 있는 값 (튀는 값(아웃라이어)이 있을 때 유용)

- 편차(Deviation) : 관측값에서 평균 또는 중앙값을 뺀 것.

- 분산(Variance) : 편차들을 제곱하여 합한 후 이들의 평균값을 구한 것. (제곱을 굳이 하는 이유 : 편차는 -값이 될 수도 있기 때문에 이 상태에서 평균을 구하면 편차 값이 이상하게 나옴)

- 표준 편차(Standard Deviation) : 분산 값을 제곱근한 것. (분산을 구하기 위해 뻥튀기 했던 값을 다시 원래대로 돌린 것)

 

이러한 데이터가 갖는 의미

예를 들어 설명해보자.

- 시험 성적 : 시험 성적에 대한 표준 편차가 작으면 학생들의 수준이 균등함을 의미하고, 표준 편차가 크면 상위권과 하위권 간 격차가 큰 것을 의미한다.

- 사회현상 : 소득 분포에서 표준 편차가 크다면 부의 불평등이 크다는 것을 의미한다.

- 주식 시장 : 표준편차가 클수록 주식 가격의 변동성이 크고 위험성이 높다는 것을 의미한다.

- 품질 관리 : 공정 관리에 있어서 각 측정치의 표준 편차가 크다면 품질의 일관성이 떨어지는 것이므로 공정 관리가 제대로 되고 있지 않음을 의미한다.

 

 

나는 수학 쪽으로는 아예 모르는 빡대가리지만

통계쪽을 미리 공부해야 추후 재무빅데이터분석사를 딸 때 유용할 듯하다.