디지털 금융/빅데이터 분석에 필요한 기본수학

빅데이터 분석에 필요한 기본 수학(7)_데이터와 변량

studylife-1 2025. 3. 2. 21:01
반응형

📊 통계 수학에서의 데이터와 변량

통계에서 데이터(data)변량(변수, variable) 은 매우 중요한 개념이다.

데이터를 분석하고 패턴을 찾기 위해 변량을 이해하는 것이 중요하다.

1️⃣ 데이터(Data)란?

데이터는 조사, 관찰, 실험 등을 통해 얻은 값이나 정보를 의미한다..

데이터의 예시

  • 학생들의 시험 점수: 85, 90, 75, 88, 92
  • 키(신장): 165cm, 170cm, 155cm, 180cm
  • 좋아하는 색상: 빨강, 파랑, 초록, 노랑

데이터는 수치(숫자)형 데이터범주형(질적) 데이터로 나눌 수 있다.

구분설명예제

수치형 데이터 (Quantitative Data) 수치로 표현할 수 있는 데이터 키, 몸무게, 점수, 온도
범주형 데이터 (Qualitative Data) 숫자로 표현되지 않고 분류되는 데이터 성별, 혈액형, 선호하는 색

📌 수치형 데이터는 평균이나 분산 같은 계산이 가능하지만, 범주형 데이터는 그렇지 않아요.

 

2️⃣ 변량(변수, Variable)이란?

변량(변수, Variable)은 연구나 조사를 할 때 변할 수 있는 값을 의미한다.
즉, 데이터가 변할 수 있는 속성을 나타내는 개념.

변량의 종류

변량은 크게 질적변량양적변량으로 나눌 수 있다.

구분설명예제

질적 변량 (Qualitative Variable) 숫자로 표현할 수 없는 변량 성별(남/여), 혈액형(A/B/O/AB)
양적 변량 (Quantitative Variable) 숫자로 측정할 수 있는 변량 키, 몸무게, 온도, 시험 점수

🔹 질적 변량(범주형 변수)

  • 사물의 속성을 구분하는 변수
  • 수학적인 연산이 불가능함
  • 예: 성별(남/여), 직업(학생/회사원), 좋아하는 과일(사과/바나나)

🔹 양적 변량(수치형 변수)

  • 수학적인 계산(평균, 분산 등)이 가능
  • 다시 이산형연속형으로 나눌 수 있음

양적 변량 종류설명예제

이산형 변량 (Discrete Variable) 셀 수 있는 정수값을 가짐 학생 수(1, 2, 3...), 주사위 값(1~6)
연속형 변량 (Continuous Variable) 일정 범위 내에서 모든 값을 가짐 키(170.5cm), 몸무게(65.3kg), 온도(36.7℃)

📌 이산형 변량은 개수를 셀 수 있지만, 연속형 변량은 측정값이므로 소수점까지 포함될 수 있다.

 

3️⃣ 데이터와 변량의 관계

데이터는 변량(변수)의 값들이 모여서 만들어진다.

예를 들어, 학생들의 키(변량) 를 조사했다고 하면, 그 결과가 데이터(160cm, 170cm, 180cm ...) 가 되는 것이다.

  • 변량: 학생들의 키
  • 데이터: 162cm, 175cm, 168cm, 180cm

변량이 무엇인지에 따라, 데이터가 어떻게 수집되고 해석되는지가 달라진다.

 

4️⃣ 데이터와 변량의 예제 문제

문제 1

아래 데이터에서 변량의 유형을 분류해 보세요.

  1. 반 학생들의 국어 점수: 80, 85, 90, 95
  2. 반 학생들의 혈액형: A, B, O, AB
  3. 한 달 동안의 최고 기온: 25.3℃, 26.1℃, 28.5℃
  4. 한 가정의 자녀 수: 0명, 1명, 2명, 3명

🎯 정답

  1. 양적 변량 (이산형, 점수는 정수값)
  2. 질적 변량 (혈액형은 범주형 데이터)
  3. 양적 변량 (연속형, 온도는 소수점 포함 가능)
  4. 양적 변량 (이산형, 자녀 수는 정수값)

 

📌 정리: 데이터와 변량의 차이점

개념설명예제

데이터 조사, 실험 등을 통해 얻은 값 시험 점수, 키, 성별
변량(변수) 데이터가 변할 수 있는 속성 "키"라는 변수에 대해 여러 명의 데이터를 수집 가능
질적 변량 숫자로 나타낼 수 없는 속성 성별, 혈액형, 직업
양적 변량 숫자로 표현 가능한 속성 키, 몸무게, 점수
이산형 변량 정수값을 가지는 양적 변량 학생 수, 주사위 값
연속형 변량 소수점까지 가능한 양적 변량 키, 몸무게, 온도

 

🎯 결론

데이터변량(변수)의 값들이 모인 것
변량(변수) 은 데이터가 변할 수 있는 속성
질적 변량(범주형)과 양적 변량(수치형)으로 구분됨
✅ 양적 변량은 이산형(정수값)연속형(소수 가능) 으로 나뉨

반응형