디지털 금융/빅데이터 분석에 필요한 기본수학
빅데이터 분석에 필요한 기본 수학(7)_데이터와 변량
studylife-1
2025. 3. 2. 21:01
반응형
📊 통계 수학에서의 데이터와 변량
통계에서 데이터(data) 와 변량(변수, variable) 은 매우 중요한 개념이다.
데이터를 분석하고 패턴을 찾기 위해 변량을 이해하는 것이 중요하다.
1️⃣ 데이터(Data)란?
데이터는 조사, 관찰, 실험 등을 통해 얻은 값이나 정보를 의미한다..
✅ 데이터의 예시
- 학생들의 시험 점수: 85, 90, 75, 88, 92
- 키(신장): 165cm, 170cm, 155cm, 180cm
- 좋아하는 색상: 빨강, 파랑, 초록, 노랑
데이터는 수치(숫자)형 데이터와 범주형(질적) 데이터로 나눌 수 있다.
구분설명예제
수치형 데이터 (Quantitative Data) | 수치로 표현할 수 있는 데이터 | 키, 몸무게, 점수, 온도 |
범주형 데이터 (Qualitative Data) | 숫자로 표현되지 않고 분류되는 데이터 | 성별, 혈액형, 선호하는 색 |
📌 수치형 데이터는 평균이나 분산 같은 계산이 가능하지만, 범주형 데이터는 그렇지 않아요.
2️⃣ 변량(변수, Variable)이란?
변량(변수, Variable)은 연구나 조사를 할 때 변할 수 있는 값을 의미한다.
즉, 데이터가 변할 수 있는 속성을 나타내는 개념.
✅ 변량의 종류
변량은 크게 질적변량과 양적변량으로 나눌 수 있다.
구분설명예제
질적 변량 (Qualitative Variable) | 숫자로 표현할 수 없는 변량 | 성별(남/여), 혈액형(A/B/O/AB) |
양적 변량 (Quantitative Variable) | 숫자로 측정할 수 있는 변량 | 키, 몸무게, 온도, 시험 점수 |
🔹 질적 변량(범주형 변수)
- 사물의 속성을 구분하는 변수
- 수학적인 연산이 불가능함
- 예: 성별(남/여), 직업(학생/회사원), 좋아하는 과일(사과/바나나)
🔹 양적 변량(수치형 변수)
- 수학적인 계산(평균, 분산 등)이 가능
- 다시 이산형과 연속형으로 나눌 수 있음
양적 변량 종류설명예제
이산형 변량 (Discrete Variable) | 셀 수 있는 정수값을 가짐 | 학생 수(1, 2, 3...), 주사위 값(1~6) |
연속형 변량 (Continuous Variable) | 일정 범위 내에서 모든 값을 가짐 | 키(170.5cm), 몸무게(65.3kg), 온도(36.7℃) |
📌 이산형 변량은 개수를 셀 수 있지만, 연속형 변량은 측정값이므로 소수점까지 포함될 수 있다.
3️⃣ 데이터와 변량의 관계
데이터는 변량(변수)의 값들이 모여서 만들어진다.
예를 들어, 학생들의 키(변량) 를 조사했다고 하면, 그 결과가 데이터(160cm, 170cm, 180cm ...) 가 되는 것이다.
- 변량: 학생들의 키
- 데이터: 162cm, 175cm, 168cm, 180cm
변량이 무엇인지에 따라, 데이터가 어떻게 수집되고 해석되는지가 달라진다.
4️⃣ 데이터와 변량의 예제 문제
✅ 문제 1
아래 데이터에서 변량의 유형을 분류해 보세요.
- 반 학생들의 국어 점수: 80, 85, 90, 95
- 반 학생들의 혈액형: A, B, O, AB
- 한 달 동안의 최고 기온: 25.3℃, 26.1℃, 28.5℃
- 한 가정의 자녀 수: 0명, 1명, 2명, 3명
🎯 정답
- 양적 변량 (이산형, 점수는 정수값)
- 질적 변량 (혈액형은 범주형 데이터)
- 양적 변량 (연속형, 온도는 소수점 포함 가능)
- 양적 변량 (이산형, 자녀 수는 정수값)
📌 정리: 데이터와 변량의 차이점
개념설명예제
데이터 | 조사, 실험 등을 통해 얻은 값 | 시험 점수, 키, 성별 |
변량(변수) | 데이터가 변할 수 있는 속성 | "키"라는 변수에 대해 여러 명의 데이터를 수집 가능 |
질적 변량 | 숫자로 나타낼 수 없는 속성 | 성별, 혈액형, 직업 |
양적 변량 | 숫자로 표현 가능한 속성 | 키, 몸무게, 점수 |
이산형 변량 | 정수값을 가지는 양적 변량 | 학생 수, 주사위 값 |
연속형 변량 | 소수점까지 가능한 양적 변량 | 키, 몸무게, 온도 |
🎯 결론
✅ 데이터는 변량(변수)의 값들이 모인 것
✅ 변량(변수) 은 데이터가 변할 수 있는 속성
✅ 질적 변량(범주형)과 양적 변량(수치형)으로 구분됨
✅ 양적 변량은 이산형(정수값) 과 연속형(소수 가능) 으로 나뉨
반응형