AI, ML, DL

[인공지능 기초] 척도(Scale), 명목척도, 간격척도, 순위척도, 비율척도

나비🦋 2025. 1. 20. 17:37

안녕하세요 나비입니다 🦋

이번 글에서는 “척도”에 대해 이야기해보려고 합니다. 척도의 4가지 종류인 명목척도, 간격척도, 순위척도, 비율척도에 대해서 순서대로 알아보도록 하겠습니다 🙂

척도(Scale)란?


척도는 "측정대상의 속성을 숫자로 치환한 것"을 의미합니다.

예를 들어, 여론조사에서 미혼/기혼 여부를 조사하는 상황을 가정해보면 미혼/기혼 여부라는 "속성"을 미혼 0, 기혼 1과 같이 숫자로 바꿔서 나타낸 결과를 척도라고 합니다.
 
또다른 예시로는 기상 예보를 위해 공기 중 미세먼지 농도를 측정하는 상황을 가정해보면, '좋음'을 1, '보통'을 2, '나쁨'을 3, '매우나쁨'을 4로 치환할 수도 있습니다.
 
이처럼 숫자가 아닌 속성을 척도로 나타내면 확률계산, 통계조사, 전산처리 등 데이터를 다루기가 더 편리해집니다.
 
 

1. 명목 척도


명목 척도란 각각의 숫자가 무엇을 의미하는지, 즉 숫자가 가리키는 대상이 중요한 척도를 말합니다.
 
예를 들어 성별을 척도화할 때 남성은 1, 여성은 0으로 지정할 수 있는데요, 반대로 남성 0, 여성 1로 지정해도 의미 해석에 큰 문제가 있지 않습니다.
 
즉 각 숫자가 의미하는 것이 가장 중요하고, 어떤 순서로 지정하든 크게 상관없는 척도를 명목 척도라고 합니다.
 
더 다양한 예시는 아래 내용을 참고해주세요!
 
[혼인여부 명목척도]

미혼 0
기혼 1
이혼 2
사별 3

 
[국적 명목척도]

내국인 0
외국인 1

 
 

2. 순위 척도


명목척도와 다르게 자료의 순서가 유의미한 척도를 순위 척도라고 합니다

예를 들어 1등급~9등급으로 매겨지는 고등학교 내신성적은 성적의 높고 낮음을 나타내기 때문에 순서가 중요하겠죠?

또한 미세먼지 농도를 좋음, 보통, 나쁨, 매우나쁨 4단계로 나타낼 때도 순서가 유의미할 것입니다.

좋음 0
보통 1
나쁨 2
매우 나쁨 3

 

 

3. 간격 척도


세 번째로 간격 척도는 척도 사이 간격을 동일하게 나눌 수 있는 것을 말합니다. 대표적으로 온도가 있는데요,

10도-20도의 차이와 20도-30도의 차이는 똑같이 10도 차이라는 다소 당연한 사실에서 알 수 있듯이, 간격척도는 더하기 빼기 연산을 통해 서로 동등하게 비교할 수 있습니다.

또한 간격척도는 0점이 없다는 게 아래서 다룰 비율 척도와 대비되는 특징입니다. 물론 섭씨 0도, 화씨 0도라는 기준이 있기는 하지만 인간의 편의에 따라 임의로 설정한 것일 뿐 온도라는 본연의 속성 자체에는 명확한 기준이 없습니다. 따라서 간격 척도는 곱셈, 나눗셈 연산은 어렵습니다. (절대온도 캘빈은 여기서 논하지 않겠습니다)

 

 

4. 비율 척도


비율 척도는 간격 척도와 달리 0점이 존재하는 척도를 의미합니다. 더하기 빼기 곱하기 나누기 모두 사칙연산이 자유롭게 가능하며, 대표적인 예시로는 질량, 길이가 있습니다.

질량도 0kg, 길이도 0m라는 명확한 영점 기준이 있기 때문에 비율척도라고 볼 수 있습니다.