기본 숙제
p.169의 iris 내장 데이터 세트의 데이터 구조 출력하고 인증하기
추가숙제
p.191 상자 그림 그래프의 각 요약 값 정리하기
상자그림(Box plot)은 데이터의 분포를 비교하거나 다른 데이터 값에 비해 지나치게 높거나 낮은 이상치를 판단할 때 많이 사용하는 그래프다.
상자 그림에서는 데이터 분포에서의 퍼짐 정도, 최댓값, 최솟값, 중앙값, 이상치를 확인할 수 있다.
이상치(Outlier)는 상자 그림 최댓값과 최솟값 라인의 바깥에 동그라미로 표시되는데, 위의 그림에서는 최댓값보다 큰 이상치만 표시되어 있지만 최솟값보다 작은 이상치가 존재할 경우에는 최솟값 아래에도 표시된다
상자의 맨 바깥선 Q3은 제 3사분위수를 의미하고, 상자 내에 그려진 실선은 중앙값(제 2사분위수)를, 상자 맨 아래 바깥선 Q1은 제 1사분위수를 의미한다.
4주차 공부 끝!
'혼공학습단-혼공R이' 카테고리의 다른 글
[혼공R이] 6주차 Ch 6 (0) | 2024.08.18 |
---|---|
[혼공학습단 12기] 5주차 ch 5 (0) | 2024.08.12 |
[혼공R이] 12기 3주차 Ch3 (0) | 2024.07.21 |
[혼공R이] 12기 2주차 Ch 2 (0) | 2024.07.14 |
[혼공R이] 12기 1주차 Ch 1 (0) | 2024.07.07 |