본문 바로가기
혼공학습단-혼공R이

[혼공R이] 12기 4주차 Ch4

by 바이오인포하는 tansansoo 2024. 7. 28.

혼공R이 진도표

기본 숙제

p.169의 iris 내장 데이터 세트의 데이터 구조 출력하고 인증하기

iris 데이터 구조 출력_4주 기본 숙제

추가숙제

p.191 상자 그림 그래프의 각 요약 값 정리하기

상자그림(Box plot)은 데이터의 분포를 비교하거나 다른 데이터 값에 비해 지나치게 높거나 낮은 이상치를 판단할 때 많이 사용하는 그래프다.

 

상자 그림에서는 데이터 분포에서의 퍼짐 정도, 최댓값, 최솟값, 중앙값, 이상치를 확인할 수 있다.

상자 그림 설명. 출처 DataTab(https://datatab.net/tutorial/box-plot)

이상치(Outlier)는 상자 그림 최댓값과 최솟값 라인의 바깥에 동그라미로 표시되는데, 위의 그림에서는 최댓값보다 큰 이상치만 표시되어 있지만 최솟값보다 작은 이상치가 존재할 경우에는 최솟값 아래에도 표시된다

상자의 맨 바깥선 Q3은 제 3사분위수를 의미하고, 상자 내에 그려진 실선은 중앙값(제 2사분위수)를, 상자 맨 아래 바깥선 Q1은 제 1사분위수를 의미한다.

 

 

4주차 공부 끝!

'혼공학습단-혼공R이' 카테고리의 다른 글

[혼공R이] 6주차 Ch 6  (0) 2024.08.18
[혼공학습단 12기] 5주차 ch 5  (0) 2024.08.12
[혼공R이] 12기 3주차 Ch3  (0) 2024.07.21
[혼공R이] 12기 2주차 Ch 2  (0) 2024.07.14
[혼공R이] 12기 1주차 Ch 1  (0) 2024.07.07