본문 바로가기

전체 글10

[혼공R이] 12기 4주차 Ch4 기본 숙제p.169의 iris 내장 데이터 세트의 데이터 구조 출력하고 인증하기추가숙제p.191 상자 그림 그래프의 각 요약 값 정리하기상자그림(Box plot)은 데이터의 분포를 비교하거나 다른 데이터 값에 비해 지나치게 높거나 낮은 이상치를 판단할 때 많이 사용하는 그래프다. 상자 그림에서는 데이터 분포에서의 퍼짐 정도, 최댓값, 최솟값, 중앙값, 이상치를 확인할 수 있다.이상치(Outlier)는 상자 그림 최댓값과 최솟값 라인의 바깥에 동그라미로 표시되는데, 위의 그림에서는 최댓값보다 큰 이상치만 표시되어 있지만 최솟값보다 작은 이상치가 존재할 경우에는 최솟값 아래에도 표시된다상자의 맨 바깥선 Q3은 제 3사분위수를 의미하고, 상자 내에 그려진 실선은 중앙값(제 2사분위수)를, 상자 맨 아래 바깥선.. 2024. 7. 28.
[혼공R이] 12기 3주차 Ch3 3주차는 Ch 3으로 기본적인 R 프로그래밍에 대한 내용을 다뤘다. 3-1 변수와 함수변수: 특정 범위 내에서 다양하게 변하는 값함수: 특정한 기능을 수행하기 위해 미리 설계된 프로그래밍 구문 세트변수 생성 규칙첫 문자는 반드시 영문자(알파벳) 또는 마침표를 사용첫 문자에는 숫자, 밑줄 문자를 사용 불가마침표와 밑줄 문자를 제외한 특수문자 사용 불가대문자와 소문자 구별변수명 중간에 빈칸 삽입 불가, 빈칸은 밑줄 문자로 표현3-2 패키지패키지: 기능에 따른 함수 모음집설치 함수(install.packages()함수)나 R 스튜디오의 인터페이스(패키지 탭 install 버튼)로 설치 가설치한 패키지는 library()함수로 확인 가능하며 이 함수로 패키지 로드 가능패키지 삭제: remove.packages(.. 2024. 7. 21.
[혼공R이] 12기 2주차 Ch 2 챕터 2는 데이터 분석 과정이다. 기본 숙제: p.99의 확인 문제 3, 4번 풀고 인증하기 2024. 7. 14.
[혼공R이] 12기 1주차 Ch 1 이번주부터 혼공학습단 12기 활동을 시작하였다 이번주는 챕터 1과 기본적인 출력코드를 실습하는 것이 숙제다. 사실 R을 배우는 것이 목적이 아니라 복습이 목적이라 가장 핵심적인 내용만 정리하고 숙제와 추가숙제를 인증하는 식으로 혼공단 포스팅을 할 생각이다. Ch 1 빅데이터와 RData Science란, 대규모의 데이터를 뜻하는 빅데이터를 가공해서 그 안의 인사이드나 지식을 다양한 방법으로 발굴해내는 분야다.Data Science에서 빅데이터 분석에 가장 많이 쓰이는 프로그래밍 언어는 R과 파이썬으로 이 책에서는 R에 대해서 다룬다. R은 뉴질랜드 오클랜드 대학의 로버트 젠틀맨과 로스 이하카가 만든 통계분석에 특화된 프로그래밍 언어다. 파이썬과 R은 서로 상호보안적인 관계에 있는 프로그래밍 언어라 데이터.. 2024. 7. 7.