데이터의 수집 분석 (이상치와 결측치)1 EBS 수능특강 독서 047 데이터의 수집 분석 (이상치와 결측치) [중] 데이터의 수집 분석 (이상치와 결측치) 넘쳐나는 [데이터]를 잘 [수집]하고 [분석]하면 세상을 이해할 [지식과 통찰력]을 얻을 수 있다. 그렇지만 [데이터 분석자]가 [미리] [이상치]와 [결측치] 같은 데이터 분석에 오류를 일으킬 원인을 잘 [처리]해주어야만 한다. [이상치]는 [정상적인 범위 밖]의 값으로 데이터 [수집 과정]에서 오류가 개입되어 생긴다. 그리고 [이상치]는 [단 하나]만 있어도 분석에 [큰 문제]를 일으킬 수 있다. [이상치]를 [이해] 하기 위해 [사분위수]를 정리해 보자. 사분위수는 제1사분위수, 제2사분위수(중앙값), 제3사분위수로 나눈다. 데이터 값을 나열했을 때, [가운데]가 [중앙값(제2사분위수)]이고 중앙값보다 [작은] 값들의 [중앙값]이 [제2사분위수], 중앙값보다 .. 2023. 4. 30. 이전 1 다음