목록알쓸데잡 (39)
BESS(Back-End Study Space)
2020/11/19 - [데이터 분석 입문/기초통계] - 양측 검증과 단측 검증 양측 검증과 단측 검증 2020/11/18 - [데이터 분석 입문/기초통계] - 가설과 신뢰수준, 유의확률 가설과 신뢰수준, 유의확률 2020/11/17 - [데이터 분석 입문/기초통계] - 공분산과 상관계수 공분산과 상관계수 2020/11/17 - [데이 leeezxxswd.tistory.com #1. t-분석 - 독립변수가 비연속형 변수(즉, 명목척도나 서열척도)이고, 종속변수가 연속형 변수(즉, 등간척도나 비율척도)일 때 사용하는 분석방법으로, 독립변수의 집단이 2개 이하일 때 사용하는 분석방법 - 독립변수가 비연속형 변수로, 집단으로 구성되어 있다는 측면에서 집단 간의 평균 차이 분석을 의미 - t-분포를 사용하여 분..
2020/11/18 - [데이터 분석 입문/기초통계] - 가설과 신뢰수준, 유의확률 가설과 신뢰수준, 유의확률 2020/11/17 - [데이터 분석 입문/기초통계] - 공분산과 상관계수 공분산과 상관계수 2020/11/17 - [데이터 분석 입문/기초통계] - 도수분포표와 막대그래프, 히스토그램 #1. 공분산 - 범위 : (-∞ , +∞) - A(i leeezxxswd.tistory.com #1. 양측 검증 - 방향성을 고려하지 않은 채로 연구가설(H1)을 설정할 때 사용하는 검증 방법 - 예시 ) A 집단의 평균과 B 집단의 평균 간에는 차이가 있을 것이다. A 변수가 B 변수에 미치는 영향의 크기는 '0'이 아니다. #2. 단측 검증 - 방향성을 고려하여 연구가설을 설정할 때 사용하는 검증 방법 - ..
2020/11/17 - [데이터 분석 입문/기초통계] - 공분산과 상관계수 공분산과 상관계수 2020/11/17 - [데이터 분석 입문/기초통계] - 도수분포표와 막대그래프, 히스토그램 #1. 공분산 - 범위 : (-∞ , +∞) - A(i) - A(^) : 각 케이스들의 평균으로부터의 거리 (=편차) - 두 변수가 함께 각자의 평 leeezxxswd.tistory.com #1. 가설 - 영가설(H0) : 연구가설과는 반대되는 가설이고, 실제 분석이 이루어지는 가설 → 실제 통계분석에서 사용하기 때문에 하나의 수치로 정해져있어야 함 - 연구가설(H1) : 분석을 통해서 알아보고자 하는 내용으로 이루어진 가설 ☞ 영가설과 연구가설을 합치면 발생하는 모든 경우의 수가 포함되어야 함 - 통계 분석에서 영가설(..
2020/11/17 - [데이터 분석 입문/기초통계] - 도수분포표와 막대그래프, 히스토그램 도수분포표와 막대그래프, 히스토그램 2020/11/17 - [데이터 분석 입문/기초통계] - 모집단과 통계, 척도 모집단과 통계, 척도 2020/11/16 - [데이터 분석 입문/기초통계] - 기술통계와 추리통계 1. 중심경향값 : 전체 자료를 대표할 수 있는 수 leeezxxswd.tistory.com #1. 공분산 - 범위 : (-∞ , +∞) - A(i) - A(^) : 각 케이스들의 평균으로부터의 거리 (=편차) - 두 변수가 함께 각자의 평균으로부터 멀어지는 정도 - 한 변수가 자신의 평균으로부터 멀어질 때 다른 변수가 자신의 평균으로부터 멀어지는 정도를 의미 #2. 상관계수 두 변수 간의 관계로, 하나..
2020/11/17 - [데이터 분석 입문/기초통계] - 모집단과 통계, 척도 모집단과 통계, 척도 2020/11/16 - [데이터 분석 입문/기초통계] - 기술통계와 추리통계 1. 중심경향값 : 전체 자료를 대표할 수 있는 수치들 - 평균 : 전체 자료가 가지는 수치들의 총합을 전체 자료의 수로" data-og-host="leee leeezxxswd.tistory.com #1. 도수분포표 수집된 자료를 쉽게 이해할 수 있도록 일목요연하게 정리된 표로, 특정 항목 또는 특정 범위에 속하는 빈도수를 나타난 표 범위 빈도수 20세 초과 ~ 30세 이하 5 30세 초과 ~ 40세 이하 15 40세 초과 ~ 50세 이하 4 50세 초과 ~ 60세 이하 1 합계 25 #2. 막대그래프 비연속형 변수(명목척도 및 ..
2020/11/16 - [데이터 분석 입문/기초통계] - 기술통계와 추리통계 기술통계와 추리통계 #1. 기술 통계 수집한 자료를 분석하여 대상들의 속성을 파악하는 통계 방법 > 1. 중심경향값 : 전체 자료를 대표할 수 있는 수치들 - 평균 : 전체 자료가 가지는 수치들의 총합을 전체 자료의 수로 leeezxxswd.tistory.com #1. 모집단 : 연구 또는 분석이 이루어지는 전체 대상 - 전수조사하기 위해서는 많은 시간과 노력 필요 - 전수조사가 불가능한 경우, 모집단을 대표할 수 있는 표본을 추출 #2. 표본 : 모집단에서 추출한 일부로, 모집단의 속성들을 유추하는데 사용 > 1. 확률 표본 추출 방법 : 무작위로 표본을 추출하는 방법으로 모집단을 대표할 가능성이 높은 방법 - 체계적으로 표본..
#1. 기술 통계 수집한 자료를 분석하여 대상들의 속성을 파악하는 통계 방법 > 1. 중심경향값 : 전체 자료를 대표할 수 있는 수치들 - 평균 : 전체 자료가 가지는 수치들의 총합을 전체 자료의 수로 나눈 수치 - 중앙값 : 최대값과 최소값의 정가운데 수치 - 최빈값 : 가장 많은 빈도를 보이는 수치 > 2. 분산도 : 전체 자료가 얼마나 퍼져 있는지를 알 수 있는 수치 - 분산 : 각 자료가 평균으로부터 떨어진 거리(편차)들을 제곱한 수치들의 총합을 전체 자료의 수로 나눈 수치 - 표준편차 : 분산에 제곱근을 취한 수치 > 3. 상관계수 : 두 변수 간의 관계의 크기 > 4. 회귀계수 : 독립변수(원인)가 종속변수(결과)에 미치는 영향의 크기 #2. 추리 통계 모집단을 대표하는 표본을 추출하고 표본의..
2020/11/16 - [데이터 분석 입문/배경지식] - 데이터 분석이란, 데이터 분석이란, #1. 데이터 분석 종류 1. 확증적 데이터 분석(confirmatory data analysis) - 미리 정해놓은 목표에 따라 설정한 가설을 확인하기 위한 분석 - 추정(estimation)과 검정(test)을 이용 - 연구의 데이터 분석 방법 - leeezxxswd.tistory.com #1. R, Python, Excel의 차이 R Python Excel 개요 - 통계 계산과 그래픽을 위한 오픈소스 - 뉴질랜드 오클랜드 대학의 로버트, 젠틀맨과 로스 이하카에 의해 시작 - 1991년 귀도 반 로섬이 발표한 오픈소스 프로그래밍 언어 - 마이크로소프트 오피스 제품 중 하나 - 스프레드시트 프로그램 장점 - 데..
#1. 데이터 분석 종류 1. 확증적 데이터 분석(confirmatory data analysis) - 미리 정해놓은 목표에 따라 설정한 가설을 확인하기 위한 분석 - 추정(estimation)과 검정(test)을 이용 - 연구의 데이터 분석 방법 - 예) 기온에 따라 커피 전문점의 방문객 수가 다를까? ☞ 기상청의 기온 데이터를 커피 전문점의 판매 데이터에 붙여서 간단히 요약한다. 2. 탐색적 데이터 분석(exploratory data analysis) - 분석 목표가 명확하지 않거나 데이터에 대한 이해가 떨어질 때 사용 - 변수, 변수의 관계 등 데이터 자체의 특성을 확인하기 위한 분석 - 간단한 기술 통계량 계산과 다양한 그래프를 활용 - 모든 데이터 분석의 시작 단계에서 필수적인 과정 > 분석 목..