01. 머신러닝 알고리즘 중 하나, 딥러닝(ANN, Artificial Neural Networks)

02. 다양한 변수를 조합하여 결과를 예측 추정하는 최적의 통계모형 도출.

03. 기술통계분석에서 추론통계분석으로

04. 의사결정 나무 분석(Decision Tree)

05. 결국 둘 중 하나. 집단 비교(A) 혹은 변수 간 관계 검증(B)

06. 가설 수립, 변수 선별, 분석방법 결정, 측정도구 개발, 데이터 수집

07. 명목변수(분류)와 연속변수(크기). 원인 독립변수(명목/연속), 결과 종속변수(명목/연속). 변수 속성의 조합(2*2)에 따라 통계 분석 기법 결정

08. 한 개념을 최소 3개 이상의 문항으로 측정하고, 한 문항에는 1개의 질문만 제시

09. 통상 3개 이상의 문항 간 관련성을 검증하는 신뢰도 계수(Cronbach’s α)

10. 유의확률(p-value). 어떤 차이가 우연히 발생할 확률. 일반적으로 5% 기준. 유의확률이 5%보다 작은 경우 통계적으로 유의(p<.05)

11. 산점도(scatter plot)

12. [A] 카이제곱 검정. 집단 간 비율 비교. 독립변수(명목), 종속변수(명목).

13. [A] t-test. 집단 간 평균 비교. 독립변수(명목), 종속변수(연속)

14. [B] 회귀 분석. 두 변수의 선형적 관계 분석. 기울기, 회귀계수(B, 독립변수가 1 증가할 때 종속변수의 변화량). 독립변속(연속), 종속변수(연속).

15. 절편. 상수. 기본값. 미해석 가능

16. R Square. 특정 독립변인의 종속변인 설명력. 설명력으로, 가설의 유의성을 판단하지 않음

17. 설문 회수 후 맨먼저 설문지 번호 매기기(데이터 오류 확인 시 원본 대조 필요)

18. 설문 코딩 시, 첫 번째 행에 변수 이름을 나열한 후 두 번째 행부터 설문지 응답값을 입력. 한 명의 데이터는 변수가 아무리 많아도 가로 한 줄에 입력

19. KESS(Korea Educational Statistics Software). 서울대학교 통계학과 제작, VBA(Visual Basic for Application)로 제작한 엑셀 확장 무료 공개 프로그램

20. KESS. 엑셀 [추가기능] - [통계분석] - [분석기법] - [분석변수]

21. 카이제곱 검정. [추가기능] - [통계분석] - [범주형 자료분석] - [분할표]

22. t값 통계량. 집단 간 평균 차이가 클수록 크다.

23. 등분산 검정. 유의확률이 유의수준보다 큰 경우, 다시 말해 통계적으로 유의하지 않기에(집단 간 분산의 차이가 없기에) 등분산 결과 사용

24. 피벗 테이블. 열에는 독립변수, 행에는 종속변수

25. 엑셀. 삽입. 표. 슬라이서

26. 서울연구데이터서비스. 서울 서베이

27. = if(E2=1, 1, if(E2=2, 2, 3))

28. 역코딩. 예) 6 - D2

29. 검정 통계량이 아닌 유의확률에 의거 판단

30. 자유도. 특정 기술통계량을 제외한 나머지 데이터 개수

31. 텍스트 마이닝, 워드 클라우드. Tagxedo(on Explorer)

32. 웹 풍향계, 검색 쿼리. socialmetrics, Google Trends

33. 시각화. infogram, piktochart, Tableau, D3.js

34. R. 데이터 분석 권장 툴

35. JAVA에서 Kotlin으로(구글)

36. PMP(Project Management Professional) 자격증. Quality _ Time, Cost, Scope

37. 데이터 유형과 속성에 따라 어떤 통계기법을 적용해야 하는가.

38. 이상치와 결측치 처리(단순 제거보다는 대푯값을 부여하거나 통계 혹은 머신러닝 기반 처리 및 보간법 등 활용)

39. The Data Visualisation Catalogue(https://datavizcatalogue.com)

40. Sankey Diagram(https://www.highcharts.com/demo/sankey-diagram)

41. 표본 (기술통계) 기술통계량 (추론통계) 모수 parameter

42. 기하평균. 변화량의 평균

43. 사분위수. 4개의 구간, 5개의 값(최솟값, 제1~3사분위수, 최댓값)

44. 변동계수(CV = 상대 표본편차 RSD). 표준편차 / 평균

45. 사회조사분석사

46. 비대칭 데이터(imbalanced-data)

47. 엑셀 조건부 서식(데이터 막대 활용)

48. 통계학 도감, 빅데이터를 지배하는 통계의 힘, Do it! 쉽게 배우는 R 데이터 분석

49. 월스트리트저널 인포그래픽 가이드

50. 한국데이터진흥원 빅데이터 아카데미 우수 프로젝트, 한국정보화진흥원 ICT 동향 분석, 공공데이터포털 활용 사례