산업 문제 해결을 위한 통계적 사고

무료 온라인 통계 과정

예측 모형화 및 텍스트 마이닝

예측 분석은 데이터와 통계 알고리즘을 사용하여 현재 공정과 환경 하에서 다음 상황을 예측합니다.

이 모듈에서는 과대적합 처리, 최적의 예측 모형 선택, 다중 선형 회귀 및 로지스틱 회귀 사용 방법 등 예측 모형 생성에 사용되는 핵심 기법을 배우게 됩니다. 또한 벌점 회귀 방법, 결정 트리, 신경망과 같은 기타 예측 모형들의 적합 방법을 학습합니다. 마지막으로 설문 조사 응답 데이터와 같은 비정형 텍스트 데이터에서 정보와 의미를 추출하는 방법을 배웁니다.

이 모듈에서 다루는 특정 주제는 다음과 같습니다.

예측 모형 필수사항

  • 예측 모형 소개
  • 과대적합 및 모형 검증
  • 모형 성과 평가: 예측 모형
  • 모형 성과 평가: 분류 모형
  • ROC(Receiver Operating Characteristic) 곡선

결정 트리

  • 결정 트리 소개
  • 분류 트리
  • 회귀 트리
  • 검증과 결정 트리
  • 랜덤(붓스트랩) 포레스트

신경망 네트워크

  • 신경망이란 무엇인가요?
  • 신경망 해석
  • 신경망을 사용하는 예측 모형

일반화 회귀

  • 일반화 회귀 소개
  • 최대 우도를 사용한 모형 적합
  • 벌점 회귀 방법 소개

모형 비교 및 선택

  • 예측 모형 비교

텍스트 마이닝 소개

  • 텍스트 마이닝 소개
  • 텍스트 데이터 처리
  • 용어 목록 구성
  • 텍스트 데이터 시각화 및 탐색
  • 텍스트 데이터 분석(마이닝)