데이터 마이닝 (Data Mining)
- 대규모 데이터베이스로부터 데이터들간의 의미있는 상호관계를 도출.


1. 정의
-  데이터에서 패턴(Patterns), 연관(Associations), 변화(Changes), 예외(anomalies), 규칙(Rules), 통계적으로 중요한 구조와 사건(Events)들을 찾아내는 반자동(Semi-Automatic) 시스템.

2. 목적에 따른 모델링 분류
   가. 예측적 모델링 (Predictive Modeling)
      - 확보 데이터에 결과값이 있는 경우.
      - 주어진 데이터를 통해 예측 모델을 만들어 새로운 Case 에 대한 값을 예측
      - Classification, Prediction
   나. 탐색적 모델링 (Descriptive Modeling)
      - 확보 데이터에 결과값이 없는 경우
      - 주어진 데이터를 설명하는 Pattern 을 찾아 사용자의 이해를 목적으로 표현, 설명
      - Clustering, Segmentation

3. 기법 또는 요소 기술
   가. 예측적 모델링 (Predictive Modeling)
      1) Classification (: 새로운 레코드의 결과값을 예측)
         - 회귀분석, 판별분석, Neural Networks, Dicision Tree, Time Series.
   나. 탐색적 모델링 (Descriptive Modeling)
      1) Association (: 종속관계 분석)
         - 동시발생 매트릭스
      2) Sequence (: Association 에 시간 관련 정보 포함)
         - 동시발생 매트릭스
      3) Clustering (: 유사한 특성을 지닌 그룹으로 분할)
         - K-Means Clustering

4. 데이터 마이닝 프로세스
   가. 데이터의 선택 (Data Selection)
      - 데이터의 위치, 형태, 항목의 완전성 확보, 통합
   나. 데이터의 정제 (Data Cleaning)
      - 데이터의 정확도를 높이기 위한 작업
   다. 데이터의 보완 (Data Enrichment)
      - 데이터의 양과 깊이 보완
   라. 데이터의 변환 (Data Transformation)
      - 불필요한 레코드와 항목을 삭제
      - 파생항목을 만들거나 항목값을 그룹화
   마. 데이터 마이닝 기법 선택, 적용




-----------------------------------------------------------
출처 :
http://ko.wikipedia.org/wiki/데이터_마이닝
http://www.aistudy.co.kr/learning/mining/data_mining.htm
Data Mining 은 우리에게 어떤 이득을 주는가? (삼성 SDS IT Review)