'2026/02/15'에 해당되는 글 2건

  1. 2026.02.15 Apriori 알고리즘 기출문제
  2. 2026.02.15 Apriori 알고리즘
카테고리 없음2026. 2. 15. 23:32

기출문제. 2022

67. 다음의 구매 데이터로부터 연관규칙 Apriori 알고리즘을 통해 도출할 수 있는 연관규칙 중에서 신뢰도(confidence)값이 가장 큰 것은?

고객ID  구매항목
1 {A, B, C}
2 {D, A, E}
3 {A, B, F, G}
4 {F, B, E}
5 {A, C, E}
6 {C, E, H}

① A → B      ② A → C
③ B → A      ④ B → C

정답 : ③

해설 : 신뢰도 : confidence(X → Y) = support(X∪Y) / support(X)

출현횟수 A : 4 , B : 3, C : 3
출현횟수 {A,B} : 2, {A,C} : 2, {B,C} 1

① A → B  support(A∪B)  2, support(A) 4   confidence        2 / 4 = 0.50
② A → C  support(A∪C) 2, support(A)  4   confidence        2 / 4 = 0.50
③ B → A  support(B∪A) 2, support(B) 3    confidence        2 / 3 ≈ 0.667
④ B → C  support(B∪C) 1, support(B) 3   confidence        1 / 3 ≈ 0.333

Posted by 비니미니파파

1. 이해를 위해 먼저 알아야 할 개념

개념 설명 공식
Item 개별 상품 {빵}, {우유}
Itemset 상품 집합 {빵, 우유}
Support (지지도) 전체 거래 중 해당 항목집합이 등장한 비율 (해당 집합 포함 거래 수) / (전체 거래 수)
Confidence (신뢰도) A가 있을 때 B가 함께 등장할 확률 P(B|A)
Lift (향상도) 독립 대비 동시 등장 강도 Confidence / P(B)

2. 간단한 예시로 이해하기

거래 데이터

거래 ID 상품
T1 우유, 빵, 버터
T2 우유, 빵
T3 우유, 버터
T4 빵, 버터
T5 우유, 빵, 버터

총 5건

1단계: 1-itemset Support 계산

항목 등장횟수 Support
우유 4 80%
4 80%
버터 4 80%

(최소 지지도 60%라고 가정 → 모두 통과)

2단계: 2-itemset 생성

항목집합 등장횟수 Support
우유, 빵 3 60% (3/5)
우유, 버터 3 60% (3/5)
빵, 버터 3 60% (3/5) 

모두 통과

3단계: 3-itemset

항목집합등장 횟수Support
항목집합 등장횟수 Support
우유, 빵, 버터 2 40% (2/5)

최소지지도 60% 미만 → 탈락 → 종료


3. 연관규칙 생성 예

예: {우유, 빵} → {버터}

지표 계산
Support 2/5 = 40%
Confidence 2/3 ≈ 66.7%
Lift 0.667 / 0.8 ≈ 0.83

Support(A→B)  = P(AB) = count(AUB) / N = count({우유,빵,버터}) / N = 2 / 5
Confidence(A→B)  = P(BA) = count(AUB) / count(A) = 2 / 3 ≈ 0.667
Lift(A→B)  = P(BA)  / P(B) = 0.667 / 0.8

'정보시스템감리사 > 데이터베이스' 카테고리의 다른 글

B+-트리  (0) 2026.02.07
Posted by 비니미니파파