6.3 Rule Generation This section describes how to extract association  перевод - 6.3 Rule Generation This section describes how to extract association  русский как сказать

6.3 Rule Generation This section de

6.3 Rule Generation This section describes how to extract association rules efficiently from a given frequent itemset. Each frequent k-itemset, Y , can produce up to 2 k −2 associa- tion rules, ignoring rules that have empty antecedents or consequents (∅ −→ Y or Y −→ ∅). An association rule can be extracted by partitioning the itemset Y into two non-empty subsets, X and Y −X, such that X −→ Y −X satisfies the confidence threshold. Note that all such rules must have already met the support threshold because they are generated from a frequent itemset. Example 6.2. Let X = {1,2,3} be a frequent itemset. There are six candi- date association rules that can be generated from X: {1,2} −→ {3}, {1,3} −→ {2}, {2,3} −→ {1}, {1} −→ {2,3}, {2} −→ {1,3}, and {3} −→ {1,2}. As each of their support is identical to the support for X, the rules must satisfy the support threshold. Computing the confidence of an association rule does not require additional scans of the transaction data set. Consider the rule {1,2} −→ {3}, which is generated from the frequent itemset X = {1,2,3}. The confidence for this rule is σ({1,2,3})/σ({1,2}). Because {1,2,3} is frequent, the anti-monotone prop- erty of support ensures that {1,2} must be frequent, too. Since the support counts for both itemsets were already found during frequent itemset genera- tion, there is no need to read the entire data set again. 6.3.1 Confidence-Based Pruning Unlike the support measure, confidence does not have any monotone property. For example, the confidence for X −→ Y can be larger, smaller, or equal to the confidence for another rule ˜ X −→ ˜ Y , where ˜ X ⊆ X and ˜ Y ⊆ Y (see Exercise 3 on page 405). Nevertheless, if we compare rules generated from the same frequent itemset Y , the following theorem holds for the confidence measure. Theorem 6.2. If a rule X −→ Y −X does not satisfy the confidence threshold, then any rule X −→ Y − X , where X is a subset of X, must not satisfy the confidence threshold as well. To prove this theorem, consider the following two rules: X −→ Y −X and X −→ Y −X, where X ⊂ X. The confidence of the rules are σ(Y )/σ(X ) and σ(Y )/σ(X), respectively. Since X is a subset of X, σ(X ) ≥ σ(X). Therefore, the former rule cannot have a higher confidence than the latter rule. 6.3.2 Rule Generation in Apriori Algorithm The Apriori algorithm uses a level-wise approach for generating association rules, where each level corresponds to the number of items that belong to the rule consequent. Initially, all the high-confidence rules that have only one item in the rule consequent are extracted. These rules are then used to generate new candidate rules. For example, if {acd} −→ {b} and {abd} −→ {c} are high-confidence rules, then the candidate rule {ad} −→ {bc} is genera ted by merging the consequents of both rules. Figure 6.15 shows a lattice structure for the association rules generated from the frequent itemset {a,b,c,d}. If any node in the lattice has low confidence, then according to Theorem 6.2, the entire subgraph spanned by the node can be pruned immediately. Suppose the confidence for {bcd} −→ {a} is low. All the rules containing item a in its consequent, including {cd} −→ {ab}, {bd} −→ {ac}, {bc} −→ {ad}, and {d} −→ {abc} can be discarded. A pseudocode for the rule generation step is shown in Algorithms 6.2 and 6.3. Note the similarity between the ap-genrules procedure given in Algo- rithm 6.3 and the frequent itemset generation procedure given in Algorithm 6.1. The only difference is that, in rule generation, we do not have to make additional passes over the data set to compute the confidence of the candidate rules. Instead, we determine the confidence of each rule by using the support counts computed during frequent itemset generation. Algorithm 6.2 Rule generation of the Apriori algorithm. 1: for each frequent k-itemset f k , k ≥ 2 do 2: H 1 = {i | i ∈ f k } {1-item consequents of the rule.} 3: call ap-genrules(f k ,H 1 .) 4: end for
Page 26
352 Chapter 6 Association Analysis Algorithm 6.3 Procedure ap-genrules(f k , H m ). 1: k = |f k | {size of frequent itemset.} 2: m = |H m | {size of rule consequent.} 3: if k > m + 1 then 4: H m+1 = apriori-gen(H m ). 5: for each h m+1 ∈ H m+1 do 6: conf = σ(f k )/σ(f k − h m+1 ). 7: if conf ≥ minconf then 8: output the rule (f k − h m+1 ) −→ h m+1 . 9: else 10: delete h m+1 from H m+1 . 11: end if 12: end for 13: call ap-genrules(f k ,H m+1 .) 14: end if
0/5000
Источник: -
Цель: -
Результаты (русский) 1: [копия]
Скопировано!
6.3 правило поколения в этом разделе описывается, как эффективно извлекать ассоциативных правил из заданного набора часто. Каждый частые k-набор элементов, Y, может производить до 2 k −2 ной ния правил, игнорируя правила, которые имеют пустой предшественников или Выборгского (∅ −→ Y или Y −→ ∅). Ассоциативные правила могут быть получены путем разбиения элементов Y на два непустых подмножества, −X X и Y, таких, что X −→ Y −X удовлетворяет порог доверия. Обратите внимание, что такие правила должны уже встречались порог поддержки потому, что они генерируются из частого набора элементов. Пример 6.2. Пусть X = {1,2,3} быть частые набора элементов. Существует шесть правил Ассоциации Канди Дата, которые могут быть сгенерированы из X: {1,2} −→ {3}, {1,3} −→ {2}, {2,3} −→ {1}, {1} −→ {2,3}, {2} −→ {1,3} и {3} −→ {1,2}. Как каждый из их поддержку идентична Поддержка X, правила должны удовлетворять порог поддержки. Вычисления доверия правила ассоциации не требует дополнительных проверок набора данных транзакций. Рассмотрим правила {1,2} −→ {3}, которые генерируется от частого набора элементов X = {1,2,3}. Доверие для этого правила является σ({1,2,3})/σ({1,2}). Потому что {1,2,3} является частые, анти монотонным Проп ЕРТИ поддержки обеспечивает что {1,2} должны быть частыми, слишком. Поскольку поддержка счетчиков для обоих наборов элементов уже были найдены во время частых элементов родов ния, нет необходимости читать весь набор данных снова. 6.3.1 на основе доверия обрезка в отличие от мер поддержки, доверия не имеют каких-либо монотонных свойства. Например, доверие для X −→ Y может быть больше, меньше или равно доверия для другой правило ˜ X −→ ˜ Y, где ˜ X ⊆ X и ˜ Y ⊆ Y (см. Упражнение 3 на странице 405). Тем не менее если мы сравним образующиеся же частых элементов Y правила, следующие теоремы проводит меры доверия. 6.2 теорема. Если правило −X X −→ Y не удовлетворяет порог доверия, то любое правило X −→ Y − X, где X — это подмножество X, не должны удовлетворять также порог доверия. Чтобы доказать теорему, рассмотрим следующие два правила: X −→ Y −X и −X X −→ Y, где X ⊂ X. Доверие правил являются σ (Y) / σ (X) и (Y) σ / σ(X), соответственно. Так как X — это подмножество X, σ (X) ≥ σ(X). Таким образом бывший правило не может иметь больше доверия, чем последний правилом. 6.3.2 правило поколения в Apriori априори алгоритм алгоритм использует level-wise подход для создания ассоциативных правил, где каждый уровень соответствует количество элементов, которые принадлежат к правилу следствие. Первоначально извлекаются все правила высокого доверия, которые имеют только один элемент в как правило следствие. Затем эти правила используются для создания новых правил кандидат. Например если {acd} −→ {b} и {Абд} −→ {c} являются правила высокого доверия, то кандидат правило {ad} −→ {.} до н.э. является Тед родов путем слияния Выборгского обоих правил. Рисунок 6.15 показывает структуру решетки для правил ассоциации, созданные от частого набора элементов {a, b, c, d}. Если любой узел в решетке низкий уровень доверия, то согласно 6.2 теорема, весь подграфа, занимаемых узел может быть обрезке немедленно. Предположим, что доверие {bcd} −→ {} является низкой. Все правила, содержащие элемент в его последующие, в том числе {cd} −→ {ab}, {bd} −→ {ac}, {до н.э.} −→ {ad} и {d} −→ {abc} может быть удален. Псевдокод для шаг поколения правило показано в алгоритмы 6.2 и 6.3. Обратите внимание на сходство между ap-genrules процедура, указанная в АЛГО ритма 6.3 и частых элементов поколения процедурой, приведенной в алгоритм 6.1. Единственная разница, что в создание правила, мы не должны сделать дополнительные проходы над набором данных для вычисления доверия кандидатом правил. Вместо этого используя отсчеты поддержки, вычисляемые во время частых элементов поколения мы определить доверие каждого правила. Алгоритм 6.2 правило генерация алгоритма Apriori. 1: для каждого частые k-набор элементов f k, k ≥ 2 делать 2: H 1 = {я | я ∈ f k} {1-пункт Выборгского правило.} 3: вызов ap-genrules(f k,H 1.) 4: конецСтраница 26352 Глава 6 Ассоциация анализ алгоритма 6.3 процедура ap-genrules(f k, H m). 1: k = |f k | {Размер частых элементов.} 2: m = | H m | {Размер правило следствие.} 3: Если k > m + 1, то 4: H m + 1 = apriori-gen(H m). 5: для каждого h m + m 1 ∈ H + 1 сделать 6: conf = σ(f k)/σ(f k − h m+1). 7: Если conf ≥ minconf затем 8: вывести правило (f k − h m + 1) −→ h m + 1. 9: еще 10: удаление h m + 1 от H m + 1. 11: конец если 12: конец 13: вызов ap-genrules(f k,H m+1.) 14: Если
переводится, пожалуйста, подождите..
Результаты (русский) 3:[копия]
Скопировано!
6.3 правила генерации в этом разделе описывается, как эффективно из данного правила получения частых пунктов связи.K Пункт набора каждый часто, y, может производить до 2 k - 2 ассоциации права игнорировать пустые, предшествующее или частей правил (после ∅ - → y, или - → ∅).правилами ассоциации может быть разделена на два некавитирующий винт набор y, X и Y - X,Как X - X - y - удовлетворить порог доверия.Пожалуйста, обратите внимание, что все эти правила должны уже встретил поддержку порог, потому что они из одного поколения часто пункт сбора.случаев 6.2.пусть x = {1,2,3} является часто пункт.есть шесть кандидатов могут производить X:{1,2} - Дата правил Ассоциации → {3}, {- → 1,3} {2}, {2} - → {1}, {1} - → {2}, {2} {} - → 1,3,и {3} - → {1,2}.Они каждый поддержка является X поддерживает те же правила, должны удовлетворять поддержку порог.степень доверия ассоциации правил расчета не нуждается в дополнительных наборов данных сканирования.с учетом правила {1,2} - → {3}, это производит часто пункт X = {1,2,3}.Это правило доверия σ ({1,2,3}) / σ ({1,2}).Потому что {1,2,3} часто основой промышленности против Monotone, поддержку в обеспечении {1,2} должны часто, слишком.Потому что в частых пунктов принадлежит нашли уже на пункт набора в поддержку рассчитывать, и не нужно читать весь набор данных.6.3.1 на основе доверия подрезать и меры поддержки, доверия нет монотонности.например,→ X - y доверие может больше, меньше или равна другой правил, ˜ X - y → ˜ доверия, в ˜ x x и y ⊆ ˜ ⊆ y (см. упражнение 3 405 страниц).Однако, если мы сравним из одной и той же часто пункт правил производства, следующие теорема доверия.теорема 6.2.Если правило X - X - y - недовольство стопы порог доверия,Тогда любые правила x y - → - X, в котором x x подгруппы, порог доверия и не может удовлетворить.доказать теорему, рассмотреть следующие два правила: X - X - y - и X - y - → x x x правил, в котором ⊂ доверия σ (y) / σ (x) и σ (y) / σ (X), соответственно.Потому что x x подгруппы, σ (x) ≥ σ (X).Таким образом,не раньше, чем последнего правила есть правила высокий авторитет.6.3.2 правила алгоритм генерации Алгоритм Apriori мудро использовать метод уровень производства правил Ассоциации, на каждом уровне соответствует принадлежит правил количество после пункта.первоначально, извлечение высокого доверия всех правил, правил, в заключение только один проект.Эти правила - Это правила для создания нового кандидата.например, если {} {B} и ДСА - → {и} - → {c} высокого доверия правила, а затем на правила рекламы} {кандидата - → {BC} после слияния принадлежит Тед правил.диаграмма 6.15 показывает один из часто пункт сбора {A, b, c генерации правил Ассоциации решетки, структура, d}.если в любой узел решетки с низким уровнем доверия,затем в соответствии с теорема 6.2, вся карта через узел будет немедленно.гипотеза {} {} доверия является кор - → низким.все правила, включены в соответствующие проекты, включая {} {} CD - → AB, BD} {- → {AC}, {}} {до н.э. - → рекламы, и - → {} {} АВС может отказаться.Правило генерации шаги псевдо - код является алгоритм 6.2 и 6.3 показано.обратить внимание на сходство между АП genrules Программа дает алгоритм алгоритм 6.3 и часто пункт набора в процессе создания алгоритм 6.1.Единственное различие заключается в том, что в генерации правил, мы не должны делать дополнительные после набора правил расчета данных кандидата доверия.напротив,Мы уверены, что каждый доверия число правил для поддержки процесса получения расчета частых пунктов.6.2 правила алгоритм генерации Алгоритм Apriori.1: каждый часто k Пункт F ≥ 2 k k, сделать 2:H 1 = {я | я затем F k} {пункт 3 правила загривок.}: позвонить Associated Press genrules (F, H 1.) 4: 6 в конце страницы 352 главе

26 корреляционного анализа алгоритм 6.3 Программа АП genrules (F, H м).1:K | f = k | {часто пункт установленный размер 2:M.} {правил | h = м | после размер.} 3: Если K > 1 метр 4:H м 1 = Apriori Gen (h - м).5: 1 м в час, затем m h = 1 сделать 6:conf σ (f) / σ (f h м K - 1).Заседание 7: если ≥ минимальная степень доверия 8: формирование правил (K - 1 f h - h м м) - 1.9: 10 других: исключить h h 1 м 1 м.Если к концу 11: 12: 13:позвонить Associated Press genrules (F, H м 1: если 14.)
переводится, пожалуйста, подождите..
 
Другие языки
Поддержка инструмент перевода: Клингонский (pIqaD), Определить язык, азербайджанский, албанский, амхарский, английский, арабский, армянский, африкаанс, баскский, белорусский, бенгальский, бирманский, болгарский, боснийский, валлийский, венгерский, вьетнамский, гавайский, галисийский, греческий, грузинский, гуджарати, датский, зулу, иврит, игбо, идиш, индонезийский, ирландский, исландский, испанский, итальянский, йоруба, казахский, каннада, каталанский, киргизский, китайский, китайский традиционный, корейский, корсиканский, креольский (Гаити), курманджи, кхмерский, кхоса, лаосский, латинский, латышский, литовский, люксембургский, македонский, малагасийский, малайский, малаялам, мальтийский, маори, маратхи, монгольский, немецкий, непальский, нидерландский, норвежский, ория, панджаби, персидский, польский, португальский, пушту, руанда, румынский, русский, самоанский, себуанский, сербский, сесото, сингальский, синдхи, словацкий, словенский, сомалийский, суахили, суданский, таджикский, тайский, тамильский, татарский, телугу, турецкий, туркменский, узбекский, уйгурский, украинский, урду, филиппинский, финский, французский, фризский, хауса, хинди, хмонг, хорватский, чева, чешский, шведский, шона, шотландский (гэльский), эсперанто, эстонский, яванский, японский, Язык перевода.

Copyright ©2024 I Love Translation. All reserved.

E-mail: