Formulation of Association Rule Min

Formulation of Association Rule Mining Problem The association rule mining problem can be formally stated as follows: Definition 6.1 (Association Rule Discovery). Given a set of transactions T, find all the rules having support ≥ minsup and confidence ≥ minconf, where minsup and minconf are the corresponding support and confidence thresholds.
A brute-force approach for mining association rules is to compute the sup- port and confidence for every possible rule. This approach is prohibitively expensive because there are exponentially many rules that can be extracted from a data set. More specifically, the total number of possible rules extracted from a data set that contains d items is R = 3 d − 2 d+1 + 1
The proof for this equation is left as an exercise to the readers (see Exercise 5 on page 405). Even for the small data set shown in Table 6.1, this approach requires us to compute the support and confidence for 3 6 −2 7 +1 = 602 rules. More than 80% of the rules are discarded after applying minsup = 20% and minconf = 50%, thus making most of the computations become wasted. To avoid performing needless computations, it would be useful to prune the rules early without having to compute their support and confidence values. An initial step toward improving the performance of association rule min- ing algorithms is to decouple the support and confidence requirements. From Equation 6.2, notice that the support of a rule X −→ Y depends only on the support of its corresponding itemset, X ∪ Y . For example, the following rules have identical support because they involve items from the same itemset, {Beer, Diapers, Milk}: {Beer, Diapers} −→ {Milk}, {Beer, Milk} −→ {Diapers}, {Diapers, Milk} −→ {Beer}, {Beer} −→ {Diapers, Milk}, {Milk} −→ {Beer,Diapers}, {Diapers} −→ {Beer,Milk}. If the itemset is infrequent, then all six candidate rules can be pruned imme- diately without our having to compute their confidence values. Therefore, a common strategy adopted by many association rule mining algorithms is to decompose the problem into two major subtasks: 1. Frequent Itemset Generation , whose objective is to find all the item- sets that satisfy the minsup threshold. These itemsets are called frequent itemsets. 2. Rule Generation , whose objective is to extract all the high-confidence rules from the frequent itemsets found in the previous step. These rules are called strong rules. The computational requirements for frequent itemset generation are gen- erally more expensive than those of rule generation. Efficient techniques for generating frequent itemsets and association rules are discussed in Sections 6.2 and 6.3, respectively

0/5000

Источник: -

Цель: -

Результаты (русский) 1: [копия]

Скопировано!

Постановка проблемы добычи правило ассоциации, ассоциации правила добычи проблема может официально заявил следующее: определение 6.1 (Ассоциация правило обнаружения). Учитывая набор транзакций T, найти все правила, имея поддержку ≥ minsup и уверенность ≥ minconf, где minsup и minconf являются соответствующая поддержка и уверенность пороговые значения.Грубой силы подход к поиску ассоциативных правил заключается в вычислении sup порт и уверенность для всех возможных правил. Этот подход слишком дорогими, потому что есть экспоненциально много правил, которые могут быть извлечены из набора данных. В частности, общее количество возможных правил, извлеченные из набора данных, который содержит элементы, d-R = − 3 d 2 d + 1 + 1Доказательство для этого уравнения остается в качестве упражнения для читателей (см. Упражнение 5 на странице 405). Даже для небольшого набора данных, показано в таблице 6.1, этот подход требует от нас для вычисления поддержки и достоверности для 3 6 −2 7 + 1 = 602 правила. Более 80% правил удаляются после применения minsup = 20% и minconf = 50%, таким образом делая большую часть вычислений стать впустую. Чтобы избежать ненужной вычисления, было бы полезно обрезать правил рано без необходимости вычисления их значения поддержки и достоверности. Первым шагом на пути повышения производительности алгоритмов мин ing правила ассоциации является отделить требования поддержки и доверия. От 6.2 уравнение Обратите внимание, что поддержка правило X −→ Y зависит только от поддержки своих соответствующих элементов, X ∪ Y. Например, следующие правила имеют идентичные поддержку, потому что они включают элементы из набора элементов же, {пиво, памперсы, молоко}: {пиво, подгузники} −→ {молоко}, {пиво, молоко} −→ {подгузники}, {памперсы, молоко} −→ {пиво}, {пиво} −→ {памперсы, молоко}, {молока} −→ {пиво, подгузники}, {подгузники} −→ {пиво, молоко}. Если набор элементов нечасто, все шесть кандидатов правила могут быть обрезных imme немедленно без необходимости вычисления значений их доверие. Таким образом, Общая стратегия, принятая многие алгоритмы интеллектуального анализа правил Ассоциации необходимо разложить проблему на две крупные подзадачи: 1. частые поколение набора элементов, чья цель-найти все элемента наборы, которые удовлетворяют порог minsup. Эти наборы называются часто используемых наборов элементов. 2. правило поколение, целью которых является извлечение всех правил высокого доверия из часто используемых наборов элементов, найденных в предыдущем шаге. Эти правила называются строгие правила. Вычислительная требования для частого набора элементов поколения являются gen-ются более дорогой, чем те правило поколения. В разделы 6.2 и 6.3, соответственно рассматриваются эффективные методы для создания часто используемых наборов элементов и правил Ассоциации

переводится, пожалуйста, подождите..

Результаты (русский) 2:[копия]

Скопировано!

Постановка ассоциации правила Mining проблемы Проблема добыча правило ассоциация может быть официально сформулирована следующим образом: Определение 6.1 (Ассоциация Правило Discovery). Учитывая множество операций Т, найти все правила, имеющие поддержку ≥ minsup и уверенность ≥ minconf, где minsup и minconf являются соответствующие поддержку и доверие пороги.
подход грубой силы для правил горной ассоциации является для вычисления поддержку и доверие для каждого возможного правила. Этот подход слишком дорого, потому что есть экспоненциально много правил, которые могут быть извлечены из набора данных. Более конкретно, общее количество возможных правил, извлеченных из набора данных, который содержит D элементов является R = 3 г - 2 г + 1 + 1
доказательство этого уравнения в качестве упражнения для читателей (см Упражнение 5 на стр 405 ). Даже для небольшого набора данных, показанных в таблице 6.1, этот подход требует от нас, чтобы вычислить поддержку и уверенность в 3 6 -2 7 + 1 = 602 правил. Более 80% из правил отброшены после применения minsup = 20% и minconf = 50%, что делает большинство вычислений стали впустую. Чтобы избежать ненужных вычислений выполнения, было бы полезно, чтобы сократить правила в начале, не имея, чтобы вычислить их поддержку и доверие значения. Первым шагом на пути к повышению производительности правило ассоциации горно- алгоритмов, чтобы отделить требования поддержку и доверие. Из уравнения 6.2, обратите внимание, что поддержка правило X - → Y зависит только от поддержки соответствующей НИКАКИХ гарантий, X ∪ Y. Например, следующие правила имеют одинаковую поддержку, потому что они связаны элементы из той же НИКАКИХ гарантий, {Пиво, Подгузники, Молоко}: {Пиво, Подгузники} - {→ Молоко}, {Пиво, молоко} - {→ Подгузники}, {Подгузники , Молоко} - {→ Пиво}, {} Пиво - → {Подгузники, молоко}, {} Молоко - → {Пиво, Подгузники}, {} Подгузники - → {Пиво, молоко}. Если НИКАКИХ гарантий нечасто, то все шесть правил кандидат может быть сокращен немедленно без нашего вычислить их значения доверия. Таким образом, общая стратегия, принятая многими алгоритмов интеллектуального правило ассоциация разложить проблему на две основных шага: 1. Частые поколения НИКАКИХ гарантий, целью которой является, чтобы найти все item- наборы, которые удовлетворяют порог minsup. Эти наборов называются часто встречающихся наборов. 2. Правило поколения, целью которого является, чтобы извлечь все правила высокого доверия со стороны часто встречающихся наборов, найденных на предыдущем шаге. Эти правила называются строгие правила. Вычислительные требования для частого НИКАКИХ гарантий поколения утвер- ждать вообще дороже, чем поколения правил. Эффективные методы для генерации часто встречающихся наборов и ассоциативных правил обсуждаются в разделах 6.2 и 6.3, соответственно

переводится, пожалуйста, подождите..

Результаты (русский) 3:[копия]

Скопировано!

правилами ассоциации актуальности проблемы правил добычи проблемы могут быть официально объявлен рецепт: определение 6.1 (ассоциации правила открытия).учитывая набор сделки, найти все правила имеет поддержку ≥ minsup ≥ минимальное доверие и уверенность, в наименьшую поддержку и доверие является соответствующей поддержки и доверия
порог.

переводится, пожалуйста, подождите..

Другие языки

Поддержка инструмент перевода: Клингонский (pIqaD), Определить язык, азербайджанский, албанский, амхарский, английский, арабский, армянский, африкаанс, баскский, белорусский, бенгальский, бирманский, болгарский, боснийский, валлийский, венгерский, вьетнамский, гавайский, галисийский, греческий, грузинский, гуджарати, датский, зулу, иврит, игбо, идиш, индонезийский, ирландский, исландский, испанский, итальянский, йоруба, казахский, каннада, каталанский, киргизский, китайский, китайский традиционный, корейский, корсиканский, креольский (Гаити), курманджи, кхмерский, кхоса, лаосский, латинский, латышский, литовский, люксембургский, македонский, малагасийский, малайский, малаялам, мальтийский, маори, маратхи, монгольский, немецкий, непальский, нидерландский, норвежский, ория, панджаби, персидский, польский, португальский, пушту, руанда, румынский, русский, самоанский, себуанский, сербский, сесото, сингальский, синдхи, словацкий, словенский, сомалийский, суахили, суданский, таджикский, тайский, тамильский, татарский, телугу, турецкий, туркменский, узбекский, уйгурский, украинский, урду, филиппинский, финский, французский, фризский, хауса, хинди, хмонг, хорватский, чева, чешский, шведский, шона, шотландский (гэльский), эсперанто, эстонский, яванский, японский, Язык перевода.