Результаты (
русский) 2:
[копия]Скопировано!
Постановка ассоциации правила Mining проблемы Проблема добыча правило ассоциация может быть официально сформулирована следующим образом: Определение 6.1 (Ассоциация Правило Discovery). Учитывая множество операций Т, найти все правила, имеющие поддержку ≥ minsup и уверенность ≥ minconf, где minsup и minconf являются соответствующие поддержку и доверие пороги.
подход грубой силы для правил горной ассоциации является для вычисления поддержку и доверие для каждого возможного правила. Этот подход слишком дорого, потому что есть экспоненциально много правил, которые могут быть извлечены из набора данных. Более конкретно, общее количество возможных правил, извлеченных из набора данных, который содержит D элементов является R = 3 г - 2 г + 1 + 1
доказательство этого уравнения в качестве упражнения для читателей (см Упражнение 5 на стр 405 ). Даже для небольшого набора данных, показанных в таблице 6.1, этот подход требует от нас, чтобы вычислить поддержку и уверенность в 3 6 -2 7 + 1 = 602 правил. Более 80% из правил отброшены после применения minsup = 20% и minconf = 50%, что делает большинство вычислений стали впустую. Чтобы избежать ненужных вычислений выполнения, было бы полезно, чтобы сократить правила в начале, не имея, чтобы вычислить их поддержку и доверие значения. Первым шагом на пути к повышению производительности правило ассоциации горно- алгоритмов, чтобы отделить требования поддержку и доверие. Из уравнения 6.2, обратите внимание, что поддержка правило X - → Y зависит только от поддержки соответствующей НИКАКИХ гарантий, X ∪ Y. Например, следующие правила имеют одинаковую поддержку, потому что они связаны элементы из той же НИКАКИХ гарантий, {Пиво, Подгузники, Молоко}: {Пиво, Подгузники} - {→ Молоко}, {Пиво, молоко} - {→ Подгузники}, {Подгузники , Молоко} - {→ Пиво}, {} Пиво - → {Подгузники, молоко}, {} Молоко - → {Пиво, Подгузники}, {} Подгузники - → {Пиво, молоко}. Если НИКАКИХ гарантий нечасто, то все шесть правил кандидат может быть сокращен немедленно без нашего вычислить их значения доверия. Таким образом, общая стратегия, принятая многими алгоритмов интеллектуального правило ассоциация разложить проблему на две основных шага: 1. Частые поколения НИКАКИХ гарантий, целью которой является, чтобы найти все item- наборы, которые удовлетворяют порог minsup. Эти наборов называются часто встречающихся наборов. 2. Правило поколения, целью которого является, чтобы извлечь все правила высокого доверия со стороны часто встречающихся наборов, найденных на предыдущем шаге. Эти правила называются строгие правила. Вычислительные требования для частого НИКАКИХ гарантий поколения утвер- ждать вообще дороже, чем поколения правил. Эффективные методы для генерации часто встречающихся наборов и ассоциативных правил обсуждаются в разделах 6.2 и 6.3, соответственно
переводится, пожалуйста, подождите..
