Результаты (
русский) 3:
[копия]Скопировано!
пункт набора поддержку рассчитывать, чтобы я я я = {1, 2,..., я} - это набор данных всех проектов в рыночной корзины и t = {Т - 1, т - 2, т -..., это все сделки n} настройки.Т - У меня есть выбор каждой сделки, корреляционный анализ подпункта, набор ноль или более называется множеств.Если проект включает k Пункт, это называется k Пункт набора.например, {пиво, подгузники,молоко} является 3-itemset случаев.нулевой (или пустые) набор является не содержит каких - либо проектов наборов.ширина сделки определяется как транс - роль в настоящее время число проектов.T - j сказал дел содержит пункт x x t если подмножество [J]..например, в таблице 6.2 показано содержит пункт набора второй сделки подгузники} {} {хлеб, а не хлеб, молоко.проект является одним из важных элементов поддержки означает это число, количество, включают в себя некоторые сделки.в математике, поддержку рассчитывать, Сигма (X), пункт сбора X можно описать следующим образом: σ = (x) Я путешествовала | путешествовала {X ⊆ t t t я путешествовала, я путешествовала в символы затем}, | - | заявил, что число элементов.в набор данных в таблице 6.2 показано число {пиво, поддержку,подгузники, сухое молоко}, потому что только две сделки равна 2 содержит три пункта.правилами ассоциации и ассоциации является выражение x y формы - → смысл, в котором x и y - это набор не пересекаются, IE, x y = ∅ ∩.правилами ассоциации власть может в своей поддержки и доверия для измерения.Как долго поддерживает решение одного правила применяются в отношении данной
4 страницы 330 главе 6
корреляционного анализа наборов данных, а уверенность, как часто появляется в содержит проект решения X официального определения этих показателей в поддержку сделки (x, y σ - →) = (x n u y); доверия (6.1), C (X - → y) = (x σ U y) σ (X).6.1 (6.2) случаев.с учетом правила подгузники} {сухое молоко, пиво - → {}.Поскольку число {молоко поддержки, подгузники,пиво} общее число действий является кросс - 2, 5, правила поддержки - 2 / 5 = 0,4.доверие будет поддерживать несколько правил для {{молоко сухое молоко, пеленки, подгузники для поддержки число пиво}}.Потому что есть 3 сделки содержит молока и второй газеты, это правило степень доверия для 2 / 3 = 0,67.Зачем использовать поддержку и доверие?поддержка является важной мерой, поскольку одно правило, просто случайно может быть очень низкой поддержки.Правила также низкой поддержки может быть скучно с коммерческой точки зрения, потому что это не выгодно поощрять клиентов купить вместе, редко (6.8 статьи в разделе описание ситуации, за исключением).в силу этих причин,Поддержка обычно используется для ликвидации нелегальных.В пункте 6.2.1 будет показано также, поддерживает хорошие характеристики, могут быть использованы для эффективного объединения правил обнаружили.уверенность, с другой стороны, правила меры путем экстраполяции надежности.для данного правила → X - Y, более уверенно,Более вероятно, что y является в настоящее время содержит X уверенность в сделки, также обеспечивает условия для оценки вероятности y X ассоциации толкование результатов анализа следует осторожно.вывод правил Ассоциации прогрессивного, не обязательно означает, что причинно - следственную связь.напротив,Это показывает, что решительно органической взаимосвязи между проектами в правила предпосылки и последствия.причинно - следственную связь, с другой стороны, необходимость в данных причинно - следственную связь атрибутов, обычно касается отношений с течением времени происходит отношения знаний (например, разрушение озонового слоя в результате глобального потепления).правилами ассоциации актуальности проблемы правил добычи проблемы могут быть официально объявлен рецепт: определение 6.1 (ассоциации правила открытия).учитывая набор сделки, найти все правила имеет поддержку ≥ minsup ≥ минимальное доверие и уверенность, в наименьшую поддержку и доверие является соответствующей поддержки и доверия порог 5 страниц.
6.1 Определение проблемы 331 объединения правил добычи является грубой силы метод расчета все возможные правила поддержки порт и доверия.Этот метод является дорогостоящим, потому что есть несколько правил, может извлечь из одного набора данных.более конкретно, из одного набора данных, содержит пункт, возможно, правила получения D в общей сложности R = 3 d d 1 1 - 2.(6.3) на практике доказать это уравнение зарезервировано для читателей (см. упражнение 5 405 страниц).даже небольшой набор данных, таких, как показано в таблице 6.1, этот метод требует расчета 1 2 3 6 7 мы = 602 - поддержки и доверия правил.более 80% правила будут minsup = 20% и после минимального доверия = 50% выброшенных отходов, с тем чтобы стать большинство расчетов.чтобы избежать ненужных правил расчета сокращения его, будет его ранней без расчета стоимости полезной поддержки и доверия.первоначальный шаг совершенствования деятельности объединения правил алгоритм будет минимальной поддержки и доверия требования.6.2 из уравнения,Следует отметить, что правила x y - → поддержки зависит только от их соответствующие наборы предметов поддержку u x, y.например, следующие правила имеет такую же поддержку, поскольку они касаются проектов из того же набора, {пеленки, подгузники}:{пиво, пиво, молоко, молоко - → {}}, {} пиво, молоко - → {} {пеленки, подгузники, сухое молоко - → {}}} {пиво, пиво - → {подгузники молоко, молоко}, {} {} - → пиво, подгузники,{} {} - подгузники → пиво, молоко.Если пункт набора является редким, то все шесть кандидатов могут подрезать будут выбирать не правила расчета стоимости их доверие.Таким образом, многие ассоциации правил добычи алгоритм использует общей стратегии является проблема будет разделен на два основных этапа: 1.производство часто пункт набора,Его цель заключается в том, чтобы найти все удовлетворения порог минимальной поддержки пункт набора.Эти проекты набор называется часто пункт.2.Правило генерации, и его цель состоит в том, что на один шаг от частых пунктов в ассоциации правил добычи.Эти правила называют сильный правил.частые вопросы создания общего правила расчета корни, чем требования является более дорогостоящим.частый набор правил Ассоциации генерации и эффективной технологии, 6.2 и 6.3, соответственно, в разделе 6, обсудили
страниц.332 главе 6 корреляционного анализа B, C, D, E, ав рекламы является пустой de ce AC AB ABC Абд Абэ ABCD ДСА ABCDE ABCE ABDE ACDE BCDE туз Эйд BCD эпосом БДЭ ЦРП BD год до н. э. CD Рисунок 6.1.пункт сбора решетки.6.2 частые вопросы создания решетки, структура может использоваться для перечисления всех возможных пунктов списка.Рисунок 6.1 показывает пункт набора решетки я = {A, B, C, D, E}.в целом,набор данных, содержит k Пункт может иметь высокий до 2 K - 1 частые вопросы, не включая пустое.Поскольку многие практического применения можно в K катионов, очень большой, и это нужно изучить пункт набора индекс поиска места.искать частых пунктов является грубой силы метод определения в решетки, структура каждого кандидатов наборов поддержку рассчитывать.Таким образом, нам нужно сравнить каждый кандидат для каждой сделки, опера, таких, как показано на рис. 6.2.если кандидат является содержится в делах поддержки, это число будет увеличиваться.например, для поддержки} {хлеб, молоко, потому что набор включает в себя увеличение в три раза сделки, 1, 4, и 5.Этот метод может очень дорого, потому что это требует o (сопоставление nmw), где n - количество сделок, м = 2 K - 1 пункт набора кандидатов и W - количество крупнейших сделок, ширина 7 страниц
. 6.2 частые вопросы создания 333 метров молоко, подгузники, пиво, кола, хлеб, подгузники, пиво, яйца, хлеб, молоко, пиво, пеленки, подгузники, Кокс, хлеб, молоко, хлеб,молоко сделки кандидатов tid проекта N 1 2 3 4 5 Рисунок 6.2.расчет набор кандидатов поддержки.есть сокращение частые вопросы создания, сложность алгоритма расчета несколько методов.1.уменьшить количество кандидатов наборов (m).принцип Apriori принцип, будет в следующем разделе описание,- устранить некоторые не поддерживает набор кандидатов метр численное эффективным образом.2.сокращение сравнения количество раз.и каждый матч может набор кандидатов для каждой сделки, мы можем использовать более современные структуры данных, сократить время сравнения, либо хоу набор вариантов хранения или сжатый набор данных.мы будем в раздел 6.6 обсудить эти стратегии 6.2.4.6.2.1 Apriori принцип в этом разделе описывается, как меры поддержки помогает сократить набор кандидатов часто пункт набора в процессе создания некоторые исследования.для обрезки набор кандидатов в поддержку использования входят следующие принципы в качестве руководства.теорема 6.1 (априори принцип).если один пункт набора часто,Затем это все подмножество должны также часто.идея, лежащая в основе принцип, что априори, рассмотреть Рисунок 6.3 показано пункт набора решетки.гипотеза} {C, D, E - часто пункт.Очевидно, что содержит {C, D, E} любые сделки, также должны содержать его подмножество {}, C, D, E}, {{C, D, E}, {}, {} {}, D, E.Поэтому, если {C, D, E - частые} {, то все подмножество C, D, E} (IE,диаграмма в тени должны также часто Пункт 8 страниц).
корреляционного анализа 6 334 главе B, C, D, E, ав рекламы является пустой de ce AC AB ABC Абд Абэ ABCD ДСА ABCDE ABCE ABDE ACDE BCDE туз Эйд BCD эпосом БДЭ ЦРП BD год до н. э. CD часто пункт Рисунок 6.3.Apriori указать на принцип.Если} {C, D, E - частые, так это набор часто подгрупп.напротив, если проект как {,B} редко, то все должно быть слишком надмножество редко.Как показано на рисунке 6.4, расширенная версия весь график, содержащий {b}, {1} могут подрезать немедленно, B - это редкость.обрезка для поддержки этой стратегии измерения индекс поиска места называют поддержку на основе подрезка
переводится, пожалуйста, подождите..