Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава

5) Способ КОРРЕЛЯЦИОННЫХ ПЛЕЯД

Терентьевым был придуман способ корреляционных плеяд. Сущность способа такая. Зрительно результаты систематизации можно представить в виде цилиндра, рассеченного плоскостями, перпендикулярными его оси. Плоскости соответствуют его уровням (от 0 до 1 с шагом 0,1), на которых соединяются воединыжды характеристики либо объекты, подлежащие систематизации, потому способ припоминает способ ближней связи, но с фиксированными уровнями объединения Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава. Графически результаты систематизации изображают в виде окружностей – срезов (плеяд) упомянутого выше корреляционного цилиндра. На окружностях отмечают классифицируемые объекты. Связи меж классифицированными объектами указывают методом соединения хордами точек окружности, соответственных объектам.

6) ВРОЦЛАВСКАЯ ТАКСОНОМИЯ

Результатом работы программки, использующей способ наибольшего корреляционного пути, являются пары чисел, указывающие порядок «соединения» подлежащих систематизации Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава характеристик либо объектов, более близких попарно. Получающийся кратчайший замкнутый путь можно показать графически в виде рационального дерева (дендрита), как это описано в последующем разделе.

Классифицируемы могут быть характеристики или объекты. Способ похож на способ наиблежайшей связи, но относится к методам типа разрезания графа и припоминает способы вроцлавской таксономии. Если в Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава качестве меры сходства применяется коэффициент корреляции, выходит способ наибольшего корреляционного пути.

Способы иерархической группировки (численной таксономии) начальных множеств получили заглавие кластер-анализа, другими словами анализа групп. Сначало они применялись в биологии и палеонтологии, а в текущее время обширно употребляются в разных отраслях геолого-минералогических наук, а именно, при Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава систематизации парагенетических ассоциаций частей земной коры.

Термин кластерный анализ (в первый раз ввел Tryon, 1939) в реальности содержит в себе набор разных алгоритмов систематизации. Общий вопрос, задаваемый исследователями в почти всех областях, заключается в том, как организовать наблюдаемые данные в приятные структуры, другими словами развернуть таксономии. К примеру, биологи ставят цель разбить Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава животных на разные виды, чтоб содержательно обрисовать различия меж ними. В согласовании с современной системой, принятой в биологии, человек принадлежит к приматам, млекопитающим, амниотам, позвоночным и животным. Заметьте, что в этой систематизации, чем выше уровень агрегации, тем меньше сходства меж членами в соответственном классе. Человек имеет Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава больше сходства с другими приматами (другими словами с мортышками), чем с «отдаленными» членами семейства млекопитающих (к примеру, собаками) и т.д. Практически, кластерный анализ является не столько обыденным статистическим способом, сколько «набором» разных алгоритмов «распределения объектов по кластерам». Существует точка зрения, что в отличие от многих других статистических процедур, способы кластерного анализа Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава употребляются почти всегда тогда, когда вы не имеете каких-то априорных гипотез относительно классов, но все еще находитесь в описательной стадии исследования. Следует осознавать, что кластерный анализ определяет «наиболее может быть важное решение». Потому проверка статистической значимости в реальности тут неприменима, даже в случаях, когда известны p-уровни Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава (как, к примеру, в способе K-средних).

Задачка кластер-анализа сводится к разбиению огромного количества частей корреляционной матрицы признаков [R] на группы таким макаром, чтоб в их объединялись объекты с наивысшими значениями черт сходства, а разобщенные группы оставались бы при всем этом очень изолированными по данному признаку. В качестве меры Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава сходства могут употребляться конкретно парные коэффициенты корреляции, m-мерное эвклидово расстояние либо другие дистанционные коэффициенты.

МЕТРИКИ

Мера сходства меж элементами множеств (типа расстояния) именуется метрикой, если она удовлетворяет определенным условиям: симметрии, неравенству треугольника, различимости нетождественных объектов и неразличимости тождественных объектов.

Метрика Минковского

Более общей метрикой является метрика Минковского Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава. Степень разности значений можно избрать в границах от 1 до 4. Если эту степень взять равной 2, то получим евклидово расстояние. Расстояние Минковского равно корню r-ой степени из суммы абсолютных разностей пар значений взятых в r-ой степени:

distance(x,y) = {Si (xi - yi)r }1/r

Евклидова метрика

Это более нередко избираемый тип расстояния. Это Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава просто геометрическое расстояние в многомерном пространстве. Евклидова дистанция меж 2-мя точками х и у – это меньшее расстояние меж ними. В двух- либо трёхмерном случае – это ровная, соединяющая данные точки. Если в метрике Минковского положить r=2, мы получим стандартное евклидово расстояние (евклидову метрику)

distance(x,y) = {Si (xi Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава - yi)2 }½

Квадратная евклидова метрика (квадрат евклидова расстояния)

Дает больший по сопоставлению с евклидовой метрикой вес объектов, которые располагаются более обособленно. Благодаря строительству в квадрат при расчёте лучше учитываются огромные разности

distance(x,y) = Si (xi - yi)2

Манхеттенское расстояние

Это расстояние просто среднее различие поперечных измерений. При r=1 метрика Минковского дает манхеттенское расстояние Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава (метрику городка, city block, Manhattan distance). Эта дистанционная мера, именуемая также дистанцией Манхэттена либо в шуточку – дистанцией таксиста, определяется суммой абсолютных разностей пар значений. Для двумерного места это не прямолинейное евклидова расстояние меж 2-мя точками, а путь, который должен преодолеть Манхэттенский таксист, чтоб проехать от 1-го дома к другому по Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава улицам, пересекающимся под прямым углом

distance(x,y) = Si |xi - yi|

Чебышевское расстояние

Эта мера расстояния может быть соответственная в случаях, когда каждый желает найти два объекта как «различные», если они различны на любом из измерений. Разностью 2-ух наблюдений является абсолютное значение наибольшей разности поочередных пар переменных, соответственных этим наблюдениям Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава.

distance(x,y) = Maximum|xi - yi|

Пользовательская метрика (степенное расстояние)

Это обобщенный вариант расстояния Минковского. Это расстояние, называемое также степенным расстоянием, равно корню r-ой степени из суммы абсолютных разностей пар значений взятой в р-ой степени:

distance(x,y) = (Si |xi - yi|p)1/r,

где Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава r и p - определяемые юзером характеристики. Тут как для корня, так и для степени суммы можно выбирать значения от 1 до 4. Параметр p несет ответственность за постепенное взвешивание разностей по отдельным координатам, параметр r несет ответственность за прогрессивное взвешивание огромных расстояний меж объектами. Если r и p равны 2, то это расстояние равно Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава евклидовому расстоянию.

Процент различия (несогласия)

Эта мера употребляется в тех случаях, когда данные являются категориальными. Это расстояние рассчитывается как:

distance(x,y) = (Number of xi ¹ yi)/i

ПРАВИЛА ОБЪЕДИНЕНИЯ Либо СВЯЗИ

На первом шаге, когда каждый объект представляет собой отдельный кластер, расстояния меж этими объектами определяются избранной мерой Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава. Но когда связываются совместно несколько объектов, появляется вопрос, как надо найти расстояния меж кластерами? Другими словами, нужно правило объединения либо связи для 2-ух кластеров. Тут имеются разные способности: к примеру, вы сможете связать два кластера совместно, когда любые два объекта в 2-ух кластерах поближе друг к другу, чем соответственное расстояние связи. Другими Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава словами, вы используете «правило наиблежайшего соседа» для определения расстояния меж кластерами; этот способ именуется способом одиночной связи. Это правило строит «волокнистые» кластеры, другими словами кластеры, «сцепленные вместе» только отдельными элементами, случаем оказавшимися поближе других друг к другу. Как кандидатуру вы сможете использовать соседей в кластерах, которые находятся Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава далее всех других пар объектов друг от друга. Этот способ именуется способ полной связи. Существует также огромное количество других способов объединения кластеров, схожих тем, что подверглись рассмотрению.

Одиночная связь (способ наиблежайшего соседа).Как было описано выше, в этом способе расстояние меж 2-мя кластерами определяется расстоянием меж 2-мя более близкими объектами Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава (наиблежайшими соседями) в разных кластерах. Это правило должно, в известном смысле, нанизывать объекты вкупе для формирования кластеров, и результирующие кластеры имеют тенденцию быть представленными длинноватыми «цепочками».

Полная связь (способ более удаленных соседей).В этом способе расстояния меж кластерами определяются большим расстоянием меж хоть какими 2-мя объектами в разных кластерах (другими Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава словами «наиболее удаленными соседями»). Этот способ обычно работает прекрасно, когда объекты происходят по сути из реально разных «рощ». Если же кластеры имеют в неком роде удлиненную форму либо их естественный тип является «цепочечным», то этот способ непригоден.

Невзвешенное попарное среднее.В этом способе расстояние меж 2-мя разными Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава кластерами рассчитывается как среднее расстояние меж всеми парами объектов в их. Способ эффективен, когда объекты в реальности сформировывают разные «рощи», но он работает идиентично отлично и в случаях протяженных («цепочного» типа) кластеров. Отметим, что в собственной книжке Снит и Сокэл (Sneath, Sokal, 1973) вводят аббревиатуру UPGMA для ссылки на этот Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава способ, как на способ невзвешенного попарного арифметического среднего - unweighted pair-group method using arithmetic averages.

Взвешенное попарное среднее.Способ схож способу невзвешенного попарного среднего, кроме того, что при вычислениях размер соответственных кластеров (другими словами число объектов, содержащихся в их) употребляется в качестве весового коэффициента. Потому предлагаемый способ должен быть применен Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава (быстрее даже, чем предшествующий), когда предполагаются неравные размеры кластеров. В книжке Снита и Сокэла (Sneath, Sokal, 1973) вводится аббревиатура WPGMA для ссылки на этот способ, как на способ взвешенного попарного арифметического среднего - weighted pair-group method using arithmetic averages.

Невзвешенный центроидный способ.В этом способе расстояние меж 2-мя кластерами определяется как Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава расстояние меж их центрами тяжести. Снит и Сокэл (Sneath and Sokal (1973)) употребляют аббревиатуру UPGMC для ссылки на этот способ, как на способ невзвешенного попарного центроидного усреднения - unweighted pair-group method using the centroid average.

Взвешенный центроидный способ (медиана). Этот способ схож предшествующему, кроме того, что при вычислениях Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава употребляются веса для учёта различия меж размерами кластеров (другими словами числами объектов в их). Потому, если имеются (либо подозреваются) значимые отличия в размерах кластеров, этот способ оказывается лучше предшествующего. Снит и Сокэл (Sneath, Sokal 1973) использовали аббревиатуру WPGMC для ссылок на него, как на способ невзвешенного попарного центроидного усреднения - weighted pair Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава-group method using the centroid average.

Способ Варда.Этот способ отличается от всех других способов, так как он употребляет способы дисперсионного анализа для оценки расстояний меж кластерами. Способ минимизирует сумму квадратов (SS) для всех 2-ух (гипотетичных) кластеров, которые могут быть сформированы на каждом шаге. Подробности можно отыскать Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава в работе Варда (Ward, 1963). В целом способ представляется очень действенным, но он стремится создавать кластеры малого размера.

ВИЗУАЛИЗАЦИЯ РЕЗУЛЬТАТОВ КЛАСТЕРНОГО АНАЛИЗА

После проведения систематизации рекомендуется визуализировать результаты кластеризации методом построения дендрограммы (дендограммы). Для огромного числа объектов такая визуализация является единственным методом получить представление об общей конфигурации объектов.

Хотя от графического Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава представления данных в почти всех способах можно отрешиться, иерархические способы кластерного анализа становятся более приятными, если результаты расчета представить в виде специального графика, именуемого дендрограммой (дендограммой).

Представим, после внедрения 1-го из иерархических способов получены результаты систематизации в виде величин связи для пар объектов. Мысль построения дендрограммы явна – пары объектов соединяются в Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава согласовании с уровнем связи, отложенным по оси ординат (рис. VII.1).

Рис. VII.1. Дендрограмма иерархического способа

Диаграмма начинается с каждого объекта в классе (в нижней части диаграммы). Сейчас представим для себя, что равномерно (очень малыми шагами) вы «ослабляете» ваш аспект о том, какие объекты являются уникальными, а какие нет. Другими Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава словами, вы понижаете порог, относящийся к решению об объединении 2-ух либо более объектов в один кластер. В итоге, вы связываете вкупе всё большее и большее число объектов и агрегируете (объединяете) все в большей и большей степени кластеров, состоящих из все посильнее различающихся частей. Совсем, на последнем шаге все Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава объекты соединяются воединыжды совместно. На этих диаграммах вертикальные оси представляют расстояние объединения (в горизонтальных древовидных диаграммах горизонтальные оси представляют расстояние объединения). Так, для каждого узла в графе (там, где формируется новый кластер) вы сможете созидать величину расстояния, для которого надлежащие элементы связываются в новый единственный кластер. Когда данные имеют ясную Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава «структуру» в определениях кластеров объектов, схожих меж собой, тогда эта структура, вероятнее всего, должна быть отражена в иерархическом дереве разными ветвями. В итоге удачного анализа способом объединения возникает возможность найти кластеры (ветки) и интерпретировать их.

По оси абсцисс размещаются символические обозначения объектов исследования (векторов матрицы), а по оси ординат Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава – малые значения дистанционных коэффициентов, соответственных каждому шагу классифицирующей процедуры. Таким макаром, ось ординат употребляется для масштабного представления иерархических уровней группирования.

Наглядность и содержательная ценность древовидных графов значительно увеличиваются, если в их отражена информация не только лишь о тесноте внутригрупповых связей, да и о межгрупповых расстояниях h. Таковой дендровидный граф, учитывающий Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава не только лишь внутригрупповые расстояния, да и средние расстояния меж группами, именуется дендрографом.

Рудные тела редкометалльного месторождения приурочены к зонам натровых метасоматитов (альбититов). В итоге детализированного исследования минерального состава метасоматитов было установлено, что на месторождении развиты альбититы 2-ух типов. При этом редкометалльное оруденение типично только для 1-го Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава из их. По хим составу рудные и безрудные альбититы очень близки, потому различить их по содержанию отдельных хим частей не удается. Но некие различия в минеральном составе появляются в особенностях корреляционных связей меж элементами. Наглядно эти различия отражаются на графах (рис. VII.2, а, б) и дендрограммах (рис. VII.2, в, г). В качестве Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава меры близости частей при построении дендрограмм в этом случае употребляются конкретно парные коэффициенты корреляции, рассчитанные по 50 пробам, отобранным из рудных и безрудных альбититов, тип которых совершенно точно определен минералогическими исследовательскими работами. Предельное значение коэффициента корреляции для доверительной вероятности 0,95 при объеме выборок в 50 проб равен 0,28. Потому для Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава целей систематизации целенаправлено ассоциировать только те группы, для которых коэффициенты корреляции, отражающие тесноту внутригрупповой связи, превосходят данную величину.

Для обеих дендрограмм свойственна группа, объединяющая фосфор и редкоземельные элементы, что, по-видимому, обосновано присутствием в альбититах обоих типов апатита, в составе которого отмечены завышенные концентрации этих частей.

Основной отличительной особенностью безрудных альбититов является Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава тесноватая ассоциация сидерофильных частей (Ni—Cr—Ti—Со), которая в рудных альбититах распадается.

Для рудных альбититов свойственна ассоциация халькофильных частей (Pb—Zn), в то время как в безрудных альбититах корреляционная связь меж этими элементами отрицательная. Таким макаром кластер-анализ позволяет оперативно и довольно накрепко найти тип Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава альбититов по результатам спектральных анализов, не прибегая к детальному исследованию шлифов.

Рис VII.2. Свойства корреляционных связей меж содержаниями хим частей в альбититах:

а—граф по безрудным альбититам; б—граф по рудным альбититам; в—дендрограмма по безрудным альбититам; г—дендрограмма по рудным альбититам

Способ K-СРЕДНИХ

Этот способ кластеризации значительно отличается от таких агломеративных способов Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава, как древовидная кластеризация. Представим, вы уже имеете догадки относительно числа кластеров (по наблюдениям либо по переменным). Вы сможете указать системе образовать ровно три кластера так, чтоб они были так различны, как это может быть. Это конкретно тот тип задач, которые решает метод способа K-средних. В Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава общем случае способ K-средних строит ровно K разных кластеров, расположенных на может быть огромных расстояниях друг от друга.

С вычислительной точки зрения вы сможете рассматривать этот способ, как дисперсионный анализ «наоборот». Программка начинает с K случаем избранных кластеров, а потом изменяет принадлежность объектов к ним, чтоб: (1) - минимизировать изменчивость Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава снутри кластеров, и (2) - максимизировать изменчивость меж кластерами. Данный метод аналогичен способу «дисперсионный анализ наоборот» в том смысле, что аспект значимости в дисперсионном анализе ассоциирует межгрупповую изменчивость с внутригрупповой при проверке догадки о том, что средние в группах отличаются друг от друга. В кластеризации способом K-средних программка перемещает объекты (другими Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава словами наблюдения) из одних групп (кластеров) в другие для того, чтоб получить более весомый итог при проведении дисперсионного анализа

Обычно, когда результаты кластерного анализа способом K-средних получены, можно высчитать средние для каждого кластера по каждому измерению, чтоб оценить, как кластеры различаются друг от друга. В эталоне вы должны получить очень Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава различающиеся средние для большинства, если не для всех измерений, применяемых в анализе. Значения F-статистики, приобретенные для каждого измерения, являются другим индикатором того, как отлично соответственное измерение дискриминирует кластеры.

ФАКТОРНЫЙ АНАЛИЗ

Главным объектом исследования способами факторного анализа является корреляционная матрица, построенная с внедрением коэффициента корреляционного дела Пирсона (для количественных признаков). Предлагается Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава также внедрение других коэффициентов типа корреляции, созданных для порядковых, высококачественных и смешанных признаков, но опыта в этой области пока недостаточно. Главным требованием к построенной матрице является ее положительная полуопределенность. Эрмитова матрица именуется положительно полуопределенной, если все ее главные миноры неотрицательны. Из данного характеристики как раз и следует неотрицательность Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава всех собственных значений.

Способами факторного анализа решаются три главных вида задач:

· отыскание укрытых, но предполагаемых закономерностей, которые определяются воздействием внутренних либо наружных обстоятельств на изучаемый процесс;

· выявление и исследование статистической связи признаков с факторами либо главными компонентами;

· сжатие инфы методом описания процесса с помощью общих причин либо основных Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава компонент, число которых меньше количества сначало взятых признаков (характеристик), но с той либо другой степенью точности обеспечивающих проигрывание корреляционной матрицы.

Следует объяснить, что в факторном анализе понимается под сжатием инфы. Дело в том, что корреляционная матрица выходит методом обработки начального массива данных. Предполагался, что та же самая корреляционная матрица Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава может быть получена с внедрением тех же объектов, но обрисованных наименьшим числом характеристик. Таким макаром, типо происходит уменьшение размерности задачки, хотя по сути это не так. Это не сжатие инфы и в принятом смысле – вернуть начальные данные по корреляционной матрице нельзя.

Коэффициенты корреляции, составляющие корреляционную матрицу, по дефлоту Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава рассчитываются меж параметрами (признаками, тестами), а не меж объектами (индивидуумами, лицами), потому размерность корреляционной матрицы равна числу характеристик. Это так именуемая техника R. Но может быть, к примеру, исследована корреляция меж объектами (поточнее, их состояниями, описываемыми векторами характеристик). Эта методика именуется техникой Q. Проведение факторного анализа техникой Q обусловлено тем, что Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава состояния объектов могут иметь общую побудительную причину (предпосылки), которая (которые) как раз и может быть выявлена при помощи факторного анализа. Существует также техника Р, предполагающая анализ исследовательских работ, выполненных на одном и том же индивиде в разные промежутки времени («объекты» – один и тот же индивид в разные промежутки времени), при Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава этом изучаются корреляции меж состояниями индивида. Аналог техники Q для последнего варианта составляет предмет исследования техники O.

В базе всех способов факторного анализа лежит предположение, что изучаемая зависимость носит линейный нрав. Основное требование к начальным данным – это то, что они должны подчиняться многомерному нормальному рассредотачиванию. По последней Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава мере, должно быть изготовлено допущение о многомерном обычном рассредотачивании совокупы.

Редуцированием корреляционной матрицы именуется процесс подмены единиц на главной диагонали корреляционной матрицы некими величинами, именуемыми общностями. Общность – сумма квадратов факторных нагрузок. Общность данной переменной – та часть ее дисперсии, которая обоснована общими факторами. Это вытекает из догадки что полная дисперсия Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава складывается из общей дисперсии, обусловленной общими для всех переменных факторами, также специфичной дисперсии, обусловленной факторами, специфическими только для данной переменной, и дисперсии, обусловленной ошибкой.

Получение матрицы факторного отображения в принципе является целью факторного анализа. Ее строчки представляют собой координаты концов векторов, соответственных т переменным в r-мерном факторном пространстве. Близость концов Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава этих векторов дает представление о обоюдной зависимости переменных. Каждый вектор в сжатой, концентрированной форме несет информацию о процессе. Близость этих векторов дает представление о обоюдной зависимости переменных. Дополнительно, если число выделенных причин больше единицы, обычно делается вращение матрицы факторного отображения с целью получения так именуемой обычный структуры.

Для наглядности Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава результаты можно изобразить графически, что, но, проблематично для 3-х и поболее выделенных причин. Потому обычно дают изображение r -мерного факторного места в двумерных срезах.

В процессе решения задачки факторного анализа необходимо быть готовы к тому, что время от времени решение получить не удается. Это вызвано сложностью решаемой задачи Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава собственных значений корреляционной матрицы. К примеру, корреляционная матрица возможно окажется вырожденной, что может быть вызвано совпадением либо полной линейной корреляцией характеристик. Для матриц высоко порядка может произойти утрата значимости в процессе вычислений. Потому на теоретическом уровне нельзя исключить ситуацию, когда способы факторного анализа, к огорчению, окажутся неприменимы, по последней Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава мере до того времени, пока начальные данные не получится «исправить». Исправлены данные могут быть последующим образом. Выявите линейно зависимые характеристики при помощи, к примеру, способа и корреляционных плеяд (может быть применение и других способов) и оставьте в начальных данных только один из группы линейно зависимых характеристик.

Способ Основных Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава КОМПОНЕНТ

С повышением размерности признакового места растут трудности исследования геологических объектов, и появляется неувязка подмены бессчетных наблюдаемых признаков наименьшим их числом, без значимой утраты полезной инфы. Одним из более всераспространенных способов решения этой задачки является способ основных компонент.

Основой способа основных компонент является линейное преобразование т начальных переменных (признаков) в Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава т новых переменных, где любая новенькая переменная представляет собой линейное сочетание начальных. В процессе преобразования векторы наблюдаемых переменных заменяются новыми векторами (главными компонентами), которые заносят резко разные вклады в суммарную дисперсию многомерных признаков. Сокращение места признаков достигается методом отбора нескольких более информативных компонент, обеспечивающих основную долю суммарной дисперсии Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава, что приводит к приметному уменьшению их общего числа за счет менее информативных компонент, отражающих малые толики суммарной дисперсии.

Главные составляющие – это собственные векторы ковариационных матриц начальных признаков. Число собственных векторов ковариационной матрицы определяется числом изучаемых признаков, другими словами равно числу ее столбцов (либо строк). Каждый свой вектор (основная компонента) характеризуется своим Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава значением и координатами.

Собственные значения ковариационной матрицы (λj) – это длины ее собственных векторов, другими словами их дисперсии. Суммы собственных значений ковариационной матрицы равны ее следу, другими словами сумме ее диагональных частей.

Координаты собственного вектора ковариационной матрицы (ωij) – это числовые коэффициенты, характеризующие его положение в т мерном признаковом Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава пространстве. Число точечных координат каждого собственного вектора (ωij) – ω1, ω2, ..., ωm определяется размерностью места, а их численные значения – это коэффициенты линейных уравнений данного собственного вектора.

Собственные значения ковариационной матрицы находятся как характеристические корешки полиномиальных уравнений методом их решения. Но выполнить это для огромных значений т очень трудно. Потому в вычислительной практике их определяют Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава способами матричных преобразований (методом поочередных приближений к своим значениям), которые могут быть реализованы только при помощи ЭВМ. Способы отыскания координат собственных векторов симметричных матриц также сложны и требуют внедрения ЭВМ.

Так как ковариационные матрицы начальных признаков симметричны, их собственные векторы всегда ортогональны, а составляющие их переменные невзаимосвязаны Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава, другими словами не коррелированы меж собой.

В способе основных компонент координаты собственных векторов рассматриваются как нагрузки соответственных переменных на тот либо другой фактор. Они употребляются для расчета матриц нового (огромного количества совокупностей методом проектирования векторов начальных данных (признаков х1, х2, …, хm) на оси собственных векторов (γ1, γ2, …, γm):

, (VII.1)

где – нагрузки j-й составляющие Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава в i-й переменной признака. При помощи формулы (VII.1) начальная матрица наблюденных признаков размерности п x т пересчитывается в матрицу новых переменных (той же размерности), учитывающих собственные значения каждой из компонент. Если статистические (корреляционные) связи меж наблюденными признаками многомерного места появляются довольно ясно, то разложение начальной Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава матрицы наблюдений на т новых компонент приводит к приметному возрастанию контрастности рассредотачивания дисперсий по новым компонентам, в сопоставлении с начальными векторами. Обычно, дисперсия одной из основных компонент добивается половины и поболее от суммарной дисперсии признаков, а в совокупы с дисперсиями еще одной-двух следующих компонент, их общий вклад в суммарную дисперсию превосходит Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава 90%.

Таким макаром, без значимой утраты инфы об изменчивости наблюденных признаков можно приметно уменьшить размерность места наблюденных признаков (до p≤m), ограничившись данными по двум-трем более информативным основным компонентам. Это позволяет считать, что заместо начальной матрицы размерностью п x m, для целей геологического анализа может употребляться матрица Приложение I. Значения функции нормального распределения с параметрами 0 и 1 (для отрицательных значений Z) 3 глава основных компонент размерностью п x p (где p, обычно не превосходит 2 – 3). Так как новые переменные в этой матрице представлены некоррелированными величинами, способ основных компонент может рассматриваться как массивное средство определения настоящего числа линейно независящих векторов, содержащихся в начальной матрице.


prilozhenie-ii-tehnicheskoe-zadanie-forma-podachi-konkursnogo-predlozheniya-tablica-cen.html
prilozhenie-iii-ogranicheniya-i-novie-misli.html
prilozhenie-illyustracii-s-36-po-71-chast-2.html