Словарь статистических терминов

Поиск по словарю
Все термины | B | D | F | K | P | R | S | T | V | Z | А | Б | В | Г | Д | З | И | К | Л | М | Н | О | П | Р | С | Т | Ф | Х | Ц | Ч | Ш | Э

Все термины

Термин Определение
B

Показатели В представляют собой набор коэффициентов и константу регрессионного уравнения.Показатель В можно рассматривать как весовой коэффициент, характеризующий влияние соответствующей независимой переменной (предиктора) на зависимую переменную (критерий). Положительное значение В указывает на то, что с возрастанием предиктора значение критерия возрастает, а отрицательное значение В — на то, что значение критерия убывает.

df

См. Число степеней свободы.

F-критерий

В дисперсионном анализе отношение межгруппового среднего квадрата к впутригрушювому среднему квадрату. Данная величина позволяет сравнить межгрушювую дисперсию с внутригрупновой дисперсией. В случае если первая окажется значительно выше второй, это будет означать наличие значимого различия между группами. В множественном регрессионном анализе F-критерий позволяет определить значимость множественной корреляции.

K

В иерархической логлинейной модели порядок взаимодействия эффектов; k = 1 соответствует первому порядку (одна переменная), k = 2 — второму порядку (две переменные), и т. д.

p-уровень

См. Значимость.

R

Множественный коэффициент корреляции между зависимой переменной и двумя или более независимыми переменными. Значение R лежит в пределах от 0 до 1 и интерпретируется но аналогии с обычным (двухмерным) коэффициентом корреляции.

R?

Квадрат коэффициента множественной корреляции (коэффициент детерминации), доля дисперсии зависимой переменной, обусловленная воздействием двух или более независимых переменных.

S-стресс

В многомерном шкалировании мера степени соответствия модели исходной матрице различий. Чем меньше это значение, тем лучше соответствие.

t-критерий

Критерий для определения статистической значимости различия двух средних.

t-критерий в регрессионном анализе

Критерий, определяющий статистическую значимость корреляций, равен отношению коэффициента B к своей стандартной ошибке.

t-критерий для зависимых выборок

Критерий, сравнивающий средние значения двух распределений для одной и той же выборки.

t-критерий для независимых переменных

Критерий, сравнивающий средние значения одной и той же переменной для двух независимых выборок.

t-критерий для одной выборки

Критерий, предназначенный для сравнения среднего значения распределения переменной с некоторой эталонной величиной.

V Крамера

Мера ассоциации между значениями двух категориальных переменных. Значение V всегда варьирует от 0 до 1 и интерпретируется по аналогии с коэффициентом корреляции (исключая отсутствие отрицательных значений). Нередко используется в контексте ??-анализа; вычисление осуществляется по формуле (k — наименьшее из количеств строк и столбцов):

z-значения

Также называются стандартизованными значениями. После стандартизации (или 2-преобразования) значений переменной среднее равно 0, стандартное отклонение равно 1. Стандартизованное значение может характеризовать направление и степень отклонения исходного значения от среднего. Для стандартизованных значений, превышающих по модулю 1,96, уровень значимости оказывается ниже 0,05.

Альфа (α)

Мера внутренней согласованности измерительной шкалы, вычис­ляемая по формуле ? = rk / [1+(k-1)r], где k - число переменных в анализе, r - среднее значение корреляции между пунктами шкалы. Значение ? зависит от числа переменных, поэтому нет точной интерпретации его величины; тем не менее в большинстве случаев действует следующая оценка согласованности шкалы:

  • α > 0,9 — отличная;
  • α > 0,8 — хорошая;
  • α > 0,7 — приемлемая;
  • α > 0,6 — сомнительная;
  • α > 0,5 — малопригодная;
  • α < 0,5 — недопустимая.
Альфа, если элемент удален

В анализе надежности значение ? для шкалы, по­лучающейся путем удаления текущего ее пункта.

Априорная вероятность для каждой группы

Вероятность, характеризующая предполагаемое соотношение численности групп. Для каждой из двух групп она равна 0,5, если предполагается, что их численность одинакова.

Артефакт

(лат. arte factum — сделанный искусственно) — результат исследования, являющийся следствием изменения зависимой переменной под влиянием побочных переменных. Артефакт есть следствие ошибок или недостаточного контроля условий проведения исследования. Одно и то же явление может быть артефактом в рамках одной экспериментальной схемы и фактом в рамках другой, поэтому явления, не объясняемые принятой теорией, часто трактуются как артефакты.

Асимметричная матрица

Квадратная матрица, у которой хотя бы в одной паре ячеек, симметрично расположенных относительно главной диагонали, значения различны. Корреляционная матрица является типичным примером асимметричной матрицы.

Асимметрия

Мера отклонения распределения от нормального характеризующая симметричность графика.

Асимптотические значения

Величины, на которых основано определение оце­нок параметров. Оценки параметров вычисляются в случаях, когда определение точных значений невозможно, в частности, в регрессионном анализе и некото­рых других статистических процедурах.

Балансировка

Способ контроля действия внешних (дополнительных) переменных, при котором каждой группе испытуемых предъявляют различные сочетания независимой и дополнительных переменных.

Барлетта критерий сферичности

Критерий многомерной нормальности для распределения переменных. Помимо нормальности критерий проверяет, отличаются ли корреляции от 0. Значение p-уровня меньшее 0,05, указывает на то, что данные вполне приемлемы для проведения факторного анализа.

Безупречный эксперимент

Включает в себя следующие признаки:

  1. эксперимент, в котором устранены все источники систематических смешений — идеальный эксперимент;
  2. эксперимент, в котором бесконечное число проб применяется к бесконечному числу испытуемых, позволяющий учесть бесконечное число побочных переменных;
  3. эксперимент полного соответствия, полностью копирующий реальность по Р.Готтсданкеру.
Бета (?)

В регрессионном анализе ? означает стандартизованный коэффициент регрессии и представляет собой ?-коэффициент для нормализованных переменных. Значения ? всегда лежат в интервале от -1 до +1 и могут сравниваться друг с другом для разных переменных.

Бета при включении

Данная величина используется во множественном регрессионном анализе для переменных, не вошедших в уравнение регрессии, и представляет собой значение коэффициента ?, рассчитанного в предположении, что соответствующая переменная была включена в регрессионное уравнение.

Биномиальный критерий

Непараметрический критерий, определяющий степень близости эмпирического распределения бинарной переменной к биномиальному распределению, для которого частоты двух категорий равны.

Бонферрони критерий

Критерий для множественного сравнения средних, если в дисперсионном анализе получен значимый результат.

Валидизация

Процесс оценки степени, в которой тест или другой измерительный инструмент действительно измеряет то, для измерения чего он предназначен.

Валидности коэффициент

Индекс валидности теста; коэффициент корреляции между значениями теста и набором критериальных оценок, которые рассматриваются как отражающие переменную (переменные), которую, как предполагается, этот тест измеряет. Например, для теста, разработанного для оценки школьных способностей, это будет корреляция между экзаменационными отметками и академическими успехами.

Валидность

В тестировании - свойство любого измерительного инструмента, прибора или теста, при котором он измеряет то, что предназначен измерять.

Валидность априорная

Своего рода предварительная, интуитивная оценка содержательной валидности теста. Степень, в которой пункты теста, как кажется, имеют интуитивную, априорную связь с моделями поведения, которые, как считается, они тестируют. Также называется валидностью здравого смысла.

Валидность внешняя

Соответствие конкретного исследования природной реальности и/или другим подобным исследованиям. Определяет возможность переноса и/или обобщения результатов на другие объекты и условия исследования. Зависит от репрезентативности выборки и соответствия контролируемых в исследовании дополнительных переменных, их вариативности в других условиях. Частной формой внешней валидности является экологическая валидность, определяющая возможность распространить выводы конкретного исследования на реальные условия, а не на иные лабораторные условия.

Валидность внутренняя

Соответствие конкретного исследования идеальному; оценивает изменение зависимой переменной, определяется влиянием независимой переменной, а не другими причинами. Внутренняя валидность зависит от систематического изменения влияния независимой и других переменных от неэквивалентности и изменения сравниваемых групп в ходе эксперимента.

Валидность конструктная

Характеризует точность реализации теоретической гипотезы в процедуре эксперимента. Является одним из проявлений внутренней валидности. Определяет область явлений, исследуемых в эксперименте. В психологической диагностике конструктная валидность характеризует степень измеряемого свойства в результатах тестирования.

Валидность критериальная

Отражает соответствие диагноза и прогноза, полученного на основе данных тестирования, деятельностным и жизненным показателям; включает в себя текущую и прогностическую валидность.

Валидность операциональная

Соответствие операций экспериментатора теоретическому описанию переменных, контролируемых в исследовании. Варьируемые экспериментатором условия должны соответствовать независимой переменной. Операциональная валидность является одним из проявлений внутренней валидности.

Валидность содержательная (очевидная)

Соответствие целей и процедуры исследования обыденным представлениям испытуемого о природе изучаемого явления. Имеет мотивационное значение для испытуемых и является в некоторых исследованиях одной из составляющих внешней валидности.

Валидность экологическая

Вид внешней валидности, характеризует соответствие процедуры и условий лабораторного исследования «естественной» реальности.

Вальда критерий

В модели логистической регрессии критерий значимости коэффициента В для соответствующего предиктора. Чем выше его значение (вместе с числом степеней свободы), тем выше значимость.

Вероятность

Ожидаемая относительная частота некоторого события.

Взаимодействие

Эффект совместного влияния на зависимую переменную двух и более независимых переменных, который не сводится к их раздельному влиянию. В случае двух независимых переменных проявляется в том, что эффект влияния одной из них проявляется по-разному на разных уровнях другой переменной.

Вилкоксона критерий

Непараметрический критерий, сходный с критерием знаков, однако в отличие от последнего использующий ранги положительных и отрицательных разностей.

Внутригрупновая сумма квадратов

Сумма квадратов отклонений наблюдаемых значений от среднего для каждой группы.

Внутригрупповой многомерный дисперсионный анализ (MANOVA)

Вид дисперсионного анализа, в котором одна и та же группа объектов подвергается действию каждого уровня независимой переменной. То же самое, что и многомерный дисперсионный анализ с повторными измерениями.

Вращение

Процедура, применяемая в факторном анализе для того, чтобы получить более простую структуру факторов.

Выборка
  1. Подмножество объектов из некоторой генеральной совокупности, выбранное для статистических выводов относительно свойств всей совокупности.
  2. Часть популяции, отобранная (обычно следуя некоторой процедуре и преследуя некоторую цель) таким образом, что она считается представляющей всю популяцию в целом.
  3. Составление такой избранной части популяции. Этот термин часто употребляется с определяющими словами, чтобы уточнить вид обсуждаемой выборки или процедуры отбора.
Выборка «удобная»

Процедура «удобной» выборки состоит в установлении контактов с «удобными» единицами выборки - с группой студентов, спортивной командой, с друзьями и соседями. Если необходимо получить информацию о реакции людей на новую концепцию, такая выборка вполне обоснованна. «Удобную» выборку часто используют для предварительного тестирования анкет.

Выборка адекватная

Выборка достаточного размера для того, чтобы был достигнут предполагаемый уровень достоверности. Обратите внимание, что этот термин относится только к размеру и не означает одновременно репрезентативности выборки.

Выборка квотная

выборка строится как модель, которая воспроизводит структуру генеральной совокупности в виде квот (пропорций) изучаемых признаков. Число элементов выборки с различным сочетанием изучаемых признаков определяется с таким расчётом, чтобы оно соответствовало их доле (пропорции) в генеральной совокупности. Так, например, если генеральная совокупность у нас представлена 5000 человек, из них 2000 женщин и 3000 мужчин, тогда в квотной выборке у нас будут 20 женщин и 30 мужчин, либо 200 женщин и 300 мужчин. Квотированные выборки чаще всего основываются на демографических критериях: пол, возраст, регион, доход, образование и прочих.Плюсы: обычно такие выборки репрезентативны. Минусы: применение данного способа построения выборки возможно при наличии достаточно полной информации о генеральной совокупности.

Выборка нерепрезентативная

Любая выборка, характеристики которой не отражают характеристики популяции, из которой она была отобрана.

Выборка по методу

Выборка строится следующим образом. У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов (например, респондентов, имеющих высокий доход, респондентов, принадлежащих к одной профессиональной группе, респондентов, имеющих какие-либо схожие хобби/увлечения и т.д.)

Выборка простая бесповторная

Вид простой вероятностной выборки. Использование такой выборки основывается на предположении, что каждый респондент с равной долей вероятности может попасть в выборку. На основе списка генеральной совокупности составляются карточки с номерами респондентов. Они помещаются в колоду, перемешиваются и из них наугад вынимается карточка, записывается номер, карточки с номерами респондентов не возвращаются обратно в колоду.

Выборка простая повторная

Вид простой вероятностной выборки. Использование такой выборки основывается на предположении, что каждый респондент с равной долей вероятности может попасть в выборку. На основе списка генеральной совокупности составляются карточки с номерами респондентов. Они помещаются в колоду, перемешиваются и из них наугад вынимается карточка, записывается номер, потом возвращается обратно. Далее процедура повторяется столько раз, какой объём выборки нам необходим. Минус: повторение единиц отбора.

Выборка районированная

В случае неоднородной генеральной совокупности, прежде, чем использовать вероятностную выборку с любой техникой отбора, рекомендуется разделить генеральную совокупность на однородные части, такая выборка называется районированной. Группами районирования могут выступать как естественные образования (например, районы города), так и любой признак, заложенный в основу исследования. Признак, на основе которого осуществляется разделение, называется признаком расслоения и районирования.

Выборка районированная с отбором типичных объектов

Если после районирования из каждой группы отбирается типичный объект, т.е. объект, который по большинству изучаемых в исследовании характеристик приближается к средним показателям, такая выборка называется районированной с отбором типичных объектов.

Выборка репрезентативная

Любая выборка, которая является точным отражением популяции, из которой она была отобрана; непредвзятая выборка. Все систематические процедуры отбора образцов разработаны для того, чтобы создавать репрезентативные выборки.

Выборка серийная (гнездовая)

Единицы отбора представляют собой статистические серии (семья, школа, бригада и т.п.). Отобранные элементы подвергаются сплошному обследованию. Отбор статистических единиц может быть организован по типу случайной или систематической выборки. Минус: Возможность большей однородности, чем в генеральной совокупности.

Выборка систематическая вероятностная

Является упрощенным вариантом простой вероятностной выборки. На основе списка генеральной совокупности через определённый интервал (К) отбираются респонденты. Величина K определяется случайно. Наиболее достоверный результат достигается при однородной генеральной совокупности, иначе возможны совпадение величины шага и каких-то внутренних циклических закономерностей выборки (смешение выборки). Минусы: такие же как и в простой вероятностной выборке.

Выборка стихийная

Выборка так называемого «первого встречного». Часто используется в теле- радио- опросах. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов.Минусы: невозможно установить какую генеральную совокупность представляют опрошенные, и как следствие – невозможность определить репрезентативность.

Генеральная сосокупность

Всё множество объектов, обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени, входящих в предмет изучения в соответствии с программой исследования. В социальных науках под объектами исследования и, соответственно, выборку составляют люди, но генеральную совокупность также могут составлять другие объекты (домохозяйства, предприятия, населенные пункты и т.д.).

Гистограмма

Столбиковая диаграмма для отображения распределения частот по категориям (диапазонам значений) переменной. Горизонтальная ось графика соответствует значениям переменной, а вертикальная — частотам.

Главный эффект

Воздействие независимой переменной на зависимую переменную.

График собственных значений

Диаграмма, позволяющая выбрать число факторов в факторном анализе на основе критерия каменистой осыпи Р.Кеттелла.

Гуттмана критерий половинного расщепления

В анализе надежности половинного расщепления значение надежности, полученное с помощью процедуры нижних пределов.

Дендрограмма

Диаграмма древовидной структуры, иллюстрирующая процесс кластеризации в кластерном анализе.

Детерминант ковариационно-дисперсионной матрицы

Величина, характеризующая степень зависимости между значениями переменных. Чем меньше значение детерминанта, тем сильнее соответствующая зависимость. Эта величина используется при вычислении М Бокса. Детерминант общей дисперсионно-ковариационной матрицы учитывает все матрицы, используемые в анализе.

Диаграмма последовательности слияния

Графическая интерпретация пошаговой процедуры кластеризации в кластерном анализе.

Диаграмма рассеивания

График для анализа связи между двумя переменными, на котором каждый объект представляет собой точку. Положение точки задано парой значений двух переменных для данного объекта.

Диаграмма регрессии

Диаграмма разброса, включающая сдвиги точек от линии регрессии по вертикальной оси.

Дискриминантный анализ

Процедура создания формулы регрессии, на основе которой производится разбиение объектов на группы, соответствующие категориям зависимой переменной.

Дисперсии элементов

Аналог средних значений элементов (пунктов шкалы) в анализе надежности.

Дисперсионный анализ (ANOVA)

Статистический анализ, устанавливающий статистическую значимость различий между средними значениями для трех или более выборок.

Дисперсия

Характеристика выборочного распределения переменной, описывающая разброс значений вокруг среднего и вычисляемая как отношение суммы квадратов отклонений к объему выборки, уменьшенному на 1. Кроме того, дисперсия представляет собой квадрат стандартного отклонения.

Дисперсия шкалы, если элемент удален

Дисперсия суммы всех пунктов шкалы, кроме удаленного пункта.

Доверительный интервал

Диапазон, в котором находится большинство значений выборки. Например, термин "доверительный интервал в 95%" означает интервал, в который любое случайное значение из выборки попадает с вероятностью 95%.

Доверительный интервал в 95%

См. Доверительный интервал

Знаков критерий

Непараметрический критерий, определяющий различие двух измерений для одной выборки на основе знаков разностей пар значений.

Значимость (p-уровень)

Мера случайности полученного результата, равная вероятности того, что в генеральной совокупности этот результат (различия, связь) отсутствует. Чем меньше эта вероятность (значение р-уровня), тем выше статистическая значимость результата. Результат считается статистически достоверным (значимым), если р-уровень не превышает 0,05.

Изменение R?

Изменение величины R? в результате введения новой переменной в уравнение регрессии.

Исправленная величина R?

Во множественном регрессионном анализе величина R? является точной для выборок, однако в генеральной совокупности ее значение лишь приблизительно. Исправленная величина R? представляет собой более точную оценку R? для генеральной совокупности и используется при сравнениях моделей, содержащих различное число независимых переменных.

Итерация

Стадия процесса формирования регрессионного (дискриминантного) уравнения, на которой происходит включение или исключение очередной переменной. Процесс продолжается до тех пор, пока не перестанет удовлетворяться заданный в процедуре критерий.

Кайзера-Мейера-Олкина критерий адекватности выборки

Величина, характеризующая степень применимости факторного анализа к данной выборке. Правило интерпретации этого критерия следующее:

  • более 0,9 — безусловная адекватность;
  • более 0,8 — высокая адекватность;
  • более 0,7 — приемлемая адекватность;
  • более 0,6 — удовлетворительная адекватность;
  • более 0,5 — низкая адекватность;
  • менее 0,5 — факторный анализ к выборке.
Канонические коэффициенты

В дискриминантом анализе канонический коэффициент представляет собой корреляцию между оценками дискриминантной функции и уровнями зависимой переменной.

Канонические дискриминантные функции

Одно или более линейное дискриминантное уравнение, построенное таким образом, что классификация объектов по уровням зависимой переменной происходит наиболее точно.

Категориальная (номинативная) переменная

Переменная, каждое значение которой указывает на принадлежность объекта к определенной группе (категории). Категориальная переменная не является количественной; она разделяет все объекты на непересекающиеся группы по определенному признаку (пол, хобби, класс и пр.), но не позволяет сравнивать объекты по уровню выраженности этого признака.

Квадрат евклидового расстояния

Мера, используемая по умолчанию в кластерном анализе для определения расстояния между объектами и кластерами и вычисляемая как сумма квадратов разностей между значениями переменных двух объектов.

Квадрат эта (??)

Доля дисперсии зависимой переменной, обусловленная воздействием со стороны независимой переменной. Так, ?? = 0,044 означает, что 4,4 % дисперсии зависимой переменной обусловлено данной независимой переменной.

Квадратная матрица

Матрица, строки и столбцы которой соответствуют одной и той же последовательности элементов (переменных или объектов).

Квартили

25, 50 и 75-й процентили.

Кластерный анализ

Процедура, на основе заданного правила объединяющая объекты или переменные в группы, называемые кластерами.

Ковариата

Количественная переменная, имеющая значительную корреляцию с зависимой переменной и включаемая в анализ для более точной проверки воздействий факторов на зависимую переменную.

Количественная переменная

Значения количественной переменной (в отличие от категориальной) отражают уровень выраженности у объектов соответствующего признака в метрической или порядковой шкале.

Колмогорова-Смирнова критерий для одной выборки

Непараметрический критерий, определяющий, отличается ли данное эмпирическое распределение от теоретического распределения (нормального, равномерного, Пуассона или экспоненциального).

Контрасты

Метод контрастов — это метод множественного сравнения средних в дисперсионном анализе, который позволяет сравнивать выборки по градациям независимой переменной. Например, контрасты позволяют сравнивать одну градацию с другой, одну градацию со всеми остальными или разбить все градации на 2 группы и затем сравнить их между собой.

Корреляция

Мера степени и направления связи между значениями двух переменных.

Корреляция между формами

В анализе надежности половинного расщепления приближенное значение надежности измерения в предположении, что обе половины содержат одинаковое число пунктов.

Корреляция между элементами

В анализе надежности это описательная информация о корреляциях каждого пункта с суммой всех остальных пунктов.

Коэффициент корреляции

Мера связи двух переменных, обозначаемая символом r и принимающая значения от -1 до +1.

Коэффициенты регрессии

В-коэффициенты, то есть множители при переменных, входящих в состав регрессионного уравнения, а также константа.

Критерий согласия

В логлинейном анализе критерий ?? для определения степени адекватности модели исходным данным. Чем выше его значения и чем ниже соответствующие уровни значимости, тем хуже модель соответствует данным.

Левина критерий

Критерий, предназначенный для проверки гипотезы о том, что все распределения зависимой переменной для сравниваемых выборок имеют одинаковые дисперсии.

Линия регрессии

Прямая линия на графике двухмерного рассеивания, отражающая наиболее точные прогнозируемые значения («линия наилучшего соответствия»).

Логарифмический детерминант

В дискриминантном анализе натуральный логарифм определителя каждой ковариационной матрицы. Логарифмический определитель используется для вычисления М Бокса.

Логит

Натуральный логарифм шанса.

Лямбда Уилкса

Отношение внутригрупповой суммы квадратов к общей сумме квадратов, характеризующее дисперсию оценок дискриминантной функции, не обусловленную различиями между двумя группами. Единичное значение лямбда принимает в случае, если наблюдаемые средние значения групп равны; значения, близкие к нулю, означают, что внутригрупповая дисперсия мала по сравнению с общей дисперсией.

М Бокса (М)

Критерий многомерной нормальности, основанный на близости значений определителей матриц ковариаций двух или более групп.

Максимум

Наибольшее наблюдаемое значение распределения переменной.

Манна-Уитни и Вилкоксона критерий ранговых сумм

Непараметрический аналог t-критерия, определяющий различие между двумя выборками на основе рангов.

Матрица различий

Матрица, каждое значение которой соответствует различию между двумя объектами.

Матрица трансформации факторов

Результатом умножения этой матрицы и матрицы факторных нагрузок до вращения является матрица нагрузок факторов после вращения.

Медиана

Значение переменной, делящее упорядоченное множество всех значений выборки ровно пополам: у половины объектов выборки значения переменной больше, а у другой половины меньше медианы.

Медианный критерий k выборок

Непараметрический критерий для сравнения двух и более выборок по уровню выраженности признака; основан на подсчете числа элементов, лежащих выше и ниже главной медианы.

Межгрупповая сумма квадратов

Сумма квадратов разностей между главным средним значением и средними значениями групп, умноженных на весовые коэффициенты, равные числу объектов в соответствующих группах.

Метод главных компонентов

Метод, применяемый SPSS по умолчанию в факторном анализе для извлечения факторов.

Метод иерархического слияния

Метод, используемый в кластерном анализе, при выполнении которого объекты объединяются в кластеры по одному на каждом шаге до тех пор, пока не будет образован единственный кластер, охватывающий все объекты.

Метрическая переменная

Количественная переменная, соответствующая измерению признака в шкале интервалов или отношений. В отличие от ранговой (порядковой) переменной, при сравнении объектов позволяет судить не только о том, больше или меньше выражен признак, но и о том, насколько больше (меньше) он выражен.

Минимум

Наименьшее наблюдаемое значение распределения переменной.

Многомерное шкалирование

Метод, позволяющий на основе матрицы различий между объектами построить одно-, двух- или трехмерное изображение, иллюстрирующее удаленность этих объектов друг от друга.

Многомерные критерии значимости

В многомерном дисперсионном анализе набор критериев, позволяющих определить влияние факторов и их взаимодействий на совокупность зависимых переменных. Наиболее мощным считается критерий Пилая.

Многомерный дисперсионный анализ (MANOVA)

Отличие многомерного дисперсионного анализа от одномерного (ANOVA) заключается в том, что число зависимых переменных в нем может быть теоретически любым.

Многомерный дисперсионный анализ с повторными измерениями

Вид дисперсионного анализа, в котором одна и та же группа объектов подвергается действию каждого уровня независимой переменной. С точки зрения вычислений этот анализ можно назвать внутригрупповым.

Многомерный ковариационный анализ (MANCOVA)

Многомерный дисперсионный анализ с включением в анализ ковариат.

Многомерный критерий однородности матриц ковариаций

Критерий М Бокса определяет, являются ли ковариационные матрицы одинаковыми. Для каждого из значений вычисляется р-уровень, а также величина F или ??.

Множественный регрессионный анализ

Метод, позволяющий спрогнозировать значения зависимой переменной на основе известных значений независимых переменных.

Мода

Наиболее часто повторяющееся значение распределения переменной.

Моучли критерий сферичности

Критерий многомерной нормальности. SPSS вычисляет приблизительное значение ?? и соответствующий уровень значимости. Если уровень значимости оказывается менее 0,05, то, вероятно, данные не являются нормально распределенными.

Наблюдаемое значение или частота

В ??-анализе фактическая частота категории.

Надежность половинного расщепления

Мера надежности, для вычисления которой все пункты шкалы делятся на две эквивалентные группы, а затем на основе корреляции между двумя половинами шкалы устанавливается ее внутренняя согласованность.

Наименьшая ожидаемая частота

Наименьшая частота в ячейке таблицы сопря­женности, определяемая в процессе применения критерия ??.

Наименьшей значимой разности критерий

Критерий множественного сравнения средних, представляющий собой серию t-критериев; применяется, если в дисперсионном анализе получен значимый результат.

Накопленная частота

Суммарное число объектов, имеющих значение переменной, не большее, чем указано.

Накопленный процент

Процент объектов от общего числа, имеющих значение переменной, не большее, чем указано.

Насыщенная модель

Логлинейная модель, включающая все взаимодействия и главные эффекты факторов.

Нелинейная регрессия

Процедура вычисления параметров нелинейного регрессионного уравнения.

Неортогональное вращение

Процедура, используемая в факторном анализе, допускающая результат, в котором угол между факторами отклоняется от прямого. Это иногда желательно для достижения более простой структуры.

Непараметрические критерии

Серия критериев, каждый из которых применяется без предварительных допущений относительно нормальности распределения. Непараметрические критерии основаны на ранжировании, попарных сравнениях и других средствах, не требующих нормальности распределения переменных.

Нестандартизированные коэффициенты канонической дискриминантной функции

Список коэффициентов и константа дискриминантного уравнения.

Номинативная шкала

См. Категориальная переменная

Нормальное распределение

Распределение частот (вероятностей), графически представляемое в виде симметричной кривой, имеющей пик в центре и асимптотически приближающееся к горизонтальной оси по краям. Идеальное нормальное распределение характеризуется нулевыми значениями асимметрии и эксцесса.

Общая внутригрупповая ковариационная матрица

Матрица, состоящая из средних значений ковариационных матриц, вычисленных для каждого уровня зависимой переменной.

Общая сумма квадратов

Сумма квадратов отклонений всех значений от среднего значения всего распределения.

Общность

В факторном анализе мера, характеризующая долю дисперсии переменной, обусловленную воздействием всех факторов.

Одномерные F-критерии

В многомерном дисперсионном анализе критерии, которые характеризуют влияние независимых переменных и их взаимодействий на каждую зависимую переменную в отдельности.

Ожидаемое значение

В перекрестной таблице при использовании критерия ?? значение, вычисляемое в предположении, что все переменные являются полностью независимыми друг от друга. В регрессионном анализе термин «ожидаемое значение» эквивалентен термину «прогнозируемое значение» и означает величину, получаемую для каждого объекта в результате подстановки значений переменных для него в уравнение регрессии.

Остатки и стандартизованные остатки

В логлинейных моделях остатки представляют собой разности между ожидаемыми и наблюдаемыми частотами. Чем выше значения остатков, тем менее адекватной является модель. SPSS подсчитывает исправленные величины остатков с использованием оценок стандартного отклонения. Исправленные остатки представлены в единицах нормального распределения, и, как правило, значения остатков, по модулю превышающие 1,96, являются значимыми.

Остаток

Как правило, разность между наблюдаемым и ожидаемым значениями. Эта величина относится к части дисперсии, которая не объясняется воздействием независимых переменных.

Отклонение

Расстояние и направление (отрицательное или положительное) между средним и данным значениями.

Оценка дискриминантной функции

Значение, получаемое для каждого объекта путем подстановки значений его переменных в уравнение дискриминантной функции.

Параметр

Некоторая числовая характеристика генеральной совокупности.

Параметрические критерии

Критерии, применяемые в предположении о нормальном распределении переменных в генеральной совокупности.

Переменные в уравнении

При выводе результатов пошагового регрессионного анализа SPSS включает для каждого шага статистики тех переменных, которые вошли в уравнение регрессии.

Пирсона коэффициент корреляции

Мера корреляции, идеально подходящая для двух непрерывных (метрических) переменных.

Порядковая (ранговая) шкала

См. Ранговая переменная

Пошаговый выбор переменных

Процедура, включающая и исключающая переменные из дискриминантного или регрессионного уравнения в соответствии с выбранными критериями.

Прямоугольная матрица

Матрица, для которой строкам и столбцам соответствуют разные последовательности элементов (объектов или переменных).

Размах

Характеристика распределения, равная разности между минимумом и максимумом распределения.

Ранговая (порядковая) переменная

Количественная переменная, отражающая измеренное качество на уровне порядка: в большей или меньшей степени оно выражено. В отличие от метрической шкалы не позволяет судить о том, насколько больше или меньше выражено качество, поэтому не допускает применения арифметических операций.

Распределение

Статистическое понятие, обозначающее соотношение значений признака и частот (вероятностей) их встречаемости. Распределение (вероятностей, частот) может быть представлено в виде формулы для функции распределения вероятностей, графика распределения частот (гистограммы, столбиковой диаграммы), таблицы распределения частот.

Регрессионный анализ

Инструмент статистики, позволяющий прогнозировать значения зависимой переменной с помощью известных значений независимых переменных.

Регрессия

В множественном регрессионном анализе этим термином обозначается статистика, отражающая влияние предикторов на зависимую переменную.

Репрезентативнсть выборки

Свойство выборки воспроизводить характеристики генеральной совокупности. Таким образом, выборка должно быть копией генеральной совокупности относительно характеристик, существующих для цели исследования. Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей.

Серий критерий

Непараметрический критерий, определяющий, является ли последовательность бинарных величин (событий) случайной или упорядоченной.

Симметричная матрица

Квадратная матрица, для которой в каждой паре ячеек, расположенных симметрично относительно главной диагонали, содержатся одинаковые значения. Типичным примером симметричной матрицы является корреляционная матрица.

Скорректированная корреляция пункта и суммы

В анализе надежности корреляция между пунктом шкалы и суммой всех остальных пунктов.

Собственное значение

Собственное значение В факторном анализе эта величина пропорциональна доле дисперсии, обусловленной влиянием данного фактора; в дискриминантном анализе отношение межгрупповой суммы квадратов к внутригрупповой сумме квадратов. Чем больше собственное значение, тем выше точность дискриминантной функции.

Спирмена-Брауна критерий эквивалентных форм

Используется в анализе надежности, когда число элементов в «половинах» одинаково (вычисляется коэффициент корреляции).

Спирмена—Брауна критерий неэквивалентных форм

В анализе надежности половинного расщепления – надежность, вычисленная для случая, когда «половины» имеют неравный размер.

Среднее шкалы, если элемент удален

В анализе надежности для каждого пункта шкалы вычисляется сумма остальных пунктов по всем объектам выборки; отношение указанной суммы к числу объектов является средним шкалы, если данный элемент удален.

Средние значения элементов

В анализе надежности (с применением альфа Кронбаха) — описательная информация, касающаяся средних значений пунктов шкалы по всем объектам.

Средний квадрат

Отношение суммы квадратов к числу степеней свободы. В однофакторном дисперсионном анализе, как правило, средний квадрат вычисляется для внутригрупповой и межгрупповой сумм квадратов, а в регрессионном анализе — для регрессионной и остаточной сумм квадратов. Во всех перечисленных случаях средний квадрат используется для вычисления F-критерия.

Стандартизованный коэффициент ?

В анализе надежности — значение ? полученное в случае, если перед проведением анализа стандартизовать распределе­ния всех элементов шкалы.

Стандартная ошибка

Стандартное отклонение величины, получаемое в результате ее многократного вычисления для случайных выборок. Как правило, стандартная ошибка вычисляется для среднего значения распределения.

Стандартное отклонение

Мера разброса значений распределения вокруг среднего. Стандартное отклонение определяется как квадратный корень дисперсии (суммы квадратов отклонений от среднего, деленной на N - 1, где N- объем выборки).

Статистики для сумм переменных

В анализе надежности статистические характеристики суммы всех переменных по объектам.

Столбиковая диаграмма

График распределения частот по категориям (значениям) переменной. Каждый столбец на графике соответствует одному значению признака, а его высота пропорциональна частоте встречаемости этого значения. Аналогичное средство для количественных переменных, имеющих большое число возможных значений, обычно называется гистограммой.

Стресс

В многомерном шкалировании мера соответствия модели исходной матрице различий. Чем меньше значение стресса, тем лучше соответствие модели.

Стьюдента критерий

См. t-критерий.

Сумма квадратов

Стандартная мера разброса, представляющая собой сумму квадратов отклонений всех значений величины от среднего значения.

Таблица распределения (частот)

Таблица, устанавливающая соотношение между категориями (значениями) признака и частотами их встречаемости.

Таблица сопряженности (кросстабуляции)

Обычно таблица совместного распределения частот для двух категориальных или дискретных переменных; строки соответствуют категориям (значениям) одной, а столбцы — другой переменной.

Толерантность

Мера линейной зависимости между одной переменной и набором других переменных. Если при дискриминантном анализе уровень толерантности составляет менее 0,001, это означает, что линейная зависимость для данной переменной настолько высока, что ее включение в дискриминантное уравнение недопустимо.

Тьюки критерий подлинной значимости

Критерий множественного сравнения, позволяющий попарно сравнивать средние значения; применяется, если дисперсионный анализ показал значимый результат.

Фактор

В факторном анализе объединение нескольких переменных, чья взаимная корреляция исчерпывает определенную долю общей дисперсии. После процедуры вращения каждый фактор интерпретируется как некоторая общая причина взаимосвязи группы переменных.

Факторный анализ

Метод, позволяющий свести большое количество исходных переменных к значительно меньшему числу факторов, каждый из которых объединяет исходные переменные, имеющие сходный смысл.

Фи (?)

Мера связи (корреляции) двух категориальных переменных, обычно применяемая наряду с критерием ?? при анализе таблиц сопряженности и вычисляемая по формуле:  .

Фридмана дисперсионный анализ

Непараметрическая процедура, определяющая, различаются ли между собой три или более измерения для одной и той же выборки, на основе среднего ранга каждого измерения.

Хи-квадрат (?2) для модели

В анализе логистической регрессии величина, позволяющая определить оказывают ли переменные, входящие в состав регрессионного уравнения, значимое влияние на зависимую переменную. Чем выше полученное значение, тем значительнее воздействие.

Хи-квадрат (??) критерий для одной выборки

Непараметрический критерий, определяющий отличие наблюдаемого распределения переменной от ожидаемого (теоретического) распределения.

Хи-квадрат критерий (критерий ??)

Непараметрический критерий для сравнения ожидаемых и наблюдаемых частот (как правило, для таблиц сопряженности). Критерий может использоваться для оценки адекватности структурных и логлинейных моделей. В любом случае, ??-анализ всегда отвечает на один и тот же вопрос: отличаются ли ожидаемые частоты модели от наблюдаемых. Коэффициент ?? Пирсона вычисляется по следующей формуле: ??=?[(f?-f?)?/f?].

Центроиды групп

В дискриминантом анализе средние значения дискриминантных функций для каждой из двух или более групп. Если число групп равно 2, центроиды будут иметь одинаковые абсолютные величины и разные знаки. Чем ближе объект в центроиду группы, тем больше вероятность, что он принадлежит к этой группе.

Частичный критерий ??

Значение критерия ?? , характеризующее долю воздействия очередной независимой переменной на зависимую переменную.

Частота (абсолютная)

Количество объектов в выборке, имеющих данное значение признака.

Частота относительная

Доля объектов в выборке, имеющих данное значение признака; равна отношению абсолютной частоты к объему выборки.

Число степеней свободы (df)

Количество возможных направлений изменчиво­сти статистического показателя, наряду с эмпирическим значением критерия служит для определения р-уровня значимости.

Шанс

Отношение вероятности того, что событие произойдет, к вероятности того, что событие не произойдет.

Шеффе критерий

Процедура, позволяющая осуществлять попарные множественные сравнения средних значений после получения статистически достоверного результата дисперсионного анализа.

Экспонента В

В логистическом регрессионном анализе величина eB используется в одной из форм регрессионного уравнения и позволяет создать одну из интерпретаций коэффициентов регрессии.

Эксцесс

Мера «сглаженности» («островершинности» или «плосковершинности») распределения. Если значение эксцесса близко к 0, это означает, что форма распределения близка к нормальному виду.

Эта (?)

Мера корреляции между двумя переменными в случае, если одна из них является категориальной.

Все термины | B | D | F | K | P | R | S | T | V | Z | А | Б | В | Г | Д | З | И | К | Л | М | Н | О | П | Р | С | Т | Ф | Х | Ц | Ч | Ш | Э