Kafe-sviaz.ru

Финансовый журнал
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Математико статистические методы анализа данных

Математико-статистические методы

Математические и статистические методы в педагогике применяются для обработки данных, полученных методами опроса и эксперимента, а также для установления количественных зависимостей между изучаемы­ми явлениями. Они помогают оценить результаты эксперимента, повыша­ют надежность выводов, дают основания для теоретических обобщений. Обработка полученных результатов математическими методами по спе­циальным формулам позволяет наглядно отобразить выявленные зависи­мости в виде графиков, таблиц, диаграмм.

Использование методов математической статистики помогает сделать объективные, научно обоснованные выводы при анализе результатов обучения, воспитания, развития, физкультурно-спортивной деятельности, показателей, характеризующих психофизическое состояние человека при занятиях физическими упражнениями.

Рассмотрим основные методы математической статистики, которые наиболее часто применяются в исследовательской работе и практической деятельности студентами и специалистами физической культуры и спорта.

1. Провести тестирование и составить одномерный ряд результатов измерений.

Тест – подтягивание на перекладине. Результаты:

Контрольная группа (КГ) – 10, 15, 9, 11, 11, 13, 12, 9, 7, 13.

Экспериментальная группа (ЭГ) – 14, 16, 12, 14, 13, 15, 13, 10, 9, 10.

2. Провести ранжирование – расположить варианты (результаты измерений) в порядке убывания или возрастания:

КГ– 7, 9, 9, 10, 11, 11, 12, 13, 13, 15.

ЭГ – 12, 14, 14, 15, 16, 16, 17, 17, 20, 24.

3. Представить результаты измерений в виде вариационного ряда:

Вариационный ряд – ранжированный ряд вариант с указанием их частоты.

КГ: Варианты 7, 9, 10, 11, 12, 13, 15

Частота 1, 2, 1, 2, 1, 2, 1

ЭГ: Варианты 12, 14, 15, 16, 17, 20, 24

Частота 1 2 1 2 2 1 1

4. Найти сумму всех результатов измерений:

КГ = (7х1) + (9х2) + (10х1) + (11х1) + (12х1) + (13х2) + (15х1)= 110

ЭГ = (12х1) + (14х2) + (15х1) + (16х2) + (17х2) + (20х1) + (24х1) = 165

5. Рассчитать среднюю арифметическую ( ):

где ∑ – знак суммирования,

n – число вариант.

6. Определить размах варьирования – среднее квадратическое отклонение (δ). Величина среднего квадратического отклонения является показателем рассеивания, т.е. отклонения вариант, которые получили в исследовании от их средней величины:

δ =

где: Vmax — наибольшее значение варианты;

Vmin — наименьшее значение варианты;

К — табличный коэффициент, соответствующий определенному числу вариант.

Для нашего случая: при n = 10, K = 3,08

δКГ =

δЭГ =

Величина среднего квадратического отклонения зависит от величины колебания вариант: чем больше амплитуда различий между крайними значениями вариант, т.е. чем больше изменчивость признака, тем больше величина среднего квадратического отклонения.

7. Найти стандартную ошибку средней арифметической (±m) – ошибка репрезентативности:

, когда n ≥ 30

, когда n

Математико-статистическая обработка полученных в ходе психодиагностического исследования

Можно выделить следующие виды обработки данных.

Анализ первичных статистик

Для определения способов математико-статистической обработки, прежде всего, необходимо оценить характер распределения по всем используемым параметрам.

Для параметров имеющих нормальное распределение или близкое к нормальному, можно использовать методы параметрической статистики которые во многих случаях являются более молодыми, чем методы непараметрической статистики. Достоинством последних является то, что они позволяют проверять статистические гипотезы независимо от формы распределения.

Одним из важнейших в математической статистике является понятие нормального распределения. Нормальное распределение — модель варьирования некоторой случайной величины, значения которой определяются множеством одновременно действующих независимых факторов.

Важнейшие первичные статистики:

а) средняя арифметическая — величина, сумма отрицательных и положительных отклонений от которой равна нулю. В статистике ее обозначают буквой М или x ;

б) cpеднее квадратичное отклонение (обозначаемое греческой буквой s (сигма) и называемое также основным, или стандартным, отклонением) — мера разнообразия входящих в группу объектов, она показывает, на сколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее разбросаны варианты относительно средины, тем большим оказывается среднее квадратичное отклонение.

в) коэффициент вариант — частное от деления сигмы на среднюю, умноженное на 100%. Обозначается CV :

Для нормального распределения известны точные количественные зависимости частот и значений, позволяющие прогнозировать появление новых вариант:

Слева и справа от средней арифметической лежит 50% вариант.

В интервале от М-16 до М+16 лежат 68.7% всех вариант.

В интервале от М-1.966 до М+1.966 лежат 95% вариант.

Таким образом, ориентируясь на эти характеристики нормального распределения можно оценить степень близости к нему рассматриваемого распределения.

г) коэффициент асимметрии и эксцесс.

Коэффициент асимметрии — показатель скошенности распределения в левую или правьте сторону по оси абсцисс. Если правая ветвь кривей длиннее левой — говорят о положительной асимметрии, в противоположном случае — об отрицательной.

Эксцесс — показатель островершинности. Кривые, более высокие в своей средней части, островершинные, называются эксцессивными, у них большая величина эксцесса. При уменьшении величины эксцесса кривая становится все более плоской, приобретая вид плато, а затем и седловины — с прогибом в средней части.

Очень большие эксцесс и асимметрия часто являются индикатором ошибок при подсчетах вручную или ошибок при введении данных через клавиатуру при компьютерной обработке.

Существует правило, согласно которому все расчеты вручную должны выполняться дважды (особенно ответственные — трижды), причем желательно разными способами, с вариацией последовательности обращения к числовому массиву.

Статистические ошибки репрезентативности показывают в каких пределах могут отклоняться от параметров генеральной совокупности (от математического ожидания или истинных значений) наши частные определения, полученные на основании конкретных выборок.

Читать еще:  Детерминированный факторный анализ примеры решения задач

Очевидно, что величина ошибки тем больше, чем больше варьирование признака и чем меньше выборка.

2. Корреляционный анализ

Для эффективного использования вычисленных коэффициентов корреляции необходимо представить имеющуюся числовую информацию в подходящем виде.

Прежде всего, надо выделить коэффициенты корреляции величина которых превышает критические значения. В психологии чаще всего рассматривают два уровня достоверности 0.05 и 0.01.

Корреляционным исследование исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи между несколькими (двумя и более) переменными (психическими свойствами, процессами, состояниями и др.).

Виды интерпретаций наличия корреляционной связи между двумя измерениями:

  • Прямая корреляционная связь. Уровень одной переменной непосредственно соответствует уровню другой.
  • Корреляция, обусловленная 3-й переменной. 2 переменные (а, с) связаны одна с другой через 3-ю (в), не измеренную в ходе исследования. По правилу транзитивности, если есть R ( a , b )и R ( b , с), то R (а, с).
  • Случайная корреляция, не обусловленная никакой переменной.
  • Корреляция, обусловленная неоднородностью выборки.

Виды корреляционных связей:

  • положительная корреляция — повышение уровня одной переменной сопровождается повышением уровня другой.
  • отрицательная корреляция — рост уровня одной переменной сопровождается снижением уровня другой.
  • нулевая корреляция — отсутствие связи переменных.

3. Факторный анализ

Факторный анализ — раздел многомерного статистического анализа, обьединяющий методы оценки размерности множества наблюдаемых переменных посредством исследования структуры корреляционных матриц.

Данные факторного анализа, как и корреляционного помогают обнаружить взаимосвязи между переменными, но не могут дать достаточных оснований для выводов о причинно-следственных зависимостях, об иерархии причинных связей.

В различных факторных структурах личностных свойств устойчиво присутствуют именно стержневые психические качества, например, такие как тревожность, активность (энергия), нейротизм.

Факторный анализ является сложной процедурой. Как правило хорошее факторное решение (достаточно простое и содержательно интерпретируемое) удается получить по меньшей мере после нескольких циклов его проведения — от отбора признаков до попытки интерпретации после вращения факторов. Требования.

1) Переменные должны быть измерены по крайней мере на уровне шкалы интервалов (по классификации Стивенса). Многие переменные, такие, как меры отношений и мнений в совокупности, различные переменные при обработке результатов тестирования, не имеют точно определенной метрической основы. Тем не менее предполагается, что порядковым переменным можно давать числовые значения, не нарушая их внутренних свойств.

2) Не следует включать дихотомические переменные. Но если цель исследования состоит в нахождении кластерной структуры, использование факторного анализа к данным, содержащим дихотомические переменные, оправдано.

3) Отбирая переменные для факторного анализа следует учесть, что на один фактор должно приходиться по крайней мере три переменные.

4) Для обоснованного окончательного решения необходимо, чтобы число испытуемых было в три или более раз больше, чем число переменных, в пространстве которых определяется окончательное факторное решение.

5) Не имеет смысла включать в факторный анализ переменные, которые имеют очень слабые связи с остальными переменными. С большой вероятностью они будут иметь малую общность и не войдут ни в один фактор.

6) Важнейшим моментом поиска хорошего факторного решения является определение числа факторов перед их вращением. В окончательном решении лучше всего основываться на содержательных предположениях о структуре изучаемого явления.

4. Использование прикладных статистических программ

Использование статистических программ в компьютерной обработке на несколько порядков ускоряет обработку материала и предоставляет в распоряжение исследователя такие методы анализа, которые в ручной обработке не могут быть реализованы.

В полной мере эти преимущества могут использованы, если психолог имеет необходимый уровень подготовки в этой области.

Обычно, чем мощнее компьютерная программа (чем более широкие у нее возможности), тем больше времени она требует дня освоения.

Затрачивать время на ее изучение при редких обращениях к мощному статистическому аппарату не совсем эффективно.

Использование таких программ для решения несложных задач также требует определенной суммы умений. Для того, чтобы избежать лишних сложностей и временных затрат, целесообразно:

  • во-первых, стремиться выбрать программу с возможно более дружественным интерфейсом. Т.е., выбрать программы в которых есть достаточно развитая функция подсказок, в том числе для неподготовленного пользователя, предусмотрен режим меню — при нем пользователь на каждом шаге делает выбор для дальнейшей работы из предложенных альтернатив и избавлен от необходимости самостоятельно формулировать задачу для работы компьютера, соблюдая весь набор требований, который во многих случаях некороток.
  • во-вторых, следует пытаться найти программы наиболее приспособленные к обработке психологических данных. Хотя специализированные программы часто уступают по мощности программам универсального назначения, по ряду процедур и функций они не менее эффективны. Работа с ними идет быстрее, особенно у неподготовленных пользователей.

Математико-статистические методы

Математические и статистические методы в педагогике применяются для обработки данных, полученных методами опроса и эксперимента, а также для установления количественных зависимостей между изучаемы­ми явлениями. Они помогают оценить результаты эксперимента, повыша­ют надежность выводов, дают основания для теоретических обобщений. Обработка полученных результатов математическими методами по спе­циальным формулам позволяет наглядно отобразить выявленные зависи­мости в виде графиков, таблиц, диаграмм.

Использование методов математической статистики помогает сделать объективные, научно обоснованные выводы при анализе результатов обучения, воспитания, развития, физкультурно-спортивной деятельности, показателей, характеризующих психофизическое состояние человека при занятиях физическими упражнениями.

Читать еще:  Анализ движения кадров

Рассмотрим основные методы математической статистики, которые наиболее часто применяются в исследовательской работе и практической деятельности студентами и специалистами физической культуры и спорта.

1. Провести тестирование и составить одномерный ряд результатов измерений.

Тест – подтягивание на перекладине. Результаты:

Контрольная группа (КГ) – 10, 15, 9, 11, 11, 13, 12, 9, 7, 13.

Экспериментальная группа (ЭГ) – 14, 16, 12, 14, 13, 15, 13, 10, 9, 10.

2. Провести ранжирование – расположить варианты (результаты измерений) в порядке убывания или возрастания:

КГ– 7, 9, 9, 10, 11, 11, 12, 13, 13, 15.

ЭГ – 12, 14, 14, 15, 16, 16, 17, 17, 20, 24.

3. Представить результаты измерений в виде вариационного ряда:

Вариационный ряд – ранжированный ряд вариант с указанием их частоты.

КГ: Варианты 7, 9, 10, 11, 12, 13, 15

Частота 1, 2, 1, 2, 1, 2, 1

ЭГ: Варианты 12, 14, 15, 16, 17, 20, 24

Частота 1 2 1 2 2 1 1

4. Найти сумму всех результатов измерений:

КГ = (7х1) + (9х2) + (10х1) + (11х1) + (12х1) + (13х2) + (15х1)= 110

ЭГ = (12х1) + (14х2) + (15х1) + (16х2) + (17х2) + (20х1) + (24х1) = 165

5. Рассчитать среднюю арифметическую ( ):

где ∑ – знак суммирования,

n – число вариант.

6. Определить размах варьирования – среднее квадратическое отклонение (δ). Величина среднего квадратического отклонения является показателем рассеивания, т.е. отклонения вариант, которые получили в исследовании от их средней величины:

δ =

где: Vmax — наибольшее значение варианты;

Vmin — наименьшее значение варианты;

К — табличный коэффициент, соответствующий определенному числу вариант.

Для нашего случая: при n = 10, K = 3,08

δКГ =

δЭГ =

Величина среднего квадратического отклонения зависит от величины колебания вариант: чем больше амплитуда различий между крайними значениями вариант, т.е. чем больше изменчивость признака, тем больше величина среднего квадратического отклонения.

7. Найти стандартную ошибку средней арифметической (±m) – ошибка репрезентативности:

, когда n ≥ 30

, когда n

Основные методы обработки данных в психологии

Психологи собирают сведения об объекте исследования путем проведения экспериментов.

Обработка полученных данных производится при помощи специальных научных методов.

О видах контент-анализа в психологии вы можете узнать из нашей статьи.

Назначение методов

Психологические исследования позволяют выявить некоторые общие черты, свойственные популяции людей.

Под популяцией понимается совокупность объектов изучения, которых объединяет какой-то общий признак.

Это могут быть представители одной социальной группы, сообщества, возрастной категории, профессиональной области и т.д.

Для проведения исследования производится выборка, которая должна быть репрезентативной (т.е. максимально точно и достоверно отражать характеристику всей совокупности в целом). Полученные в результате работы психолога результаты подлежат обработке.

Обработка данных — это отдельная область экспериментальной психологии, напрямую связанная с математикой, статистикой.

Любое психологическое исследование состоит из нескольких этапов: разработка программы, проведение процедур, анализ полученных результатов.

Методы математической обработки данных позволяют проверить достоверность начальных гипотез и, соответственно, опровергнуть их или подтвердить. В итоге решаются следующие задачи:

  • систематизируются полученные сведения;
  • выявляются допущенные ошибки, неточности;
  • обнаруживаются скрытые закономерности, связи;
  • определяется достоверность результатов.

Обработка данных бывает количественной и качественной.

В первом случае изучаются различные параметры объекта исследования, которые подлежат измерению.

Во втором случае речь идет о проникновении в суть проблемы, выявлении глубинных процессов. Оба уровня тесно связаны между собой, поскольку только единство из применения позволяет получить точные результаты.

При этом качественные данные невозможно измерить, единственный способ их математической оценки — выявление частоты встречаемости (например, как часто встречается среди испытуемых холерический тип темперамента).

Количественные же данные можно анализировать при помощи специальных статистических методов, в основе которых лежат математические параметры.

Количественная обработка производится при помощи двух групп методов: первичных, вторичных.

Классификация

Методы статистической обработки — это математические формулы, приемы, количественные расчеты, которые позволяют систематизировать полученные в ходе исследования сведения, выявить имеющиеся закономерности.

Что такое принцип системности в психологии? Читайте об этом здесь.

Первичные

Первичные методы позволяют установить показатели, отражающие непосредственные результаты исследований.

С их помощью психолог может сформировать свое первое представление об объекте: о его характеристиках, об имеющихся закономерностях и т.д.

  1. Среднее арифметическое. Это одно из самых простейших арифметических действий. Для получения данного количественного показателя исследователю достаточно сложить все выявленные числовые значения и поделить полученную сумму на количество этих значений.
  2. Медиана. Под медианой понимается числовая величина, которая занимает центральное положение в последовательном ряду данных. Иными словами, из всего массива чисел половина оказывается меньше медианы, а половины — больше. Соответственно, выше и ниже медианы количество значений одинаковое.
  3. Мода. Этот метод подразумевает выделение числа, которое чаще остальных присутствует в выборке — самое «модное» число.

Например, если большинство испытуемых демонстрируют во время эксперимента одну и ту же реакцию на какой-либо раздражитель, то количественный показатель по данной реакции будет относиться к моде.

  • Дисперсия — это мера изменчивости, которая позволяет судить о степени вариации признака.
  • к содержанию ↑

    Вторичные анализы

    Вторичные методы математико-статистического анализа направлены на более глубокое изучение вопроса.

    Они помогают выявлять скрытые закономерности, устанавливать взаимосвязи.

    Читать еще:  Анализ технологических процессов предприятия

    Вторичные методы: корреляционный анализ, регрессионный анализ, факторный анализ и др.

    Корреляционный

    Между двумя переменными может существовать определенная зависимость. При наличии такой зависимости изменения в одной переменной автоматически стимулируют изменения показателей второй переменной.

    Подобная связь присутствует, когда имеются некоторые общие факторы, оказывающее влияние в обоих случаях. Уровень зависимости, существующий между переменными, называется корреляционным коэффициентом. Диапазон его колебаний: от — 1 до +1.

    При отрицательном значении показателя специалист делает вывод, что увеличение значений одной переменной приводит к уменьшению значения другой.

    Нулевой коэффициент корреляции свидетельствует об отсутствии взаимосвязи между явлениями. Его положительное значение подтверждает, что прямая зависимость между переменными присутствует. Причем чем эта зависимость существеннее, тем ближе показатель приближается к отметке 1.

    Регрессионный

    Позволяет выявить зависимость одной случайной переменной от другой или нескольких других случайных переменных.

    Первый показатель считается зависимым, остальные показатели — независимые.

    Исследователь самостоятельно определяет, какие переменные будут выполнять выбранные роли. Его решение зависит от того, какие задачи ставятся изначально.

    Факторный

    Суть метода — выявление некоторого фактора, объединяющего большое количество переменных по какому-либо признаку.

    Это позволяет сузить массив обрабатываемой информации до оптимальных значений. При помощи факторного анализа все многообразие данных объединяется в несколько ключевых показателей.

    Активно используется в психологии при работе с большими объемами информации.

    Он позволяет выявить скрытые признаки и закономерности, причины возникновения явлений. Существуют разные типы факторного анализа: перспективный, ретроспективный, прямой, обратный и т.д.

    Канонический

    Позволяет установить зависимость между двумя модулями переменных, которые характеризуют объекты.

    Данный способ исследования помогает обобщить информацию и выявить влияние одного фактора на группу переменных.

    Например, в сфере педагогики специалист может при помощи данного приема выявить зависимость между успеваемостью детей по нескольким видам дисциплин и уровнем развития у них какого-либо навыка.

    Или можно выявить уровень влияния какого-либо внешнего фактора на развитие определенных психологических проблем.

    Для чего используется лонгитюдный метод в психологии? Ответ вы найдете на нашем сайте.

    Сравнение средних

    Нередко при сравнении средних показателей двух серий экспериментов исследователь обнаруживает несовпадение. Это может быть вызвано как совершенными специалистом во время проведения эксперимента ошибками, так и иными причинами.

    Например, в рамках исследования уровня знаний студентов университета, группе первокурсников моет быть предложено пройти тест, состоящий из 60 вопросов. Через 5 лет этой же группе студентов, являющихся выпускниками, предлагается вновь пройти тот же самый тест.

    То есть и объекты исследования, и предмет исследования, и содержание эксперимента никак не изменяются. Проходит лишь определенный промежуток времени.

    Сравнение средних показателей наверняка продемонстрирует явное несовпадение результатов. В данном случае исследователь после анализа данных скорее всего придет к выводу, что средний показатель уровня знаний студентов за время обучения повышается.

    Сравнение дисперсий

    Предыдущий метод не всегда позволяет получить исчерпывающую информацию.

    Сравнение средних величин помогает исследователю проследить взаимосвязь между двумя уровнями одного и того же объекта.

    Сравнение же дисперсий позволяет оценить степень изменчивости одного показателя, характерного для двух разных объектов. Так, специалист может поставить перед собой задачу определить уровень успеваемости учеников двух разных классов — 7-го и 8-го.

    В этом случае данные, подтверждающие разные уровни успеваемости, будут свидетельствовать об изменчивости исследуемого показателя.

    Частотный

    Создание специальных таблиц частот для изучения категориальных переменных.

    Возможно применение данного способа обработки данных и в отношении количественных переменных, но в таком случае могут возникнуть сложности при интерпретации результатов.

    Обычно данные таблицы частот представляют собой графические изображения в виде гистограмм.

    Частотный ряд имеет смысл применять в том случае, когда в исходной выборке присутствует множество схожих значений.

    Кластерный

    Данный способ классификации полученных данных применяется при больших объемах информации.

    Все многочисленные объекты исследования разбиваются на группы по схожим признакам.

    Подобный многомерный метод актуален для исследований, в которых присутствует большое количество объектов или у незначительного числа объектов выявляется многообразие признаков.

    Несомненным преимуществом подхода является тот факт, что объекты могут объединяться в однородные группы не только по одному схожему признаку, но и по совокупности признаков.

    Также кластерный анализ в отличие от большинства других статистических методов не налагает никаких ограничений на вид объектов, подлежащих рассмотрению. Соответственно, становится возможным выбор данных произвольного характера.

    Дискриминантный

    Также используется в многомерных исследованиях при существенном объеме исходных данных. В данном случае изначально определяется перечень нескольких групп, обладающих определенными характеристиками. Каждый объект с учетом свойственных ему признаков соответствует одной из заданных групп.

    Подход помогает решить две ключевые проблемы: выявить четкие различия между классами объектов, классифицировать эти объекты с учетом имеющихся различий.

    Помимо вышеперечисленных статистических способов обработки данных существуют и другие приемы, которыми эффективно пользуются специалисты.

    Выбор наиболее подходящего метода исследования зависит от задач, которые ставит перед собой психолог, а также от характеристик объектов и их количества.

    Таким образом, для интерпретации данных психологических исследований применяются принципы статистического анализа. Классификация методов обработки полученных результатов достаточно обширна ввиду большого количества критериев оценки изучаемых объектов.

    Что такое близнецовый метод в психологии? Читайте об этом тут.

    Статистические методы обработки информации:

    Ссылка на основную публикацию
    Adblock
    detector