Факторный и результативный признак
• Вычисляемая с помощью метода наименьших квадратов прямая линия называется линией регрессии . Она характеризуется тем, что сумма квадратов расстояний от точек на диаграмме до этой линии минимальна (по сравнению со всеми возможными линиями).
• Линия регрессии дает наилучшее приближенное описание линейной зависимости между двумя переменными.
• Как известно, прямая линия описывается уравнением вида:
где Y – результирующий признак, X – факторный признак, k и b – числовые параметры уравнения.
• Коэффициент k в уравнении регрессии называется коэффициентом регрессии .
• В общем случае коэффициент регрессии k показывает, как в среднем изменится результативный признак ( Y ), если факторный признак ( X ) увеличится на единицу .
2.2.Статистические методы выявления наличия корреляционной связи между двумя признаками
Простейшим приёмом обнаружения связи является сопоставление двух параллельных рядов – ряда значений признака-фактора и соответствующих ему значений результативного признака. Значение факторного признака располагается в возрастающем порядке и затем прослеживается направление изменения величины результативного признака. Результативный признак (функция) обозначается через y, а факторный признак через x.
Ниже приведён пример обнаружения корреляционной связи между стажем (факторный признак) и заработной платой (результативный признак). В таблице 2.1 работники ранжированы по стажу.
Сведения о стаже и заработной плате рабочих
на промышленном предприятии
Можно видеть, что в целом для всей совокупности увеличение стажа приводит к увеличению заработной платы, т.е. связь – прямая, хотя в отдельных случаях наличие такой связи не усматривается.
Наличие большого числа различных значений результирующего признака затрудняет восприятие таких параллельных рядов. В таких случаях целесообразнее воспользоваться для установления факта наличия связи корреляционной таблицей. Корреляционная таблица позволяет изложить материал сжато, компактно и наглядно.
Построение корреляционной таблицы начинают с группировки значений фактического и результативного признаков. В первый столбик следует вписать значения факторного признака (x), а первую строку заполнить значениями результативного признака (y). Числа, полученные на пересечении строк и столбцов, означают частоту повторения данного сочетания значений x и y.
Источник
При этом выделяют признак-фактор и признак-результат (признак-фактор определяет значения признака-результата)
3) анализируются изменения обобщающего показателя по группам и делается вывод о наличии или отсутствии взаимосвязи и ее направлении. Если изменение величены признака-фактора, положенного в основу группировки, вызывает изменение величины признака-результата в том же направлении, то связь прямая, в противном случае — связь обратная.
Приведем пример аналитической группировки студентов для характеристики зависимости признака-результата У – «оценка студента по статистике» от признака-фактора X — «посещаемость практических занятии по статистике». Исходные данные:
X 16 14 15 10 7 10 3 16 12 5 16 0 15 16 12 4 7 6 10 9
У 4 4 4 3 3 5 5 3 3 3 5 4 4 5 4 2 4 3 3 4
Результаты аналитической группировки представлены в табл.
Посещаемость | Количество студентов | Оценка по статистике | Средняя оценка студента в группе |
[0;7] | 4 5 2 3 3 3 4 | 3,4 | |
(7:14] | 4 3 5 3 3 4 4 | 3,7 | |
(14;16] | 4 4 4 3 5 5 | 4,2 | |
Итого | — | — |
Анализируя данную таблицу, можно заметить прямую зависимость результативного признака У — «оценка по статистике» от признака-фактора X — «посещаемость практических занятий по статистике» чем 6ольше занятии посетил студент тем выше его оценка по статистике. Данная зависимость наблюдается в среднем по совокупности.
Взаимосвязь проявляется в том, что с возрастанием значения факторного признака систематически возрастает или убывает значение признака результативного.
Принципы построения статистических группировок и классификаций.
Построение группировки начинается:
С определения состава группировочных признаков.
Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования.
В основание группировки могут быть положены как количественные, так и атрибутивные признаки. Первые имеют числовое выражение (возраст человека, доход семьи и т. д.), а вторые отражают состояние единицы совокупности (пол человека, семейное положение, отраслевую принадлежность предприятия, его форму собственности и т. д.).
2) необходимо определить количество групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, численности совокупности, степени вариации признака.
Если группировка строится по атрибутивному признаку, то групп, как правило, будет столько, сколько имеется градаций, видов состоянии у этого признака. Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов Федерации.
Если группировка проводится по количественному признаку, то особое внимание обращается на число единиц исследуемого объекта и степень вариации группировочного признака. При небольшом объеме совокупности не следует образовывать большое число групп, так как показатели, рассчитанные для таких групп, не будут представительными.
В каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенностей объекта и цели исследования.
Определение числа групп можно осуществить математически используя формулу Стерджесса: n=1+3,322*lgN, (1)
где n — число групп; N — число единиц совокупности.
Согласно формуле (1) выбор числа групп зависит от объема совокупности.
Другой способ определения числа групп основан на применении среднего квадратического отклонения (сигма). Если величина интервала равна 0,5сигма, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3сигма и сигма, то совокупность делится соответственно на 9 и 6 групп. Однако при определении групп данными методами существует большая вероятность получения «пустых», или малочисленных, групп.
Источник
Контрольная работа по "Статистике"
На основе данных, приведенных в Приложении 1 и соответствующих вашему варианту (таблица 1), выполнить:
1. Структурную равноинтервальную группировку по двум признакам. Результаты представить в таблице, сделать выводы.
2. Аналитическую группировку, для этого определить признак-фактор и признак-результат, обосновав их выбор. Результаты представить в таблице.
Содержание работы
1. Задание……………………………………………………………………. стр. 3
2. Приложение № 1. Показатели деятельности производственных предприятий за 2007 год…………………………………………………… стр. 4
3. Задание 1.
Выполнение структурной равноинтервальной группировки по двум признакам на основе данных, приведенных в приложении 1 по
варианту № 38 (11-38). Предоставление результатов в таблицах, выводы.……………………………………………………………..……….. стр. 5
4. Задание 2.
Выполнение аналитической группировки, определение признака-
фактора и признака-результата, обоснование их выбора.
Предоставление результатов в таблице. Вывод о наличии и
направлении взаимосвязи между признаками..…………………………. стр. 7
5. Задание 3.
Выполнение комбинационной таблицы, вывод …. …………………. стр. 8
6. Задание 4.
Расчет структурных группировок, среднего значения каждого
Признака ……………………………………………………..…………. … стр. 9
7. Задание 5.
Расчет по каждому признаку, выводы:
а) линейного отклонения;
б) среднего линейного отклонения;
в) дисперсии и среднего квадратического отклонения;
г) моды и медианы. Моду и медиану изобразить графически;
д) нижнего и верхнего квартилей.
……………………………………………………………………………….стр. 11
Источник
2. Группировка статистических данных
В результате проведения статистического наблюдения получают данные о признаках каждой обследованной единицы статистической совокупности. Однако эти массивы данных собирают не для того, чтобы получить характеристики каждого отдельного элемента совокупности, а для того, чтобы получить характеристики совокупности в целом.
Для этого необходимо обобщить и систематизировать сведения, полученные в ходе статистического наблюдения. В статистической практике этот этап статистического исследования называют группировкой.
Группировка представляет собой разбиение совокупности на группы, однородные по какому-либо признаку. Группировка основывается на группировочном признаке и интервале, который представляет собой промежуток между минимальным и максимальным значением признака в группе.
Интервалы могут быть равными и неравными, открытыми и закрытыми. Под закрытым интервалом понимают интервал, имеющий как нижнюю, так и верхнюю границу, например (100;200)). Под открытым интервалом понимают интервал, одна из границ которого равна (например, свыше 500).
При определении числа групп и величины интервалов следует иметь в виду, что число объектов в выделенных группах должно быть достаточным, чтобы характеристики, рассчитанные для отдельных групп, были статистически достоверными.
Рекомендации по выбору числа групп k приведены в таблице
Число наблюдений (n)
Число групп также можно определить по формуле
Наличие равных интервалов облегчает вычисление различных статистических характеристик.
Величина интервала вычисляется по формуле
,
где xmax − максимальное значение признака в исследуемой
xmin − минимальное значение признака в исследуемой
Затем определяются границы каждого интервала:
для первого интервала: от xmin до xmin + ;
для второго интервала: от xmin+ до xmin +2 ;
для k-го интервала: от xmin+(k-1) до xmax.
Существуют 4 типа группировок: типологическая, структурная, аналитическая и комбинационная.
Типологическая группировка служит для исследования распределения совокупности по какому-либо одному качественному признаку (цвет, тип упаковки товара и т.п.).
Структурная группировка служит для исследования распределения совокупности по одному количественному признаку. Ее результаты представляются в виде таблицы
Количество элементов совокупности в
Общее число элементов совокупности
Аналитическая группировка служит для выявления зависимости между признаками. При этом выделяют признак-фактор и признак-результат. Группировка осуществляется по признаку-фактору. В каждой группе рассчитывается среднее значение признака-результата. Анализируя изменение средних значений признака-результата от группы к группе, можно сделать вывод о наличии или отсутствии взаимосвязи между признаками.
Различие групповых средних позволяет утверждать, что признаки взаимозависимы. Если изменение величины признака-фактора в определенном направлении вызывает изменение признака-результата в том же направлении, то говорят, что связь положительная, а в противном случае − отрицательная. Результаты аналитической группировки представляются в виде таблицы
Количество элементов совокупности в отдельной группе
Среднее значение признака-результата
Общее число элементов совокупности
Проследить зависимость между признаками можно также на основе комбинационной группировки, которая осуществляется одновременно по двум признакам.
Источник