→ Виды статистических данных в исследовании. Методология статистики

Виды статистических данных в исследовании. Методология статистики

Статистические методы

Статисти́ческие ме́тоды - методы анализа статистических данных. Выделяют методы прикладной статистики , которые могут применяться во всех областях научных исследований и любых отраслях народного хозяйства, и другие статистические методы, применимость которых ограничена той или иной сферой. Имеются в виду такие методы, как статистический приемочный контроль, статистическое регулирование технологических процессов, надежность и испытания, планирование экспериментов.

Классификация статистических методов

Статистические методы анализа данных применяются практически во всех областях деятельности человека. Их используют всегда, когда необходимо получить и обосновать какие-либо суждения о группе (объектов или субъектов) с некоторой внутренней неоднородностью.

Целесообразно выделить три вида научной и прикладной деятельности в области статистических методов анализа данных (по степени специфичности методов, сопряженной с погруженностью в конкретные проблемы):

а) разработка и исследование методов общего назначения, без учета специфики области применения;

б) разработка и исследование статистических моделей реальных явлений и процессов в соответствии с потребностями той или иной области деятельности;

в) применение статистических методов и моделей для статистического анализа конкретных данных.

Прикладная статистика

Описание вида данных и механизма их порождения - начало любого статистического исследования. Для описания данных применяют как детерминированные, так и вероятностные методы. С помощью детерминированных методов можно проанализировать только те данные, которые имеются в распоряжении исследователя. Например, с их помощью получены таблицы, рассчитанные органами официальной государственной статистики на основе представленных предприятиями и организациями статистических отчетов. Перенести полученные результаты на более широкую совокупность, использовать их для предсказания и управления можно лишь на основе вероятностно-статистического моделирования. Поэтому в математическую статистику часто включают лишь методы, опирающиеся на теорию вероятностей.

Мы не считаем возможным противопоставлять детерминированные и вероятностно-статистические методы. Мы рассматриваем их как последовательные этапы статистического анализа. На первом этапе необходимо проанализировать имеющие данные, представить их в удобном для восприятия виде с помощью таблиц и диаграмм. Затем статистические данные целесообразно проанализировать на основе тех или иных вероятностно-статистических моделей. Отметим, что возможность более глубокого проникновения в суть реального явления или процесса обеспечивается разработкой адекватной математической модели.

В простейшей ситуации статистические данные - это значения некоторого признака, свойственного изучаемым объектам. Значения могут быть количественными или представлять собой указание на категорию, к которой можно отнести объект. Во втором случае говорят о качественном признаке.

При измерении по нескольким количественным или качественным признакам в качестве статистических данных об объекте получаем вектор. Его можно рассматривать как новый вид данных. В таком случае выборка состоит из набора векторов. Есть часть координат - числа, а часть - качественные (категоризованные) данные, то говорим о векторе разнотипных данных.

Одним элементом выборки, то есть одним измерением, может быть и функция в целом. Например, описывающая динамику показателя, то есть его изменение во времени, - электрокардиограмма больного или амплитуда биений вала двигателя. Или временной ряд, описывающий динамику показателей определенной фирмы. Тогда выборка состоит из набора функций.

Элементами выборки могут быть и иные математические объекты. Например, бинарные отношения. Так, при опросах экспертов часто используют упорядочения (ранжировки) объектов экспертизы - образцов продукции, инвестиционных проектов, вариантов управленческих решений. В зависимости от регламента экспертного исследования элементами выборки могут быть различные виды бинарных отношений (упорядочения, разбиения, толерантности), множества, нечеткие множества и т. д.

Итак, математическая природа элементов выборки в различных задачах прикладной статистики может быть самой разной. Однако можно выделить два класса статистических данных - числовые и нечисловые. Соответственно прикладная статистика разбивается на две части - числовую статистику и нечисловую статистику.

Числовые статистические данные - это числа, вектора, функции. Их можно складывать, умножать на коэффициенты. Поэтому в числовой статистике большое значение имеют разнообразные суммы. Математический аппарат анализа сумм случайных элементов выборки - это (классические) законы больших чисел и центральные предельные теоремы.

Нечисловые статистические данные - это категоризованные данные, вектора разнотипных признаков, бинарные отношения, множества, нечеткие множества и др. Их нельзя складывать и умножать на коэффициенты. Поэтому не имеет смысла говорить о суммах нечисловых статистических данных. Они являются элементами нечисловых математических пространств (множеств). Математический аппарат анализа нечисловых статистических данных основан на использовании расстояний между элементами (а также мер близости, показателей различия) в таких пространствах. С помощью расстояний определяются эмпирические и теоретические средние, доказываются законы больших чисел, строятся непараметрические оценки плотности распределения вероятностей, решаются задачи диагностики и кластерного анализа, и т. д. (см. ).

В прикладных исследованиях используют статистические данные различных видов. Это связано, в частности, со способами их получения. Например, если испытания некоторых технических устройств продолжаются до определенного момента времени, то получаем т. н. цензурированные данные, состоящие из набора чисел - продолжительности работы ряда устройств до отказа, и информации о том, что остальные устройства продолжали работать в момент окончания испытания. Цензурированные данные часто используются при оценке и контроле надежности технических устройств.

Обычно отдельно рассматривают статистические методы анализа данных первых трех типов. Это ограничение вызвано тем отмеченным выше обстоятельством, что математический аппарат для анализа данных нечисловой природы - существенно иной, чем для данных в виде чисел, векторов и функций.

Вероятностно-статистическое моделирование

При применении статистических методов в конкретных областях знаний и отраслях народного хозяйства получаем научно-практические дисциплины типа «статистические методы в промышленности», «статистические методы в медицине» и др. С этой точки зрения эконометрика - это «статистические методы в экономике». Эти дисциплины группы б) обычно опираются на вероятностно-статистические модели, построенные в соответствии с особенностями области применения. Весьма поучительно сопоставить вероятностно-статистические модели, применяемые в различных областях, обнаружить их близость и вместе с тем констатировать некоторые различия. Так, видна близость постановок задач и применяемых для их решения статистических методов в таких областях, как научные медицинские исследования, конкретные социологические исследования и маркетинговые исследования, или, короче, в медицине , социологии и маркетинге . Они часто объединяются вместе под названием «выборочные исследования».

Отличие выборочных исследований от экспертных проявляется, прежде всего, в числе обследованных объектов или субъектов - в выборочных исследованиях речь обычно идет о сотнях, а в экспертных - о десятках. Зато технологии экспертных исследований гораздо изощреннее. Еще более выражена специфика в демографических или логистических моделях, при обработке нарративной (текстовой, летописной) информации или при изучении взаимовлияния факторов.

Вопросы надежности и безопасности технических устройств и технологий, теории массового обслуживания подробно рассмотрены, в большом количестве научных работ.

Статистический анализ конкретных данных

Применение статистических методов и моделей для статистического анализа конкретных данных тесно привязано к проблемам соответствующей области. Результаты третьего из выделенных видов научной и прикладной деятельности находятся на стыке дисциплин. Их можно рассматривать как примеры практического применения статистических методов. Но не меньше оснований относить их к соответствующей области деятельности человека.

Например, результаты опроса потребителей растворимого кофе естественно отнести к маркетингу (что и делают, читая лекции по маркетинговым исследованиям). Исследование динамики роста цен с помощью индексов инфляции, рассчитанных по независимо собранной информации, представляет интерес прежде всего с точки зрения экономики и управления народным хозяйством (как на макроуровне, так и на уровне отдельных организаций).

Перспективы развития

Теория статистических методов нацелена на решение реальных задач. Поэтому в ней постоянно возникают новые постановки математических задач анализа статистических данных, развиваются и обосновываются новые методы. Обоснование часто проводится математическими средствами, то есть путем доказательства теорем. Большую роль играет методологическая составляющая - как именно ставить задачи, какие предположения принять с целью дальнейшего математического изучения. Велика роль современных информационных технологий, в частности, компьютерного эксперимента.

Актуальной является задача анализа истории статистических методов с целью выявления тенденций развития и применения их для прогнозирования.

Литература

2. Нейлор Т. Машинные имитационные эксперименты с моделями экономических систем. - М.: Мир, 1975. - 500 с.

3. Крамер Г. Математические методы статистики. - М.: Мир, 1948 (1-е изд.), 1975 (2-е изд.). - 648 с.

4. Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. - М.: Наука, 1965 (1-е изд.), 1968 (2-е изд.), 1983 (3-е изд.).

5. Смирнов Н. В., Дунин-Барковский И. В. Курс теории вероятностей и математической статистики для технических приложений. Изд. 3-е, стереотипное. - М.: Наука, 1969. - 512 с.

6. Норман Дрейпер, Гарри Смит Прикладной регрессионный анализ. Множественная регрессия = Applied Regression Analysis. - 3-е изд. - М.: «Диалектика» , 2007. - С. 912. - ISBN 0-471-17082-8

Смотри также

Wikimedia Foundation . 2010 .

  • Yat-Kha
  • Амальгама (значения)

Смотреть что такое "Статистические методы" в других словарях:

    СТАТИСТИЧЕСКИЕ МЕТОДЫ - СТАТИСТИЧЕСКИЕ МЕТОДЫ научные методы описания и изучения массовых явлений, допускающих количественное (численное) выражение. Слово “статистика” (от игал. stato государство) имеет общий корень со словом “государство”. Первоначально оно… … Философская энциклопедия

    СТАТИСТИЧЕСКИЕ МЕТОДЫ – - научные методы описания и изучения массовых явлений, допускающих количественное (численное) выражение. Слово «статистика» (от итал. stato – государство) имеет общий корень со словом «государство». Первоначально оно относилось к науке управления и … Философская энциклопедия

    Статистические методы - (в экологии и биоценологии) методы вариационной статистики, позволяющие исследовать целое (напр., фитоценоз, популяцию, продуктивность) по его частным совокупностям (напр., по данным, полученным на учетных площадках) и оценить степень точности… … Экологический словарь

    статистические методы - (в психологии) (от лат. status состояние) нек рые методы прикладной математической статистики, используемые в психологии в основном для обработки экспериментальных результатов. Основная цель применения С. м. повышение обоснованности выводов в… … Большая психологическая энциклопедия

    Статистические методы - 20.2. Статистические методы Конкретные статистические методы, используемые для организации, регулирования и проверки деятельности, включают, но не ограничиваются следующими: а) планированием экспериментов и факторный анализ; b) анализ дисперсии и … Словарь-справочник терминов нормативно-технической документации

    СТАТИСТИЧЕСКИЕ МЕТОДЫ - методы исследования количеств. стороны массовых обществ. явлений и процессов. С. м. дают возможность в цифровом выражении характеризовать происходящие изменения в обществ. процессах, изучать разл. формы социально экономич. закономерностей, смену… … Сельско-хозяйственный энциклопедический словарь

    СТАТИСТИЧЕСКИЕ МЕТОДЫ - некоторые методы прикладной математической статистики, используемые для обработки экспериментальных результатов. Ряд статистических методов был разработан специально для проверки качества психологических тестов, для применения в профессиональном… … Профессиональное образование. Словарь

    СТАТИСТИЧЕСКИЕ МЕТОДЫ - (в инженерной психологии) (от лат. status состояние) некоторые методы прикладной статистики, используемые в инженерной психологии для обработки экспериментальных результатов. Основная цель применения С. м. повышение обоснованности выводов в… … Энциклопедический словарь по психологии и педагогике

Основные статистические характеристики делят на две основные группы: меры центральной тенденции и характеристики вариации.

Центральную тенденцию выборки позволяют оценить такие статистические характеристики, как среднее арифметическое значение, мода, медиана.

Наиболее просто получаемой мерой центральной тенденции является мода. Мода (Мо) – это такое значение в множестве наблюдений, которое встречается наиболее часто. В совокупности значений (2, 6, 6, 8, 7, 33, 9, 9, 9, 10) модой является 9, потому что оно встречается чаще любого другого значения. В случае, когда все значения в группе встречаются одинаково часто, считают, что эта группа не имеет моды.

Когда два соседних значения в ранжированном ряду имеют одинаковую частоту и они больше частоты любого другого значения, мода есть среднее этих двух значений.

Если два несмежных значения в группе имеют равные частоты, и они больше частот любого значения, то существуют две моды (например, в совокупности значений 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами являются 11 и 14); в таком случае группа измерений или оценок является бимодальной .

Наибольшей модой в группе называется единственное значение, которое удовлетворяет определению моды. Однако во всей группе может быть несколько меньших мод. Эти меньшие моды представляют собой локальные вершины распределения частот.

Медиана (Me) – середина ранжированного ряда результатов измерений. Если данные содержат четное число различных значений, то медиана есть точка, лежащая посередине между двумя центральными значениями, когда они упорядочены.

Среднее арифметическое значение для неупорядоченного ряда измерений вычисляют по формуле:

где . Например, для данных 4,1; 4,4; 4,5; 4,7; 4,8 вычислим :

.

Каждая из выше вычисленных мер центра является наиболее пригодной для использования в определенных условиях.

Мода вычисляется наиболее просто – ее можно определить на глаз. Более того, для очень больших групп данных это достаточно стабильная мера центра распределения.

Медиана занимает промежуточное положение между модой и средним с точки зрения ее вычисления. Эта мера получается особенно легко в случае ранжированных данных.

Среднее множество данных предполагает в основном арифметические операции.

На величину среднего влияют значения всех результатов. Медиана и мода не требуют для определения всех значений. Посмотрим, что произойдет со средним, медианой и модой, когда удвоится максимальное значение в следующем множестве:

Множество 1: 1, 3, 3, 5, 6, 7, 8 33/7 5 3

Множество 2: 1, 3, 3, 5, 6, 7, 16 41/7 5 3

На величину среднего особенно влияют результаты, которые называют “выбросами”, т.е. данные, находящиеся далеко от центра группы оценок.

Вычисление моды, медианы или среднего – чисто техническая процедура. Однако выбор из этих трех мер и их интерпретация зачастую требуют определенного размышления. В процессе выбора следует установить следующее:

– в малых группах мода может быть совершенно нестабильной. Например, мода группы: 1, 1, 1, 3, 5, 7, 7, 8 равна 1; но если одна из единиц превратится в нуль, а другая – в два, то мода будет равна 7;

– на медиану не влияют величины “больших” и “малых” значений. Например, в группе из 50 значений медиана не изменится, если наибольшее значение утроится;

– на величину среднего влияет каждое значение. Если одно какое-нибудь значение меняется на c единиц, изменится в том же направлении на c/n единиц;

– некоторые множества данных не имеют центральной тенденции, что часто вводит в заблуждение при вычислении только одной меры центральной тенденции. Особенно это справедливо для групп, имеющих более чем одну моду;

– когда считают, что группа данных является выборкой из большой симметричной группы, среднее выборки, вероятно, ближе к центру большой группы, чем медиана и мода.

Все средние характеристики дают общую характеристику ряда результатов измерений. На практике нас часто интересует, как сильно каждый результат отклоняется от среднего значения. Однако легко можно представить, что две группы результатов измерений имеют одинаковые средние, но различные значения измерений. Например, для ряда 3, 6, 3 – среднее значение = 4; для ряда 5, 2, 5 – также среднее значение = 4, несмотря на существенное различие этих рядов.

Поэтому средние характеристики всегда необходимо дополнять показателями вариации, или колеблемости.

К характеристикам вариации , или колеблемости , результатов измерений относят размах варьирования, дисперсию, среднее квадратическое отклонение, коэффициент вариации, стандартную ошибку средней арифметической.

Самой простой характеристикой вариации является размах варьирования . Его определяют как разность между наибольшим и наименьшим результатами измерений. Однако он улавливает только крайние отклонения, но не отражает отклонений всех результатов.

Чтобы дать обобщающую характеристику, можно вычислить отклонения от среднего результата. Например, для ряда 3, 6, 3 значения будут следующими: 3 – 4 = – 1; 6 – 4 = 2; 3 – 4 = – 1. Сумма этих отклонений (– 1) + 2 + (– 1) всегда равна 0. Чтобы избежать этого, значения каждого отклонения возводят в квадрат: (– 1) 2 + 2 2 + (– 1) 2 = 6.

Значение делает отклонения от средней более явственными: малые отклонения становятся еще меньше (0,5 2 =0,25), а большие – еще больше (5 2 = 25). Получившуюся сумму называют суммой квадратов отклонений . Разделив эту сумму на число измерений, получают средний квадрат отклонений, или дисперсию . Она обозначается s 2 и вычисляется по формуле:

.

Если число измерений не более 30, т.е. n ≤ 30, используется формула:

.

Величина n – 1 = k называется числом степеней свободы , под которым подразумевается число свободно варьирующих членов совокупности. Установлено, что при вычислении показателей вариации один член эмпирической совокупности всегда не имеет степени свободы.

Эти формулы применяются, когда результаты представлены неупорядоченной (обычной) выборкой.

Из характеристик колеблемости наиболее часто используется среднее квадратическое отклонение , которое определяется как положительное значение корня квадратного из значения дисперсии, т.е.:

.

Среднее квадратическое отклонение или стандартное отклонение характеризует степень отклонения результатов от среднего значения в абсолютных единицах и имеет те же единицы измерения, что и результаты измерения.

Однако для сравнения колеблемости двух и более совокупностей, имеющих различные единицы измерения, эта характеристика не пригодна.

Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому, выраженное в процентах. Вычисляется он по формуле:

.

В спортивной практике колеблемость результатов измерений в зависимости от величины коэффициента вариации считают небольшой
(0 – 10 %), средней (11 – 20 %) и большой (V > 20 %).

Коэффициент вариации имеет большое значение в статистической обработке результатов измерений, т. к., будучи величиной относительной (измеряется в процентах), позволяет сравнивать между собой колеблемость результатов измерений, имеющих различные единицы измерения. Коэффициент вариации можно использовать лишь в том случае, если измерения выполнены в шкале отношений.

2.4.2. Анализ статистических данных в MS Excel. Инструменты анализа: описательная статистика, корреляция.

В состав электронных таблиц Microsoft Excel входит так называемый пакет анализа – набор инструментов, предназначенный для решения сложных статистических задач. Данный пакет производит анализ статистических данных с помощью макрофункций и позволяет, выполнив одно действие, получить на выходе большое количество результатов. В пакете анализа, имеющемся в Excel, среди прочих инструментов анализа имеется разделы «Описательная статистика» и «Корреляция».

Инструмент «Описательная статистика» позволяет нам получить значительный перечень рассчитанных статистических характеристик для большого количества числовых рядов. С помощью инструмента «Корреляция» мы получаем корреляционную матрицу, содержащую все возможные парные коэффициенты корреляции. Для k рядов будет получено k (k – 1)/2 коэффициентов корреляции.

Пакет анализа вызывается с помощью пункта меню Сервис – Анализ данных… Если этот пункт меню отсутствует, значит, пакет анализа не установлен. Для его установки надо вызвать пункт меню Сервис – Надстройки… и включить надстройку «Пакет анализа», ОК (см. рисунок 1).

Рисунок 1. Диалоговое окно включения/выключения надстроек

После включения надстройки «Пакет анализа» будет доступен пункт меню Сервис – Анализ данных… При его выборе появляется следующее диалоговое окно (рисунок 2).

Рисунок 2. Диалоговое окно выбора инструмента для анализа данных

После выбора инструмента «Описательная статистика» и нажатия ОК появится еще одно диалоговое окно (рисунок 3), требующее ввода входных данных и места вывода результатов. Здесь достаточно в поле «Входной интервал» ввести диапазон ячеек, содержащих исходные данные. Можно указать диапазон с заголовками столбцов, в этом случае потребуется включить флажок «Метки в первой строке». Для указания выходного интервала достаточно указать только левую верхнюю ячейку диапазона. Результаты вычисления автоматически займут требуемое количество строк и столбцов в таблице.

Рисунок 3. Диалоговое окно инструмента «Описательная статистика»

Рассмотрим работу инструмента анализа «Описательная статистика» на следующем примере. В процессе обследования группы школьников (n = 21) измерялись следующие показатели: рост, масса тела, динамометрия правой и левой руки, жизненная емкость легких, проба Штанге и проба Генчи. Результаты были занесены в таблицу (рисунок 4).

Для получения статистических характеристик воспользуемся пакетом анализа, инструментом «Описательная статистика». В поле «Входной интервал» занесем диапазон ячеек В1:Н22. Так как выделенный входной интервал содержит заголовки столбцов, включаем флажок «Метки в первой строке». Для удобства работы в качестве места выхода результата выбираем «Новый рабочий лист». В качестве выводимых данных отметим флажками «Итоговая статистика» и «Уровень надежности: 95 %». Последний флажок позволит вывести параметры доверительного интервала с доверительной вероятностью 0,95. Полученный результат после небольшого форматирования будет выглядеть так, как показано на рисунке 5.

Рисунок 4. Результаты обследования группы школьников

Рисунок 5. Результат работы инструмента «Описательная статистика»

После выбора инструмента «Корреляция» и нажатия ОК в диалоговом окне «Анализ данных» (рисунки 2, 6) появится еще одно диалоговое окно (рисунок 7), требующее ввода входных данных и места вывода результатов. Здесь достаточно в поле «Входной интервал» ввести диапазон ячеек, содержащих исходные данные. Можно указать диапазон с заголовками столбцов, в этом случае потребуется включить флажок «Метки в первой строке». Для указания выходного интервала достаточо указать только левую верхнюю ячейку диапазона. Результаты вычисления автоматически займут требуемое количество строк и столбцов в таблице.

Рисунок 6. Диалоговое окно выбора инструмента для анализа данных

Рисунок 7. Диалоговое окно инструмента «Корреляция»

Рассмотрим работу инструмента анализа «Корреляция» на примере, представленном на рисунке 4.

Для получения корреляционной матрицы воспользуемся пакетом анализа, инструментом «Корреляция». В поле «Входной интервал» занесем диапазон ячеек В1:Н22. Так как выделенный входной интервал содержит заголовки столбцов, включаем флажок «Метки в первой строке». Для удобства работы в качестве места выхода результата выбираем «Новый рабочий лист». Полученный результат после небольшого форматирования будет выглядеть так, как показано на рисунке 8.

Рисунок 8. Корреляционная матрица

Таким образом, путем выполнения несложных операций мы получаем большое количество результатов вычислений. Стоит отметить, что хотя информационные технологии открывают перед исследователем возможности получения огромного количества информации для анализа, отбор наиболее информативных результатов, окончательная интерпретация и формулировка выводов – работа самого исследователя.

Основные понятия корреляционного анализа экспериментальных данных. Оценка коэффициента корреляции по экспериментальным данным.

В спортивных исследованиях между изучаемыми показателями часто обнаруживается взаимосвязь. Вид ее бывает различным. Например, определение ускорения по известным данным скорости, второй закон Ньютона и другие характеризуют так называемую функциональную зависимость, или взаимосвязь, при которой каждому значению одного показателя соответствует строго определенное значение другого.

К другому виду взаимосвязи относят, например, зависимость веса от длины тела. Одному значению длины тела может соответствовать несколько значений веса и наоборот. В таких случаях, когда одному значению одного показателя соответствует несколько значений другого, взаимосвязь называют статистической .

Изучению статистической взаимосвязи между различными показателями в спортивных исследованиях уделяют большое внимание, поскольку это позволяет вскрыть некоторые закономерности и в дальнейшем описать их как словесно, так и математически с целью использования в практической работе тренера и педагога.

Среди статистических взаимосвязей наиболее важны корреляционные . Корреляция – это статистическая зависимость между случайными величинами, при которой изменение одной из случайных величин приводит к изменению математического ожидания (среднего значения) другой. Например, толкание ядра 3 кг и 5 кг. Улучшение результатов толкания ядра 3 кг вызывает улучшение (в среднем) результата в толкании ядра весом 5 кг.

Статистический метод, который используется для исследования взаимосвязей, называется корреляционным анализом . Основной задачей его является определение формы, тесноты и направленности взаимосвязи изучаемых показателей. Корреляционный анализ позволяет исследовать только статистическую взаимосвязь. Он широко используется в теории тестов для оценки их надежности и информативности. Различные шкалы измерений требуют разных вариантов корреляционного анализа.

Величина коэффициента взаимосвязи рассчитывается с учетом шкалы, использованной для измерений.

Для оценки взаимосвязи, когда измерения производят в шкале отношений или интервалов и форма взаимосвязи линейная, используется коэффициент корреляции Бравэ-Пирсона (коэффициенты корреляции для других шкал измерения в данном пособии не рассматриваются). Обозначается он латинской буквой – r. Вычисление значения r чаще всего производят по формуле:

,

где и – средние арифметические значения показателей x и y, и – средние квадратические отклонения, n – число измерений (испытуемых).

В некоторых случаях тесноту взаимосвязи определяют на основании коэффициента детерминации D, который вычисляется по формуле:

.

Этот коэффициент определяет часть общей вариации одного показателя, которая объясняется вариацией другого показателя. Например, коэффициент корреляции r = –0,677 (между результатами в беге на 30 м с ходу и тройном прыжке с места). Коэффициент детерминации равен:

Следовательно, 45,8 % рассеяния спортивного результата в тройном прыжке объясняется изменением результатов в беге на 30 м. Иными словами, на оба исследуемых признака действуют общие факторы, вызывающие варьирование этих признаков, и доля общих факторов составляет 45,8%. Остальные 100% – 45,8% = 54,2% приходятся на долю факторов, действующих на исследуемые признаки избирательно.

Оценить статистическую достоверность коэффициента корреляции – это значит определить, существует или нет линейная корреляционная связь между генеральными совокупностями или, что то же, установить, существенно или несущественно отличается от нуля коэффициент корреляции между выборками. Эта задача может быть решена с помощью таблиц критических точек распределения коэффициента корреляции в следующем порядке:

1. Выдвигаются статистические гипотезы. Гипотеза Н 0 предполагает отсутствие статистически значимой взаимосвязи между исследуемыми показателями (r ген =0). Гипотеза Н 1 предполагает, что существует статистически достоверная взаимосвязь между показателями (r ген >0).

2. Рассчитывается наблюдаемое значение коэффициента корреляции r набл .

3. Находится по таблице критическое значение коэффициента корреляции r крит в зависимости от объема выборки n , уровня значимости a и вида критической области (односторонняя или двусторонняя).

3. Сравнивается r набл и r крит .

Если r набл < r крит – статистически недостоверным (незначимым). Принимается гипотеза Н 0 Если r набл r крит , коэффициент корреляции считается статистически достоверным (значимым). Принимается гипотеза Н 1 .


Не потеряйте. Подпишитесь и получите ссылку на статью себе на почту.

Деятельность людей во множестве случаев предполагает работу с данными, а она в свою очередь может подразумевать не только оперирование ими, но и их изучение, обработку и анализ. Например, когда нужно уплотнить информацию, найти какие-то взаимосвязи или определить структуры. И как раз для аналитики в этом случае очень удобно пользоваться не только , но и применять статистические методы.

Особенностью методов статистического анализа является их комплексность, обусловленная многообразием форм статистических закономерностей, а также сложностью процесса статистических исследований. Однако мы хотим поговорить именно о таких методах, которые может применять каждый, причем делать это эффективно и с удовольствием.

Статистическое исследование может проводиться посредством следующих методик:

  • Статистическое наблюдение;
  • Сводка и группировка материалов статистического наблюдения;
  • Абсолютные и относительные статистические величины;
  • Вариационные ряды;
  • Выборка;
  • Корреляционный и регрессионный анализ;
  • Ряды динамики.

Статистическое наблюдение

Статистическое наблюдение является планомерным, организованным и в большинстве случаев систематическим сбором информации, направленным, главным образом, на явления социальной жизни. Реализуется данный метод через регистрацию предварительно определенных наиболее ярких признаков, цель которой состоит в последующем получении характеристик изучаемых явлений.

Статистическое наблюдение должно выполняться с учетом некоторых важных требований:

  • Оно должно полностью охватывать изучаемые явления;
  • Получаемые данные должны быть точными и достоверными;
  • Получаемые данные должны быть однообразными и легкосопоставимыми.

Также статистическое наблюдение может иметь две формы:

  • Отчетность – это такая форма статистического наблюдения, где информация поступает в конкретные статистические подразделения организаций, учреждений или предприятий. В этом случае данные вносятся в специальные отчеты.
  • Специально организованное наблюдение – наблюдение, которое организуется с определенной целью, чтобы получить сведения, которых не имеется в отчетах, или же для уточнения и установления достоверности информации отчетов. К этой форме относятся опросы (например, опросы мнений людей), перепись населения и т.п.

Кроме того, статистическое наблюдение может быть категоризировано на основе двух признаков: либо на основе характера регистрации данных, либо на основе охвата единиц наблюдения. К первой категории относятся опросы, документирование и прямое наблюдение, а ко второй – наблюдение сплошное и несплошное, т.е. выборочное.

Для получения данных при помощи статистического наблюдения можно применять такие способы как анкетирование, корреспондентская деятельность, самоисчисление (когда наблюдаемые, например, сами заполняют соответствующие документы), экспедиции и составление отчетов.

Сводка и группировка материалов статистического наблюдения

Говоря о втором методе, в первую очередь следует сказать о сводке. Сводка представляет собой процесс обработки определенных единичных фактов, которые образуют общую совокупность данных, собранных при наблюдении. Если сводка проводится грамотно, огромное количество единичных данных об отдельных объектах наблюдения может превратиться в целый комплекс статистических таблиц и результатов. Также такое исследование способствует определению общих черт и закономерностей исследуемых явлений.

С учетом показателей точности и глубины изучения можно выделить простую и сложную сводку, но любая из них должна основываться на конкретных этапах:

  • Выбирается группировочный признак;
  • Определяется порядок формирования групп;
  • Разрабатывается система показателей, позволяющих охарактеризовать группу и объект или явление в целом;
  • Разрабатываются макеты таблиц, где будут представлены результаты сводки.

Важно заметить, что есть и разные формы сводки:

  • Централизованная сводка, требующая передачи полученного первичного материала в вышестоящий центр для последующей обработки;
  • Децентрализованная сводка, где изучение данных происходит на нескольких ступенях по восходящей.

Выполняться же сводка может при помощи специализированного оборудования, например, с использованием компьютерного ПО или вручную.

Что же касается группировки, то этот процесс отличается разделением исследуемых данных на группы по признакам. Особенности поставленных статистическим анализом задач влияют на то, какой именно будет группировка: типологической, структурной или аналитической. Именно поэтому для сводки и группировки либо прибегают к услугам узкопрофильных специалистов, либо применяют .

Абсолютные и относительные статистические величины

Абсолютные величина считаются самой первой формой представления статистических данных. С ее помощью удается придать явлениям размерные характеристики, например, по времени, по протяженности, по объему, по площади, по массе и т.д.

Если требуется узнать об индивидуальных абсолютных статистических величинах, можно прибегнуть к замерам, оценке, подсчету или взвешиванию. А если нужно получить итоговые объемные показатели, следует использовать сводку и группировку. Нужно иметь в виду, что абсолютные статистические величины отличаются наличием единиц измерения. К таким единицам относят стоимостные, трудовые и натуральные.

А относительные величины выражают количественные соотношения, касающиеся явлений социальной жизни. Чтобы их получить, одни величины всегда делятся на другие. Показатель, с которым сравнивают (это знаменатель), называют основанием сравнения, а показатель, которой сравнивают (это числитель), называют отчетной величиной.

Относительные величины могут быть разными, что зависит от их содержательной части. Например, существуют величины сравнения, величины уровня развития, величины интенсивности конкретного процесса, величины координации, структуры, динамики и т.д. и т.п.

Чтобы изучить какую-то совокупность по дифференцирующимся признакам, в статистическом анализе применяются средние величины – обобщающие качественные характеристики совокупности однородных явлений по какому-либо дифференцирующемуся признаку.

Крайне важным свойством средних величин является то, что они говорят о значениях конкретных признаков во всем их комплексе единым числом. Невзирая на то, что у отдельных единиц может наблюдаться количественная разница, средние величины выражают общие значения, свойственные всем единицам исследуемого комплекса. Получается, что при помощи характеристики чего-то одного можно получить характеристику целого.

Следует иметь в виду, что одним из самых важных условий применения средних величин, если проводится статистический анализ социальных явлений, считается однородность их комплекса, для которого и нужно узнать среднюю величину. А от такого, как именно будут представлены начальные данные для исчисления средней величины, будет зависеть и формула ее определения.

Вариационные ряды

В некоторых случаях данных о средних показателях тех или иных изучаемых величин может быть недостаточно, чтобы провести обработку, оценку и глубокий анализ какого-то явления или процесса. Тогда во внимание следует брать вариацию или разброс показателей отдельных единиц, который тоже представляет собой важную характеристику исследуемой совокупности.

На индивидуальные значения величин могут воздействовать многие факторы, а сами изучаемые явления или процессы могут быть очень многообразны, т.е. обладать вариацией (это многообразие и есть вариационные ряды), причины которой следует искать в сущности того, что изучается.

Вышеназванные абсолютные величины находятся в непосредственной зависимости от единиц измерения признаков, а значит, делают процесс изучения, оценки и сравнения двух и более вариационных рядов более сложным. А относительные показатели нужно вычислять в качестве соотношения абсолютных и средних показателей.

Выборка

Смысл выборочного метода (или проще – выборки) состоит в том, что по свойствам одной части определяются численные характеристики целого (это называется генеральной совокупностью). Основной выборочного метода является внутренняя связь, объединяющая части и целое, единичное и общее.

Метод выборки отличается рядом существенных преимуществ перед остальными, т.к. благодаря уменьшению количества наблюдений позволяет сократить объемы работы, затрачиваемые средства и усилия, а также успешно получать данные о таких процессах и явлениях, где либо нецелесообразно, либо просто невозможно исследовать их полностью.

Соответствие характеристик выборки характеристикам изучаемого явления или процесса будет зависеть от комплекса условий, и в первую очередь от того, как вообще будет реализовываться выборочный метод на практике. Это может быть как планомерный отбор, идущий по подготовленной схеме, так и непланомерный, когда выборка производится из генеральной совокупности.

Но во всех случаях выборочный метод должен быть типичным и соответствовать критериям объективности. Данные требования нужно выполнять всегда, т.к. именно от них будет зависеть соответствие характеристик метода и характеристик того, что подвергается статистическому анализу.

Таким образом, перед обработкой выборочного материала необходимо провести его тщательную проверку, избавившись тем самым от всего ненужного и второстепенного. Одновременно с этим, составляя выборку, в обязательном порядке нужно обходить стороной любую самодеятельность. Это означает, что ни в коем случае не следует делать выборку только из вариантов, кажущихся типичными, а все другие – отбрасывать.

Эффективная и качественная выборка должна составляться объективно, т.е. производить ее нужно так, чтобы были исключены любые субъективные влияния и предвзятые побуждения. И чтобы это условие было соблюдено должным образом, требуется прибегнуть к принципу рандомизации или, проще говоря, к принципу случайного отбора вариантов из всей их генеральной совокупности.

Представленный принцип служит основой теории выборочного метода, и следовать ему нужно всегда, когда требуется создать эффективную выборочную совокупность, причем случаи планомерного отбора исключением здесь не являются.

Корреляционный и регрессионный анализ

Корреляционный анализ и регрессионный анализ – это два высокоэффективных метода, позволяющие проводить анализ больших объемов данных для изучения возможной взаимосвязи двух или большего количества показателей.

В случае с корреляционным анализом задачами являются:

  • Измерить тесноту имеющейся связи дифференцирующихся признаков;
  • Определить неизвестные причинные связи;
  • Оценить факторы, в наибольшей степени воздействующие на окончательный признак.

А в случае с регрессионным анализом задачи следующие:

  • Определить форму связи;
  • Установить степень воздействия независимых показателей на зависимый;
  • Определить расчетные значения зависимого показателя.

Чтобы решить все вышеназванные задачи, практически всегда нужно применять и корреляционный и регрессионный анализ в комплексе.

Ряды динамики

Посредством этого метода статистического анализа очень удобно определять интенсивность или скорость, с которой развиваются явления, находить тенденцию их развития, выделять колебания, сравнивать динамику развития, находить взаимосвязь развивающихся во времени явлений.

Ряд динамики – это такой ряд, в котором во времени последовательно расположены статистические показатели, изменения которых характеризуют процесс развития исследуемого объекта или явления.

Ряд динамики включает в себя два компонента:

  • Период или момент времени, связанный с имеющимися данными;
  • Уровень или статистический показатель.

В совокупности эти компоненты представляют собой два члена ряда динамики, где первый член (временной период) обозначается буквой «t», а второй (уровень) – буквой «y».

Исходя из длительности временных промежутков, с которыми взаимосвязаны уровни, ряды динамики могут быть моментными и интервальными. Интервальные ряды позволяют складывать уровни для получения общей величины периодов, следующих один за другим, а в моментных такой возможности нет, но этого там и не требуется.

Ряды динамики также существуют с равными и разными интервалами. Суть же интервалов в моментных и интервальных рядах всегда разная. В первом случае интервалом является временной промежуток между датами, к которым привязаны данные для анализа (удобно использовать такой ряд, например, для определения количества действий за месяц, год и т.д.). А во втором случае – временной промежуток, к которому привязана совокупность обобщенных данных (такой ряд можно использовать для определения качества тех же самых действий за месяц, год и т.п.). Интервалы могут быть равными и разными, независимо от типа ряда.

Естественно, чтобы научиться грамотно применять каждый из методов статистического анализа, недостаточно просто знать о них, ведь, по сути, статистика – это целая наука, требующая еще и определенных навыков и умений. Но чтобы она давалась проще, можно и нужно тренировать свое мышление и .

В остальном же исследование, оценка, обработка и анализ информации – очень интересные процессы. И даже в тех случаях, когда это не приводит к какому-то конкретному результату, за время исследования можно узнать множество интересных вещей. Статистический анализ нашел свое применение в огромном количестве сфер деятельности человека, а вы можете использовать его в учебе, работе, бизнесе и других областях, включая развитие детей и самообразование.

Группировки в уголовно - правовой статистике позволяют дать наиболее полную и всестороннюю криминологическую и уголовно-правовую характеристику по самым разнообразным признакам:

  • Ш по видам - статьям УК,
  • Ш по объекту посягательства,
  • Ш по территориальному признаку - район, область, край, республика,
  • Ш соотношение корыстных и насильственных преступлений,
  • Ш по времени совершения преступлений и т.д.),
  • Ш личности преступников (по полу, возрасту, образованию, социальному положению, месту жительства и т.д.),
  • Ш причин и условий, способствующих совершению преступлений, а также мер социально-правового контроля над ними .

При этом очень важно различные группировки из уголовно-правовой статистики сопоставлять не только друг с другом, но и с группировками из иных отраслей статистики (демографической, социально-экономической и др.), отражающих взаимосвязанные явления.

Различия в целевом назначении группировки, задачах, которые они решают в статистическом анализе, выражаются в существующей их классификации: типологические, структурные, аналитические.

Важнейшая задача группировок в статистике заключается в том, чтобы изучаемую массу единиц совокупности подразделить на характерные типы, т.е. на группы, однородные по существенным признакам. Эта задача решается с помощью типологической группировки.

Типологические группировки - это разграничение изучаемой совокупности на однородные группы, типы по существенному качественному признаку.

Основная цель типологической группировки - отграничение одного типа явлений от другого статистическими средствами. Этот вид группировок в значительной степени определяется сложившимися представлениями о том, какие типы явлений составляют содержание изучаемой совокупности.

В правовой статистике это три типа правоотношений: уголовно-правовые, административно-правовые и гражданско-правовые, которыми и определяются ее разделы.

В уголовно - правовой статистике, в частности, это может быть, например, распределение по полу лиц, совершивших преступления .

Данная группировка по качественному признаку, когда имеются всего лишь два значения этого признака, причем одно из них исключает другое, в статистке именуется альтернативной.

Последовательность действий проведения этого типа группировки элементарна:

  • 1) определяется тип явления, которое должно быть выделено - в нашем случае зарегистрированные преступления;
  • 2) выбирается группировочный признак как основание описания типа - в нашем случае пол лиц, совершивших преступления;
  • 3) устанавливаются границы интервалов (в нашем случае по всем лицам, выявленным в совершении преступлений);
  • 4) группировка оформляется в таблицу, выделенные группы (на основе комбинации группировочных признаков) объединяются в намеченные типы и определяется численность (удельный вес) каждого из них .

При типологической группировке, то есть при подытоживании единиц в качественно-однородные категории, эти категории должны, как отмечалось, определяться на основании положений соответствующей науки и норм закона. Например, группировка наказаний по видам осуществляется уголовно - правовой (судебной) статистикой в полном соответствии со ст. 43-59 УК, устанавливающих с исчерпывающей полнотой точные качественные признаки их отдельных видов (штраф, исправительные работы, лишение свободы и т.д.

Структурные группировки - это распределение типически однородных групп по количественным признакам, которые могут изменяться (варьировать). В научной литературе этот вид группировок иногда называют вариационным. С их помощью в уголовно-правовой статистике изучают, например, структуру преступников по варьирующему признаку: по возрасту, числу судимостей, по срокам лишения свободы, размерам заработной платы и другим количественным признакам.

Структурная, или вариационная, группировка статистических данных может производиться, чтобы изучить изменение структуры типически однородных групп преступлений, правонарушителей, гражданских исков и других показателей. Для структурной группировки материала необходимо наличие однородных совокупностей, расчленяемых по величине изменяющегося (варьирующего) признака.

Если в основе типологической группировки лежат качественные признаки, то в основу вариационной положены количественные (удельные веса преступлений, лиц, дел, возраст правонарушителей, сроки наказания, число судимостей, число оконченных классов, суммы ущерба, суммы иска, сроки расследования и рассмотрения уголовных или гражданских дел и т.д.) .

Количественные сдвиги в структуре изучаемых явлений за несколько лет свидетельствуют об изменении объективных тенденций и закономерностей, следственной или судебной практики, о результативности деятельности правоохранительных или других юридических органов. Взяв, например, абсолютные и относительные показатели судимости за много лет, мы выявим тенденции в судебной практике и ее связь с реальной преступностью. Изучив динамику абсолютных чисел учтенных преступлений какого-то вида, динамику его удельного веса в структуре всей преступности, мы обнаружим тенденции развития этого деяния.

Структурные группировки могут быть построены на основе долевого распределения преступлений по сферам и объектам преступного посягательства, субъектам Федерации, регионам и территориям

Структурные различия в этом случае могут раскрывать особенности криминологической обстановки в том или ином регионе.

К структурным (вариационным) группировкам примыкают ряды распределения единиц совокупности по варьирующим признакам.

Аналитические группировки - это распределение по зависимости, взаимосвязи между двумя или несколькими разнородными группами явлений или их признаками (например, распределение краж по месту и времени их совершения; осужденных за автотранспортные преступления - по стажу работы водителя и т.д.).

Аналитические группировки имеют большое значение для всех отраслей юридической статистики. Они дают возможность выявить многие скрытые зависимости и взаимосвязи, что имеет важное значение для принятия практических решений и развития юридической науки. Аналитический потенциал есть и у других видов группировок, а также иных статистических приемах, но собственно аналитическая группировка прямо преследует установление зависимостей между исследуемыми явлениями . По характеру своих задач к аналитической группировке близко стоят группировки корреляционные, когда зависимость между исследуемыми явлениями или процессами может быть относительно точно измерена.

Все виды рассмотренных группировок при анализе социально-правовых, деликтологических и криминологических аспектов, как правило, применяются вместе. Например, для установления общественной опасности и тяжести совершаемых преступлений мы можем расчленить их совокупность по категориям деяний и формам вины (типологическая группировка). Для определения результативности борьбы с преступностью различных правоохранительных органов (внутренних дел, наркоконтроля, таможенной службы, прокуратуры, службы безопасности) мы можем исследовать варьирование раскрываемости преступлений в упомянутых ведомствах (вариационная группировка).

Для того чтобы установить причины и условия роста или (снижения преступности в городе, регионе, стране) следует применить целый ряд аналитических группировок.

Предмет статистики менялся на протяжении всей истории развития статистической науки, до сих пор ученые не пришли к однозначному ответу по данному вопросу.

Предмет статистики – изучение общественных явлений и их анализ.

Так английские статистики Дж.Э.Юла, М.Дж.Кендэл считают: «Независимо от того, в какой отрасли знания получены числовые данные, они обладают определенного рода свойствами, для выявления которых может потребоваться особого рода научный метод обработки. Последний известен как статистический метод или статистика».

Универсальность статистики как науки связана с тем, что она занимается методами измерения и интерпретации, как в общественных науках, так и в науках о природе. Статистику признают особым методом, используемым в различных сферах деятельности, при решении разнообразных задач, определяемых как «собирание, представление и интерпретация числовых данных».

Статистическая методология и практика неразрывно связаны, дополняют и развивают друг друга. Статистическая теория обобщает опыт практической работы, развивает новые идеи и методы, обогащающие практическую статистическую деятельность. Статистическая практика – это научно организованная работа.

Таким образом, статистика – наука, изучающая количественную сторону массовых общественных явлений с целью установления закономерностей в неразрывной связи с их качественной стороной в конкретных условиях места и времени в их взаимосвязи и взаимозависимости (Н.Н. Ряузовский «Общая теория статистики»).

Суть данного определения связана с шестью основными моментами:

1. Изучаются не все явления, а только общественные и социально-экономические. Эти явления сложны, многообразны (например: производство труд, здравоохранение, культурная деятельность, население и др.), отличаются от явлений природы, которые имеют сравнительно устойчивый характер и повторяемость во времени.

2. Исследуются массовое социально-экономические явления, а не единичные, поскольку закономерности развития проявляются через множество фактов, при обобщении данных при достаточно большом числе единиц (закон больших чисел).

3. Явлениям дается количественная оценка, на основании которой раскрывается их качественное содержание (например: для количественного анализа безработицы применяется показатель занятости и коэффициент безработицы).

4. Числовые характеристики одного и того же явления различны в пространстве и во времени.

5. Социально-экономические явления изучаются в динамике с целью выявления тенденций и направленности развития, прогноза будущих ситуаций.

6. Изучение явлений во взаимосвязи и взаимозависимости.



Таким образом, при использовании статистических методов важно помнить о единстве количественной и качественной сторон изучаемого явления.

Итак, статистика занимается изучением массовых явлений или совокупностей.

Совокупность - представляет собой однородную по какому-либо признаку группу, которая состоит из ядра и окружающих его явлений («слой»). Ядро – концентрированное выражение всех специфических свойств данной группы, отличающих одну совокупность от других. «Слой» - единицы с неполным набором специфических свойств, которые принадлежат к данной совокупности с определенной вероятностью.

Например: совокупность – студенты, среди студентов есть:

- «идеальный студент» - отлично учится, много читает, активно участвует во внеучебной работе – это ядро.

Студент, для которого важны только «интересные», специальные знания; - это один слой.

Студент, которому интересная только внеучебная жизнь и т.д. – это другой слой.

Таким образом, «качество» одних студентов можно практически безошибочно отнести к тому или иному типу, других - достаточно сложно.

Соотношение ядра и его окружения в разных совокупностях различно, и зависит от условий существования совокупности: длительности, устойчивости, взаимодействия с другими совокупностями и др. Однако, ядро должно составлять большинство единиц совокупности, так как оно определяет ее характерные черты.

Поскольку статистика занимается изучением явлений в конкретный момент места и времени – она располагает ограниченным числом данных.

Статистическая совокупность – это множество объективно существующих единиц изучаемого явления, объединенных единой качественной основой, общей связью, но отличающихся друг от друга отдельными признаками. (Например, совокупность домохозяйств, совокупность семей, совокупность предприятий, фирм, объединений и т.п.).

Совокупность необходимо отличать от системы и структуры, поскольку в совокупности нет никакой упорядоченности, здесь все элементы разобщены.

Признак – это качественная особенность единицы совокупности.

По характеру отображения свойств единиц изучаемой совокупности признаки делятся на две основные группы:

1. Количественные – признаки, имеющие непосредственное количественное выражение, то есть их можно сложить (например: возраст, доход, количество детей, количество лет обучения, стаж работы и т.д.). Предполагают отношения «больше-меньше».

2. Качественные – признаки, не имеющие непосредственного количественного выражения, то есть признаки, которые нельзя сложить (например: пол, профессия, характер труда, отношение к чему-либо). Предполагают отношения «равенства-неравенства». (!не допускают отношения больше-меньше.)

Все качественные признаки делятся на:

Атрибутивные – являющиеся особенностью данного явления (например: профессия, характер труда и т.д.)

Альтернативные – противоположные по значению варианты (например: продукция годна или испорчена, для представителей отдельных возрастных групп существует вероятность дожить или не дожить до следующей возрастной группы; каждое лицо может состоять в браке или нет, мужчина или женщина и т.д.).

Кроме того, признаки в статистике могут делиться на разные группы, в зависимости от основания. Основные классификации признаков представлены на рисунке 1.2.

Классификации признаков в статистике

Описательные - признаки выражающиеся словесно (форма собственности предприятия, вид используемого сырья, профессия и т.д.) Описательные признаки подразделяют на номинальные, которые нельзя упорядочить, ранжировать (национальность, отраслевая принадлежность предприятия и др.) и порядковые, которые можно ранжировать (тарифный разряд, балл успеваемости студента, рейтинги компаний и др.).

Количественные признаки - такие, отдельные значения которых имеют числовое выражение (площадь территории региона, стоимость фондов предприятия, цена товара и тд.).

Первичные признаки характеризуют единицу совокупности в целом. Они могут быть измерены, сосчитаны, взвешены и существуют сами по себе независимо от их статистического изучения (численность жителей города, валовой сбор зерна, сумма страховых выплат).

Вторичные признаки получают расчетным путем через соотношение первичных признаков. Вторичные признаки являются продуктами человеческого сознания, результатами познания изучаемого объекта.

Прямые признаки - свойства, присущие тому объекту, который ими характеризуется.

Косвенные признаки - свойства, присущие не самому изучаемому объекту, а другим совокупностям, относящимся к объекту.

Альтернативные признаки - те, которые принимают только дна значения (пол человека, место проживания (город-село), признаки обладания или необладания чем-то.

Дискретные признаки. имеют только целочисленные значения.

Непрерывные признаки - способные принимать любые значения, как целые, так и дробные. К непрерывным относятся все вторичные признаки.

Моментные признаки - характеристики состояния, наличия чего-либо на определенный момент времени.

Интервальные признаки - характеристики процесса за определенный промежуток времени: год, полугодие, квартал, месяц, сутки и т.д.

Особенностью статистического исследования является то, что в нем изучаются только варьирующие признаки, т.е. признаки, принимающие различные значения (для атрибутивных, альтернативных признаков) или имеющие различные количественные уровни у отдельных единиц совокупности.

Значимым свойством статистической совокупности является вариация.

Вариация – это свойство статистической совокупности, отражающее способность к изменению, обусловленное как внешними, так и внутренними факторами, как связанными с сущностью исследуемого объекта, так и не связанными с ней.

Статистическая закономерность – это закономерность, устанавливаемая посредством закона больших чисел в массовых варьируемых явлениях, объединенных в статистическую совокупность.

Статистическая закономерность проявляется в тенденциях.

Функции статистики:

1. Описательная – с помощью цифр и чисел дается характеристика той или иной ситуации, процесса, явления

2. Объяснительная – выявляются причинно-следственные связи между явлениями и процессами; выявляются факторы, обусловливающие те или иные связи.

Природа статистических данных обусловлена 3 основными свойствами:

1. Неопределенность статистических данных

2. Вероятностный характер статистических данных (признак может принять это значение, а может и не принять)

3. Абстрактность статистических данных.


Елисеева И.И. Практикум по общей теории статистики. М.: Финансы и статистика, 2008. С.8.

 

 

Это интересно: