Подобные работы
Древнегреческий учённый-математик АРХИМЕД
echo "Основные работы Архимеда касались различных практических приложений математики (геометрии), физики, гидростатики и механики. Если ко всему перечисленному прибавить еще то, что сделано Архимедом
Шпаргалки по высшей математике (1 курс)
echo "Совокупность всех числовых значений переменой величины наз областью изменения этой переменной. Окрестность х0 наз производный интервал (a;b) содержащий эту . If каждому значению переменной х э
Структура исчисления предикатов построение логического вывода
echo "Потребность в общих именах при употреблений ЯЛП сохранится лишь для описания областей возможных значений этих переменных, что относится уже не к самому языку, а к метаязыку. Нужны также знаки св
Теория статистики
echo "Составными элементами сводки являются: 1) программа сводки; 2) подсчет групповых итогов; 3) оформление конечных результатов сводки в виде таблиц и графиков. Программа статистической сводки соде
Геометрия Лобачевского
echo "Вплоть до XX в. геометрию в школах преподавали по учебникам, в которые были включены евклидовы «Начала», переведённые и литературно обработанные. Однако не всё написанное Евклидом удовлетворяло
Применение тройных и кратных интегралов
echo "Реферат . Применение тройных или кратных интегралов. Выполнила: студентка группы ТЭ-97-1 Мелкоступова С.С. Проверил преподаватель кафедры высшей математики Седых Е.И. Иркутск 1998. Содержание .
Теория информации
echo "Понятие энтропии. 2) Понятие информации. 3) Решение некоторых типовых задач. 4) Заключение 5) Список использованной литературы. "; echo ''; echo " Главным свойством случайных событий является от
Дисперсионный анализ
echo "Введение…………………….……………………………………………....3 1 Дисперсионный анализ………………………………………………....4 1.1 Основные понятия дисперсионного анализа…………………..……4 1.2 Однофакторный дисперсионный анализ…………………………....
Теория статистикиСоставными элементами сводки являются: 1) программа сводки; 2) подсчет групповых итогов; 3) оформление конечных результатов сводки в виде таблиц и графиков. Программа статистической сводки содержит перечень групп, на которые расчленена изучаемая совокупность по определенным признакам, а также перечень показателей, необходимых для характеристики каждой группы. Программа сводки имеет, как правило, вид свободных статистических таблиц, которые следует заполнить расчетными данными. В сводке статистического материала важное звено занимают группировки, так как простой подсчет итогов без распределения единиц совокупности на группы по тем или иным признакам не дает полной характеристики объекта изучения. К статистическим группировкам прибегают при решении следующих задач: а) анализ структуры исследуемой совокупности; б) выявление связей и взаимозависимостей между экономическими явлениями. Для решения первой задачи строят структурные группировки. Для решения второй задачи строят аналитические группировки. Группировки бывают простые и комбинационные. Простая группировка образуется по одному признаку, комбинационная - по двум и более признакам. Можно осуществлять группировки как по количественному признаку, так и по атрибутивному. В количественной группировке группировочный признак выражается вариантами чисел. В атрибутивной группировке группировочный признак количественного выражения не имеет, так как характеризует качество изучаемого явления. В экономико-статистическом анализе делаются группировки как с равными, так и с неравными интервалами. При построении группировки с равными интервалами величину интервала групп определяют по следующей формуле: Рассмотрим пример на построение аналитической группировки. Таблица 1.1 Данные о стоимости основных фондов и товарной продукции предприятий
Примем число групп по данному признаку n = 5. Величину интервала в группах определяем по приведенной выше формуле. Тогда h = (396 – 198) : 5 = 39,6 млн. руб. Образуем группы предприятий по средней годовой стоимости основных производственных фондов. Нижнюю границу первого интервала составит минимальная величина группировочного признака 198 млн. руб. Верхняя граница первого интервала составит 198 + 39,6 = 237,6 млн. руб. При группировках по непрерывно варьирующим количественным признакам границу интервалов обозначают так, что верхняя граница предыдущего интервала служит нижней границей последующего интервала. Таким образом, нижней границей второго интервала будет величина 237,6 млн. руб., а верхней границей данного интервала - величина 237,6 + 39,6 = 277,2 млн. руб. Аналогично определяются границы последующих интервалов. Получаем следующие интервалы для 5 групп предприятий по средней годовой стоимости основных производственных фондов: 198 - 237,6; 237,6 - 277,2; 277,2 - 316,8; 316,8 - 356,4; 356,4 - 396,0. В первую группу вошло 6 предприятий; во вторую - 2; в третью - 6; в четвертую - 4; в пятую - 2. Так как по условию задачи необходимо установить зависимость объема товарной продукции от средней годовой стоимости основных производственных фондов, то в каждой выделенной группе определяем суммарную величину объема товарной продукции по совокупности предприятий в группе и в расчете на одно предприятие. По первой группе предприятий со средней годовой стоимостью основных производственных фондов от 198 млн. руб. до 237,6 млн. руб. объем товарной продукции составит: 399,6 + 348,3 + 378,3 + 350,1 + 590,4 + 315,0 = 2381,7 млн. руб., и в расчете на одно предприятие: 2381,7 : 6 = 396,9 тыс. руб. Аналогичные расчеты производим по другим группам. Результаты расчетов сведем в табл. 1.2. Таблица 1.2 Расчет среднего объема товарной продукции по группам предприятий
Используя условие данной задачи, построим структурную группировку. Для построения структурной группировки необходимо сформировать группы по второму признаку - величине товарной продукции. Возьмем число групп n = 5; границы интервалов групп определяем по формуле величины интервала группировки h , где Таблица 1.3 Структурная группировка предприятий по двум показателям
Статистические таблицы В результате обработки и систематизации первичных статистических данных получают ряды цифровых показателей, которые характеризуют отдельные стороны изучаемых явлений. Эти ряды называют статистическими. Статистические ряды делят на два вида: ряды распределения и ряды динамики. Ряды распределения характеризуют распределение единиц совокупности по какому-либо признаку. Ряды динамики характеризуют изменение изучаемых явлений во времени. Ряды распределения, в свою очередь, делятся на атрибутивные и вариационные. Атрибутивный ряд распределения образуется по качественному признаку. Вариационный ряд образуется по количественному признаку. Среди вариационных рядов распределения выделяют дискретные и интервальные ряды. В дискретном вариационном ряду распределения отдельные варианты имеют определенные конкретные значения. В интервальном вариационном ряду варианты колеблются в определенных пределах. Вариационные ряды изображают в системе прямоугольных координат в виде диаграмм. Дискретные вариационные ряды изображают в виде так называемого полигона распределения. Варианты откладываются на оси абсцисс, частоты - на оси ординат. Точки пересечения соединяются отрезками прямой. Интервальные вариационные ряды изображают в виде гистограммы. На оси абсцисс откладывают границы интервалов, на оси ординат - число единиц совокупности, приходящееся на единицу ширины интервала (плотность распределения). В интервалах строят прямоугольники. Для изображения интервальных вариационных рядов с равными интервалами на оси абсцисс откладывают границы интервалов, а на оси ординат - число единиц совокупности в данном интервале. Строят прямоугольники с равными интервалами. Интервальный вариационный ряд можно изображать также в виде кумуляты. На оси абсцисс откладывают границы интервалов, на оси ординат - нарастающие частоты, соответствующие верхним границам интервалов. Точки пересечения соединяют отрезками прямой. Статистические ряды как результат статистической сводки и группировки всегда излагаются в виде статистических таблиц. Статистическая таблица представляет собой форму наиболее рационального, наглядного и систематизированного изложения цифровых результатов сводки и обработки статистического материала. При построении статистических таблиц следует четко разграничивать статистическое подлежащее и статистическое сказуемое. Статистическим подлежащим таблицы является сам объект (перечень его единиц или их групп), который характеризуется числовыми показателями. Статистическим сказуемым таблицы являются числовые показатели, которые характеризуют изучаемый объект. Статистическое подлежащее располагают, как правило, в строках, статистическое сказуемое - в графах таблицы. В зависимости от строения подлежащего различают три вида таблиц: простые, групповые, комбинационные. Простые (перечневые) таблицы в подлежащем содержат перечень рассматриваемых объектов. Групповые таблицы в подлежащем содержат группировку единиц изучаемого объекта, образованную по какому-либо одному признаку. Комбинационные таблицы в подлежащем содержат группировку единиц, образованную по двум и более признакам. При построении таблиц следует строго придерживаться определенных правил: 1. Каждая таблица должна быть пронумерована и иметь заголовок, который в краткой форме должен отражать содержание таблицы, место и время явления. 2. В таблице используются только общепринятые сокращения. 3. В таблице должны быть приведены единицы измерения. Если единица измерения общая, она выносится справа над таблицей в скобках. 4. Цифровые данные целесообразно сокращать. 5. К таблице можно делать примечания, которые располагают под таблицей со сноской под чертой. 6. При переносе таблицы на другой лист, графы таблицы целесообразно обозначать арабскими цифрами. Тема 3. Графическое изображение статистических данных Графиками в статистике называют условные изображения числовых величин и их соотношений в виде различных геометрических фигур в системе прямоугольных координат. Графики являются средством обобщения и анализа статистических данных. С помощью графиков выявляются основные тенденции развития экономических явлений и взаимные связи между явлениями. Статистические графики различают по содержанию и способу построения. По содержанию изображаемых статистических показателей графики делят на следующие виды: 1) графики сравнения; 2) графики структуры; 3) графики динамики; 4) графики выполнения плана; 5) графики взаимосвязанных показателей. По способу построения различают столбиковые, ленточные, линейные, круговые, квадратные, секторные диаграммы. Для построения графиков сравнения целесообразно использовать линейную, столбиковую, ленточную, квадратную, круговую диаграммы. Столбиковая диаграмма изображается в виде столбиков, основания которых откладываются на оси абсцисс, высота - на оси ординат. Ширина столбиков произвольная, но одинаковая. Линейная диаграмма изображается в виде линии, соединяющей точки пересечения расчетных величин в ряде динамики. Ленточную диаграмму целесообразно строить в том случае, если объект характеризуется двумя показателями, как правило, противоположными по смыслу. В ленточной диаграмме в отличие от столбиковой столбики расположены не вертикально, а горизонтально в системе прямоугольных координат. Квадратную диаграмму целесообразно строить в том случае, когда между сравниваемыми показателями разница настолько велика, что установление подходящего масштаба оказывается затруднительным. Сторона каждого квадрата определяется как корень квадратный из соответствующей величины. Тогда площадь квадратов визуально будет характеризовать ту или иную исходную величину. Круговые диаграммы строятся аналогично квадратам. Радиус круга есть корень квадратный из определенной величины. Для построения графиков структуры, как правило, используют столбиковые и секторные диаграммы. Особенностью построения секторной диаграммы является то, что объем круга в секторной диаграмме принимается за 100 процентов, а величины секторов пропорциональны процентному отношению составных частой к их общему итогу. Построение графиков динамики осуществляется, как правило, с помощью столбиковой или линейной диаграмм. Графическое изображение показателей выполнения плана можно осуществить в виде линейной, ленточной и столбиковой диаграмм в системе прямоугольных координат. При этом на оси абсцисс откладывают периоды динамики, на оси ординат - показатели выполнения плана. Для графического изображения показателей выполнения плана часто используют числовые сетки с двумя сопряженными шкалами. Одна шкала характеризует выполнение плана в абсолютных величинах, другая - в относительных величинах (проценты выполнения плана). Числовые сетки используют для характеристики выполнения планового задания за период динамики либо в разрезе цехов и участков. Построение графиков взаимосвязанных показателей, один из которых равен произведению двух других, можно осуществлять с помощью так называемых 'знаков Варзара'. '3нак' строится вне системы прямоугольных координат в виде прямоугольника, основание которого пропорционально одному показателю - сомножителю, высота - другому. При построении графиков (диаграмм) в системе прямоугольных координат необходимо придерживаться следующих правил: 1. Каждый график должен иметь название, которое располагают под ним. В названии в краткой форме следует отразить содержание, место и время явления. Все графики нумеруются. 2. Оси координат должны быть названы и иметь единицы измерения. 3. На числовой оси следует откладывать только целые числа и в равном масштабе (например: 20; 40; 60 и т.д., или 1500; 3000; 4500 и т.д.). Заканчиваться числовая ось должна той величиной, которая немногим больше максимальной величины в исходной совокупности. 4. Если на одной числовой оси необходимо расположить величины, относящиеся к одному и тому же явлению, но резко отличающиеся друг от друга по абсолютному значению, числовую ось можно разорвать знаком ( ), что означает разрыв масштаба. 5. Если необходимо отразить на одном графике (в одной системе прямоугольных координат) два-три явления, то вводят столько же дополнительных числовых осей (осей ординат). Каждая числовая ось должна иметь свою размерность и свой масштаб. Тема 4. Абсолютные и относительные статистические величины Под абсолютными величинами в статистике понимают показатели, которые характеризуют размеры (уровни, объемы) изучаемых экономических явлений. Абсолютные величины являются исходной базой статистического анализа. В отличие от абсолютных величин относительные величины являются величинами производными и рассчитываются на основе абсолютных. В статистическом анализе используют следующие виды относительных величин: величины динамики, величины выполнения плана, величины структуры, величины координации, величины интенсивности, величины сравнения. При изучении относительных величин динамики необходимо, прежде всего, уяснить их роль в характеристике развития явления во времени. Следует обратить внимание на характер базы сравнения (постоянная, переменная). Приведем пример расчета относительных величин динамики (табл. 4.1). Таблица 4.1 Выпуск товарной продукции на предприятии
Вычислим относительные величины динамики с переменной базой сравнения, используя соотношения каждого последующего месяца к предыдущему: 1426,9 : 1390,7 = 1,026; 1492,6 : 1426,9 = 1,046 100 = 104,6% и т.д. При вычислении относительных величин структуры следует уяснить их связь с группировкой статистических данных. Приведем пример расчета (табл. 4.2). Таблица 4.2 Распределение рабочих по тарифным разрядам
Например, соотношение выпуска продукции на двух предприятиях в отчетном периоде составило 102%. Тема 5. Средние величины Средние величины в статистике выполняют роль обобщающих показателей, характеризующих изучаемую совокупность единиц по какому-либо признаку. В статистике используют различные виды средних величин: средняя арифметическая простая, средняя арифметическая взвешенная; средняя гармоническая, средняя геометрическая; структурные средние - мода и медиана. При изучении данной темы особое внимание следует обратить на то, что каждый вид средней величины определяется в зависимости от конкретного экономического условия и от поставленной задачи. В противном случае средняя величина даст ошибочный результат и будет являться искаженной характеристикой изучаемой статистической совокупности. Средняя величина рассчитывается по качественно однородной совокупности, значения которой примерно одного порядка. Это - основное условие применения средней. Нельзя забывать о том, что средние величины в статистике являются величинами именованными и выражаются в тех же единицах, в которых выражен признак. Необходимо также уяснить значение средних моды и медианы, с помощью которых изучают структуру исследуемой совокупности. Проиллюстрируем на конкретных примерах порядок расчета каждого вида средних величин. 1. Распределение рабочих-наладчиков участка одного из цехов промышленного предприятия по стажу работы и квалификационным разрядам характеризуется следующими данными: Таблица 5.1 Данные о составе рабочих
Решение: а) Для нахождения среднего разряда рабочих каждой возрастной группы следует применить среднюю арифметическую взвешенную: Причем, в качестве 'x' будут срединные значения признака в группах, а в качестве веса ( m ) принимают численность рабочих соответствующей группы: Таблица 5.2 Данные о выполнении производственного задания
Следовательно, в данной задаче модальным будет интервал от 100 до 105 процентов, так как на него приходится наибольшее число рабочих (20 чел.). Моду определяют по формуле: Mo = x 0 + Подставим значения в формулу: Mo = 100 + Следовательно, медианным является интервал, на который приходится 50% накопленных частот данного ряда, что по условию задачи 42 : 2 = 21. В нашей задаче медиана находится в интервале от 100 до 105% , так как на данный интервал приходится накопленная частота 23. Медиану определяют по формуле: Me = x 0 + Подставим соответствующее значение в формулу: Me = 100 + Моментные ряды характеризуют изменение явления в динамике на определенный момент времени (чаще - на начало или конец периода). Интервальные ряды характеризуют изменение явления в динамике за определенный период времени (месяц, квартал, год). В экономическом анализе используют аналитические показатели динамики. К ним относят абсолютный прирост, средний абсолютный прирост, темп роста, темп прироста, средний темп роста, абсолютное значение одного процента прироста. Данные показатели широко используются в статистической практике, что вызывает необходимость тщательного изучения порядка их расчета. Рассмотрим на примере расчет аналитических показателей ряда динамики (табл. 6.1). Таблица 6.1 Данные о производстве в цехе
Средний абсолютный прирост ( Абсолютное значение одного процента прироста (А) характеризует абсолютный эквивалент одного процента прироста и определяется по формуле: А = Средний темп роста ( Наиболее простым в использовании является метод укрупнения интервалов, основанный на укрупнении периодов времени, к которым относятся уровни ряда. Выявление тенденции осуществляется по новому укрупненному ряду динамики. Другой метод - метод скользящей средней заключается в замене первоначальных уровней ряда динамики средними арифметическими, найденными по способу скольжения, начиная с первого уровня ряда с постепенным включением последующих уровней. Наиболее совершенным методом выявления тенденции ряда динамики является метод аналитического выравнивания, который заключается в замене первоначальных уровней ряда новыми, найденными во времени ' t ' построением аналитического уравнения связи. Рассмотрим на примере возможности применения каждого из методов выравнивания при выявлении тенденции ряда динамики. Известны следующие данные выполнения программы участком 'молдинги' цеха ЗИЛ-130 прессового корпуса за 1989 г. (табл.6.2). Таблица 6.2
Выровненный ряд динамики примет вид: 54,8 55,2 56,3 57,5. То есть наблюдается четно выраженная тенденция увеличения выпуска молдингов цехом за 1989 г. 2. Употребляя те же данные, применим метод скользящей средней, используя семичленную скользящую среднюю. Тогда: Выравненный с помощью семичленной скользящей средней ряд динамики примет вид: 18,5 18,4 18,6 18,7 18,8 19,0. Таким образом, подтверждается тенденция увеличения выпуска молдингов в течение 1989 г. 3. Используя метод отсчета от условного нуля введем условное обозначение времени ' t ', придав ему определенные значения так, чтобы t = 0 (см. табл. 6.2). Судя по выявленной с помощью двух предыдущих методов тенденции выпуска молдингов в течение года, можно сказать, что наиболее вероятна линейная зависимость данного распределения от времени ' t ' и данному распределению соответствует уравнение прямой Простейшим показателем вариации является размах вариации, который рассчитывается по следующей формуле: R = Xmax – Xmin , где Xmax , Xmin - соответственно, максимальное и минимальное значения признака в исследуемой совокупности. Размах вариации характеризует диапазон колебаний признака в изучаемой совокупности и измеряется в тех же единицах, в которых выражен признак. Рассчитывают среднее линейное отклонение, которое бывает невзвешенное и взвешенное. Если каждое значение признака встречается в совокупности один раз, то применяется формула среднего линейного отклонения невзвешенного: Среднее линейное отклонение характеризует абсолютный размер колеблемости признака около средней и измеряется в тех же единицах, в которых выражен признак. Наиболее точным показателем вариации является среднее квадратическое отклонение. Для его определения предварительно рассчитывают показатель дисперсии. Дисперсия невзвешенная определяется по формуле: 2 = Частные или групповые дисперсии характеризуют колеблемость изучаемого признака в каждой отдельной группе и определяются по следующей формуле: Межгрупповая дисперсия характеризует колеблемость частных средних около общей средней Таблице 7.1 Стаж работы рабочих
Величина = 1,3 года характеризует колеблемость стажа работы рабочих в данной совокупности: = Индексы измеряются в процентах. Для некоторых простых, единичных явлений, которые допускают непосредственное сравнение, строят индивидуальные индексы. Дня явлений сложных, состоящих из непосредственно несоизмеримых элементов, строят сводные индексы. Так, для характеристики динамики производства конкретного вида продукции, применяется индивидуальный индекс. Если же исследователя интересует динамика выпуска всей продукции предприятия, то в этом случае строится сводный индекс, так как отдельные виды продукции предприятия непосредственно несоизмеримы. Разработанная статистикой теория индексов позволяет решить следующие задачи: 1) определять соотношение показателей во времени, пространстве, фактических данных с плановыми; 2) выявлять абсолютные результаты измерения показателей в аналогичных направлениях; 3) определять относительное и абсолютное влияние отдельных факторов на такое изменение при условии, что факторы представлены в виде произведения. В теории индексов наиболее часто используются следующие обозначения: I - индивидуальный индекс; J - сводный индекс. Порядок построения индивидуальных индексов весьма прост: в числителе дроби записывается показатель на уровне отчетного периода, в знаменателе - на уровне базисного периода. Например: I p = Существуют цепные и базисные индивидуальные индексы. В цепных индексах каждый последующий период сравнивается с предыдущим, например: Нетрудно заметить, что перемножение цепных индексов дает в итоге сравнение явлений, разделенных рядом промежутков времени (базисные индексы): Следует знать, что индексы динамики, планового задания и выполнения плана связаны между собой известным из теории относительных величин соотношением: I динамики = I пл. задания I выполнения плана. Если в задаче требуется найти абсолютное изменение какого-то явления, то оно определяется как разница между числителем и знаменателем индекса: (p 1 – p 0 ); ( t 1 – t 0 ) и т.д. Если при этом ставится задача определить, как влияет это изменение на какое-то многофакторное явление, то найденная разность между числителем и знаменателем качественного индекса (цен, трудоемкости и т.п.) умножается на соответствующий количественный фактор (количество продукции, численность работающих и т.п.) на уровне отчетного периода. Разность между числителем и знаменателем количественного индекса (продукции, численности работающих и т.п.) умножается на соответствующий качественный фактор (трудоемкость и т.п.) на уровне базисного периода: (p 1 – p 0 ) q 1 - размер экономии (перерасхода) денежных средств от снижения (повышения) цен; ( t 1 – t 0 ) q 1 - размер увеличения (уменьшения) затрат труда на производство продукции от повышения (снижения) трудоемкости; (q 1 – q 0 ) p 0 - размер экономии (перерасхода) денежных средств от изменения объема выпуска продукции; (q 1 – q 0 ) t 0 - размер увеличения (уменьшения) затрат труда на производство продукции от изменения объема выпуска продукции и т.д. В отличие от индивидуальных индексов, сводные индексы представляют собой результат сравнения сложных явлений, состоящих из непосредственно несоизмеримых элементов. Сводные индексы представляют собой соотношение сумм произведений индексируемых величин и их соизмерителей. В качестве соизмерителей могут выступать: трудоемкость изготовления продукции ( t ), цена единицы продукции ( p ), себестоимость единицы продукции ( z ). Название сводного индекса определяется изменяющимся (индексируемым) показателем. Индексируемый показатель записывают в числителе на уровне отчетного периода, в знаменателе - на уровне базисного периода или на уровне планового задания. Если индексируется качественный показатель (цена, трудоемкость, себестоимость), то соответствующий ему количественный соизмеритель фиксируется на уровне отчетного периода. Если индексируется количественный показатель, то соответствующий ему качественный соизмеритель фиксируется на уровне базисного периода или на уровне планового задания. Исходя из этого, сводный индекс цен запишется: J p = Первое свойство индексов: индекс переменного состава равен произведению индексов постоянного состава и структурных сдвигов: J qp = J q J p ;
Индивидуальные индексы по соответствующим видам продукции составят: I q (А) = Индивидуальные индексы цен по соответствующим видам продукции составят: I p (А) = Сводный индекс объема продукции в стоимостном выражении составит: J qp = Второй этап - построение модели. Последний этап - интерпретация результатов. Признаки-аргументы называются факторами, а признаки-функции - результатами (результативными признаками). Связи между явлениями делят по степени тесноты связи (полная или функциональная связь, неполная или статистическая связь), по направлению (прямая, обратная), по аналитическому выражению (линейная, нелинейная). Для выявления связи, ее характера, направления используют методы приведения параллельных данных, балансовый, аналитических группировок, графический. Суть метода приведения параллельных данных: приводят два ряда данных о двух признаках, связь между которыми хотят выявить, и по характеру изменений делают заключение о наличии связи. Балансовый метод заключается в построении балансов - таблиц, где итог одной части равен итогу другой. Методы аналитических группировок и графический изложены в соответствующих темах. Удобная форма изложения данных - корреляционная таблица (табл. 9.1). Таблица 9.1 Корреляционная таблица
Обозначив эти средние значения через Ломаная линия на графике (линия значений Коэффициент знаков (коэффициент Фехнера) вычисляется на основании определения знаков отклонений вариантов двух взаимосвязанных признаков от их средних величин. Если число совпадений знаков обозначать через a , число несовпадений - через b , а сам коэффициент - через i , то можно записать формулу этого коэффициента так: Величина коэффициента конкордации более 0,5 показывает, что между исследуемыми величинами имеется тесная зависимость. Если при определении тесноты связи с помощью приведенных ранговых коэффициентов имеются связные ранги, т.е. если двум или более показателям присвоен один и тот же ранг, то расчеты проводятся по формулам: коэффициент Спирмена: x/y = 1 –
Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если A ³ 0,5, или K ³ 0,3. Если каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициента взаимной сопряженности Пирсона. Этот коэффициент вычисляется по формуле: C = Расчет коэффициента взаимной сопряженности проводится по следующей схеме:
Корреляция и регрессия. Традиционные методы корреляционно-регрессионного анализа позволяют не только оценить тесноту связи, но и выразить эту связь аналитически. Применению корреляционно-регрессионного анализа должен предшествовать качественный, теоретический анализ исследуемого социально-экономического явления или процесса. Связь между двумя факторами аналитически выражается уравнениями: прямой Параметр a 1 - коэффициент регрессии показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу. На основе этого параметра вычисляются коэффициенты эластичности, которые показывают изменение результативного признака в процентах в зависимости от изменения факторного признака на 1%: Э = a 1 Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции: r = Линейная связь между тремя факторами выражается уравнением: Дисперсионный анализ связи. При небольшом числе наблюдений исследовать влияние одного или нескольких факторных признаков на результативный можно, используя методы дисперсионного анализа. Дисперсионный анализ проводится расчетом дисперсий: общей, межгрупповой и внутригрупповой. Общую дисперсию называют дисперсией комплекса, межгрупповую - факторной, внутригрупповую - остаточной. Дисперсионный анализ заключается в сравнении факторной и остаточной дисперсий. Если различие между ними значимо, то факторный признак, т.е. признак, положенный в основание группировки, оказывает существенное влияние на результативный. При исследовании воздействия на результативный признак только одного факторного, т.е. однофакторного комплекса дисперсии вычисляются: дисперсия комплекса Ошибка репрезентативности, или разность между выборочной и генеральной характеристикой (средней, долей), возникающая в силу несплошного наблюдения, в основе которого лежит случайный отбор, рассчитывается как предел наивероятной ошибки. В качестве уровня гарантийной вероятности обычно берется 0,954 или 0,997. Тогда предел ошибки определяется величиной удвоенной или утроенной средней ошибки выборки: D = 2 m при P = 0,954; D = 3 m при P = 0,997, или в общем виде D = t m ( t - коэффициент, связанный с вероятностью, гарантирующей результат). Величина средней ошибки выборки различна для отдельных разновидностей случайного отбора. При наиболее простой системе - собственно-случайном повторном отборе - средняя ошибка определяется следующими формулами: индивидуальный отбор: m = Определение ошибок выборочных характеристик позволяет установить наивероятные границы нахождения соответствующих генеральных показателей: для средней: Пример. С вероятностью 0,954 нужно определить границы среднего веса пачки чая для всей партии, поступившей в торговую сеть, если контрольная выборочная проверка дала следующие результаты (первые две графы табл. 10.1). Таблица 10.1 Результаты взвешивания чая
Определение объема выборки при заданной ее точности является проблемой, обратной рассмотренной нами - определению ошибки выборки при данном ее объеме. Формула объема выборки получается из соответствующей формулы предельной ошибки. Так, получаем для индивидуального бесповторного отбора: n = Рассмотрим следующий общий пример. Пример. Нужно определить абсолютный и относительный объемы индивидуального отбора для исследования генеральной доли, чтобы ошибка частости с вероятностью 0,954 не превышала 0,02, если выборка производится из генеральной совокупности объема: а) 1000; б) 100000 единиц. Используя формулу n = Рассмотрим эти этапы более подробно. 1. Так как для установления закона распределения необходимы большие выборки, то на практике часто встает вопрос об объединении нескольких выборок, каждая из которых мала для решения поставленной задачи и получения одной общей выборки, удовлетворяющей предъявленным к ней требованиям. Поэтому, что вообще свойственно для статистической обработки, любое из неправильных решений (как положительное, так и отрицательное) по поводу объединения выборок приводит к нежелательным результатам, или к невозможности установить закон распределения, если выборки не объединяются, или к неправильному выводу о характере закона распределения. Для решения этой задачи используют критерии, с помощью которых с разной формулировкой фактически дается ответ на один и тот же вопрос: принадлежат или не принадлежат исследуемые выборки одной генеральной совокупности, то есть автоматически решается задача о возможности или невозможности их объединения. Как правило, все эти критерии основаны на сравнении выборочных характеристик (выборочных дисперсий или средних величин) между собой или с соответствующими генеральными характеристиками. В большинстве случаев использование этих критериев предполагает нормальный или логарифмически-нормальный закон распределения для каждой выборки. При других же законах распределения эти критерии некорректны и их использование может привести к ошибочным результатам. Наиболее используемыми являются следующие критерии: а) критерии, основанные на сравнении дисперсий: критерий Описанная проверка также осуществляется с помощью соответствующих критериев: критерия Груббса (для малых выборок), критерия Ирвина и некоторых других. В качестве нулевой гипотезы во всех случаях принимается предположение о том, что резко выделяющиеся результаты принадлежат данной выборке. 3. Заключительной и самой трудоемкой проверкой является проверка гипотез о виде функции распределения или, что то же, о соответствии предполагаемого закона теоретического распределения эмпирическому. Эта проверка осуществляется с помощью так называемых критериев согласия. Существуют критерии для проверки соответствия как предполагаемому нормальному или логарифмически-нормальному закону распределения, так и любому другому закону распределения. Наиболее используемыми при практических расчетах являются следующие критерии: а) критерий Пирсона ( 2 ); он справедлив при больших объемах выборок и для любых законов распределения; б) критерий Колмогорова-Смирнова ( Du ); этот критерий используется для проверки гипотезы о соответствии эмпирического распределения любому теоретическому закону распределения с заранее известными параметрами, что накладывает ограничения на его использование. В то же время Du является более мощным, чем критерий 2 ; в) критерий Крамера-Мизеса ( w 2 ); данный критерий используется для объемов выборок 50 n 200 и является более мощным, чем 2 , однако, при его применении требуется больший объем вычислений. Поэтому при n > 200 этот критерий целесообразно использовать только в тех случаях, когда проверки гипотезы по другим критериям не приводят к безусловным результатам; г) критерий Шапиро-Уилкса (W); он предназначен для проверки гипотезы о нормальном или логарифмически нормальном законе распределения при ограниченном объеме выборки ( n 50) и является более мощным, чем другие критерии. |