Страница:БСЭ-1 Том 38. Маммилярия - Мера стоимости (1938).pdf/216

Эта страница не была вычитана


МАТЕМАТИЧЕСКАЯ СТАТИСТИКАМ. с. состоят в выяснении возможности перенесения свойств, установленных для данного статистич. коллектива, на более обширный неизученный коллектив (генеральный статистич. коллектив), часть к-рого составляет данный, или на совокупность коллективов, аналогичных данному. В этом случае, при некоторых добавочных условиях, данный коллектив называется случайной выборкой или просто выборкой из ген. коллектива, и определение объема и характера выборки, при к-рых выводы из выборки распространились бы на ген. коллектив с заданными точностью и вероятностью, составляет основную проблему одного из важнейших отделов М. с. — теории выборок.

Статистические характеристики рассматриваются в учении о средних, дисперсии, моментах и в теории оценок статистич. характеристик. Описанием закономерностей в распределении частот статистич. коллективов занимается теория кривых распределения, а описанием связей между аргументами их — теории корреляции и ассоциации.

Средние, дисперсия, моменты. Подготовительными операциями н описанию статистич. коллективов служат составление таблиц распределения, в которых указываются аргументы, классы и численности классов коллективов и геометрических изображений таблиц в виде диаграмм, полигонов, гистограмм (ступенчатых графиков) и т. п. Дальнейшим наиболее важным средством изучения статистич. коллективов является составление средних — статистич. характеристик, описывающих положение статистич. коллектива. Возьмем, напр., одномерный статистич. коллектив (коллектив с одним количественным аргументом) 8, представленный таблицей: X пх

Xi п1

ха ... xs п2 ... ns

в к-рой хг, х2, ..., xs  — значения аргумента х, а пг, п2, ..., ns  — числа случаев, в которых наблюдались эти значения х. Дл>£ S средняя арифметическая или просто средняя х аргумента х определяется равенством

и представляет наиболее простую и распространенную статистич. характеристику. Медиана (см.) (Me) представляет следующий по важности вид средней и определяется как такое значение аргумента, менее и более к-рого значения х в S встречаются одинаково часто. Кроме этих наиболее употребительных средних, рассматриваются еще средние гармоническая, геометрическая и т. д.

Следующими по важности статистич. характеристиками являются меры рассеяния значений аргумента в статистич. коллективе: среднее квадратическое отклонение, дисперсия, вероятное отклонение, среднее абсолютное отклонение, квартили и т. п. Из этих мер наиболее употребительные среднее квадратическое отклонение и дисперсия; первое определяется равенством

ПаСх-х) 2, а вторая равна о2. Для большинства действительных коллективов среднее квадратическое отклонение обладает тем свойством, что в границах между х — За и х + За лежит более 99% всех встречающихся в коллективе значений х. Таким образом, чем менее а, тем более сосредоточены значения аргумента около их средней. Среднее квадратическое отклонение возможных значений какойлибо статистич. характеристики определяет ее точность и надежность, и потому разыскание средних квадратических отклонений статистич. характеристик составляет одну из важных задач М. с. Среднее квадратическое отклонение или средняя квадратическая ошибка средней х равна а~ = Дз . — Средние и меры дисперсии предх Vn ставляют частный случай более общего средства изучения статистич. коллективов, т. н. моментов (см.), среди к-рых различаются начальные, центральные и около произвольного начала. Начальные моменты определяются равенством W= 2

це нтр альные — р а венством 2 Пх (x~^hи моменты около произвольного начала а — равенством »7» = 2 Пх(п-а) п;

h называется порядком момента и принимает любые положительные значения. Первый начальный момент представляет среднюю х, второй центральный момент — дисперсию <*2, при помощи третьего центрального момента строится коэффициент асимметрии К = ~, измеряющий асимметрию распределения аргумента, и при помощи четвертого центрального момента строится эксцесс Е= — j  — 3, измеряющий плоско  — или высоковершинность распределения. Моменты более высокого порядка в М. с. употребляются очень редко. В новейшее время в М. с. стали употребляться кумулянты Р. Фишера, аналогичные моментам величины, обладающие некоторыми преимуществами перед ними.

Распределения и кривые распределения. Дальнейшим средством описания одномерных статистич. коллективов служат нек-рые определенные распределения и кривые распределения (см.). Наиболее важными из таких распределений являются биномиальное распределение Пуассона и нормальное или Гауссово распределение. Первое служит для описания распределений, к-рые могут быть сравнены с распределением частот нек-рого события в независимых испытаниях при постоянной вероятности события в каждом испытании. Второе — для описания распределений редких явлений (рождение троен и четверен, испускание а-частиц при распаде радиоактивных веществ и т. п.).

Нормальное распределение, имеющее уравнением _ (х  — х) 2

играет в М. с. фундаментальную роль, теоретическую и практическую, и служит для описания распределения аргументов, которые можно рассматривать как слагающиеся при воздействии многочисленных независимых или почти независимых причин (таким аргументом, напр., можно считать рост человека, распределение к-рого для большого однородного коллектива очень точно следует нормальному закону распределения). Уравнение (А) в геометрическом истолковании представляет нормальную кривую — одну из кривых распределения, служащих для описания непрерывных распределений (распределений с непрерывным аргументом). Общий вид их представляется уравнением y = nf(x, 02} ..., 0S), где 0/ — параметры распределения, принимающие определенные значения для данного конкретного распределения. При помощи кривой распределения находятся Р частоты пар = п § jdx значений аргумента, лежаа щих между заданными границами а и Р, и задача теории кривых распределения заключается в разыскании для различных распределений или классов их соответствующих форм функции f и способов разыскания значений параметров 0г  — таких, чтобы вычисленные частоты пар были возможно ближе к наблюденным для всех классов (а, р) данного коллектива. Наиболее употребительны для разыскания параметров наименьших квадратов способ (см.) и способ моментов. Первый заключается в том, что ищутся значения параметров 0/, обращающие в минимум сумму квадратов разностей между вычисленными и наблюденными частотами распределения, второй — в разыскании таких значений 0г-, к-рые делают равными вычисленные по кривой распределения и по данному распределению моменты первых порядков вплоть до 8—1. В последнее время, по предложению Р. Фишера, стал применяться способ наибольшего правдоподобия, состоящий в том, что ищутся значения параметров 0/, обращающие в максимум особую величину, называемую правдоподобием и пропорциональную вероятности наблюдения частот, равных наблюденным. — Наиболее употребительными формами функции /(х, 0J, 02, ..., 08> являются функции, определяемые дифференциальным уравнением К. Пирсона 1 dy _ х+а у dx~ Ъй + Ьгх + Ь2х2 ’ и ряды Шарлье, доставляющие обобщения нормального распределения и распределения Пуассона. — Когда кривая распределения /(х, 0Х, 02, ..., 0S) рассматривается как закон распределения аргумента в генеральном коллективе, тогда возникают задачи теоретического обоснования формы функции / и оценки найденных значений параметров 0/. Форма функции / может быть выбрана на основании соображений о реальной природе генерального коллектива, а оценка параметров 0г  — проще всего достигается разысканием их средних квадратических