Страница:БСЭ-1 Том 06. Бессарабия - Больм (1927).pdf/179

Эта страница не была вычитана

она будет тем больше, чем больше будет колеблемость приз н. а к а. Т. о., мы можем воспользоваться выражением 232 для установления меры колеблемости признака в данном в. ряду. За меру колеблемости берут т. н. (средн е е) квад — , где п п есть, как всегда, общее число (численность) всех вариант ряда. Квадрат, отклонение принято обозначать греч. буквой а (сигма). В случае т. н. нормального распределения вариант в в. ряду (к-рому, м. п., соответствует закон распределения случайных ошибок отдельных наблюдений около истинного значения изучаемого явления), графически выражаемого так. наз. биномиальной, или Гауссовой, кривой (рис. 3), вариационный ряд почти целиком (на 99, 7 % своей численности) укладывается в пределах, отстоящих от средне-арифметического не больше, чем на три квадратических отклонения в положительную и отрицательную сторону, т. е. в границах М=±=3 а. Для более детального изучения распределения пользуются т. н. методом моментов (см.).

К. Пирсон в целом ряде специальных исследований разработал теорию кривых распределения (см.), при чем им установлен ряд типов кривых (до настоящего времени 12). При помощи метода моментов определяются особые величины, так наз. критерии, дающие возможность подыскать такую теоретическую кривую, к-рая наиболее соответствует данному эмпирическому распределению, а зная кривую и ее уравнение, — легко уже определить и все основные ее элементы. Семейство кривых Пирсона охватывает кривые весьма разнообразного внешнего вида, начиная от LT-образных и Z-образных и кончая строго симметричными и даже ограниченными прямыми линиями. Кроме системы Пирсона, в математической статистике имеется ряд других систем, предложенных математиками Брунсом, Каптэйном, Эджвортом и др. — Чрезвычайно важным элементом биометрического изучения является определение т. н. ошибок получаемых величин. Все определяемые для в. ряда величины (М, Med, Mod, а и т. д.), называемые иногда сводными признаками, или константами, зависят от случайного подбора вариант, попавших в наш в. ряд. Эти величины, естественно, интересуют нас, гл. обр., постольку, поскольку мы можем вычисленные значения их приписывать всей основной совокупности индивидов, из к-рой мы произвели нашу выборку, взяли материал для нашего в. ряда. Очевидно, разные выборки из одной и той же общей совокупности дадут несколько отличные значения для наших сводных признаков, и мы должны уметь учесть колебания этих частных констант около нек-рой истинной величины, определяющей соответственную константу всей основной совокупности. Чтобы определить пределы, в к-рых наши частные сводные признаки могут отличаться от истинного значения их для всей совокупности, вычисляют обыкновенно т. н. (среднюю) квадратическую ошибку этих величин. Обозначим ее через е; тогда величина ее для средне-арифметического определится формулой е = —, а для квадратического отклом }/ п <т нения е = — - — (где п есть численность нашей выа у2п _ борки). Истинное М основной совокупности отстоит от найденного частного М нашей выборки на величину, почти наверное не превышающую ± Зе (с вероятностью около 330 против 1). Определение квадратической ошибки является обязательным элементом биометрической обработки, так как только она дает представление о точности и надежности полученных результатов. В связи с важностью определения средне-арифметического в. ряда приобретает важность и определение соответственной квадратической ошибки, и из выше приведенной формулы мы видим, что величина ошибки (т. е. неточность наших результатов) растет пропорционально а, т. е. колеблемости признака, и уменьшается пропорционально ]/п, т. е. квадратному корню из числа вариант нашей выборки. В прежних биометрических работах (а иногда и теперь) вместо квадратической ошибки е пользовались т. н. вероятной ошибкой, равной по своей величине 0, 6745 е.

Говоря вообще, вероятная ошибка не имеет никаких преимуществ перед квадратической ошибкой, а потому постепенно выходцт из употребления (подробнее об этом см. Квадратическая ошибка, Вероятная ошибка, Вероятность).

В Б. очень большим распространением пользуется еще одна константа, долженствующая характеризовать относительную изменчивость при 342

знаков и называемая коэффициентом изменчивости (вариации). Величина этого коэффициента определяется формулой С = — -. 100 (число отвлем X а его квадратическая ошибка АГ ченное), ес = — С V%n (в первом приближении). Однако, нужно отметить, что неограниченное пользование этой величиной, как мерилом изменчивости, вызывает ряд серьезных возражений как с формально-математической стороны, так и с биологической, а потому основанные на его широком применении выводы подлежат еще строгой проверке. С биологической стороны коэффициент изменчивости имеет лишь тот смысл, что показывает (в процентах), какая часть средней величины признака захватывается колеблемостью этого признака, напр., если С = 10, то мера колеблемости признака (а) составляет 10% от средней величины признака (М).

Одной из важнейших глав биометрической методологии является изучение коррелятивной изменчивости.

При биологических исследованиях часто возникает вопрос о существовании связи между двумя явлениями (напр., между весом зерна овса и содержанием в нем жира). И на этот вопрос мы можем получить определенный ответ только при помощи биометрического анализа, пользуясь методом определения корреляции (см.) между указанными двумя явлениями. Под именем корреляции мы понимаем существование нек-рой неполной связи между двумя явлениями. Если один признак (F) зависит от другого (X) вполне, то значения, к-рые принимает признак X, предопределяют в точности величину признака Y; в этом случае мы говорим о полной или функциональной зависимости между признаками. Если признак Y принимает любое из возможных для него значений независимо от изменений признака X, то между ними нет никакой взаимной зависимости. При биологических исследованиях, однако, часто приходится сталкиваться с третьей возможностью, когда признак F, хотя и не определяется вполне признаком X, но чаще принимает те или иные свои значения в зависимости от различий в величине признака X. Такого рода неполная связь называется корреляционной. Явление корреляционной связи можно изучать с двух точек зрения: можно интересоваться формой связи или же можно определять силу связи.

И то и другое чаще всего исследуется при помощи так называемого корреляционного поля (см. табл, на ст. 343).

Строится оно следующим образом: графят бумагу вертикальными и горизонтальными линиями на ряды прямоугольников. Таких горизонтальных рядов (строк) должно быть столько, сколько классов в одном из исследуемых признаков (признак X), а вертикальных рядов (столбцов) столько, сколько классов в другом признаке (У). Слева и сверху отмечают соответственные классы так, чтобы увеличение признака X шло сверху вниз, а увеличение признака Y слева направо. Затем последовательно, для каждого класса X, т. е. в каждую строку, вписывают все относящиеся к нему варианты, но сгруппированные уже по признаку У, так, чтобы они приходились под соответственными классами последнего. Таким образом получается корреляционное поле. Если между признаками X и У нет никакой корреляционной связи, то распределение численностей по полю будез б. или м. крестообразно, т. е. наибольшие числа сосредоточатся, приблизительно, в средней строке (против моды признака X) и в среднем столбце (против моды У). Если же связь между X и У существует, то численности расположатся более или менее по диагонали, и чем эта связь будет больше, тем теснее они будут сжиматься около нее. При этом направление определяющейся диагонали характеризует знак связи: при положительной