<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Математик среди биологов: заметки с тегом дисперсионный анализ</title>
<link>https://antonlyakh.ru/blog/tags/dispersionny-analiz/</link>
<description>Я немного умею складывать, но от вычитания у меня всегда кружится голова</description>
<author>Антон Лях</author>
<language>ru</language>
<generator>E2 (v3559; Aegea)</generator>

<itunes:owner>
<itunes:name>Антон Лях</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>Я немного умею складывать, но от вычитания у меня всегда кружится голова</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>Дисперсионный анализ средних длин раковин моллюсков</title>
<guid isPermaLink="false">423</guid>
<link>https://antonlyakh.ru/blog/all/dispersionny-analiz-srednih-dlin-rakovin-mollyuskov/</link>
<pubDate>Sat, 27 Mar 2021 00:00:31 +0300</pubDate>
<author>Антон Лях</author>
<comments>https://antonlyakh.ru/blog/all/dispersionny-analiz-srednih-dlin-rakovin-mollyuskov/</comments>
<description>
&lt;p&gt;Коллега попросил помочь с выполнение дисперсионного анализа. Рассказываю, что получилось.&lt;/p&gt;
&lt;p&gt;У нас есть три ряда длин раковин моллюсков, полученные в три разных года: 1981, 1998 и 2012. Мы хотим узнать, есть ли статистически достоверное различие между средними длинами в каждый период или нет? Расскажу, как это сделать.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Ishodnye-dannye.png" width="304" height="336" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Фрагмент исходных данных&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Сначала посмотрим на &lt;i&gt;статистическое описание данных.&lt;/i&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Opisatelnaya-statistika.png" width="469" height="175" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Средние и медианы неплохо отличаются, наверное различия все-таки есть.&lt;/p&gt;
&lt;p&gt;Потом построим &lt;i&gt;диаграммы размахов,&lt;/i&gt; в простонародье — &lt;i&gt;ящики с усами.&lt;/i&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Diagrammy-rasseyaniya.png" width="514" height="383" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Второй и третий ящики практически полностью пересекаются с первым. Значит различия недостоверны?&lt;/p&gt;
&lt;p&gt;Теперь попробуем попарно сравнить средние при помощи &lt;i&gt;t-теста стьюдента:&lt;/i&gt; первое со вторым, второе с третьим и третье с первым. Наши данные независимы, потому что мы каждый раз измеряли разных моллюсков. Значит применим t-тест для независимых выборок. Но предварительно проверим данные на нормальность. Если выборки имеют нормальное распределение, используем t-тест. Если ненормальное, &lt;a href="https://antonlyakh.ru/blog/all/knigi-o-dispersionnom-analize/#mastickiy-statistica"&gt;прочитаем Сергея Мастицкого&lt;/a&gt; (стр. 36):&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Если значение распределены ненормально, применение параметрического t-теста будет часто приводить к искаженным результатам. В таких случаях следует воспользоваться непараметрическим аналогом теста стьюдента. Например можно использовать u-тест манна-уитни.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Вперед.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="579" data-ratio="2.8522167487685"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/t-test-1981-1998.png" width="579" height="203" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/t-test-2012-1998.png" width="579" height="203" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/t-test-2012-1981.png" width="579" height="203" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-caption"&gt;Попарные сравнения u-тестом манна-уитни&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Попарные сравнения показали отличия средних.&lt;/p&gt;
&lt;p&gt;А теперь читаем книгу Мастицкого уже на стр. 43:&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Тесть стьюдента и его непараметрические аналоги предназначены для сравнения &lt;i&gt;исключительно двух выборок.&lt;/i&gt; Очень часто исследователи допускают ошибку: используют t-тест для попарных сравнений более двух выборок.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Надо же, оказывается мы допустили частую ошибку статистических профанов. И как нам быть?&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Для избежания данной ошибки необходимо использовать дисперсионный анализ.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Алилуя! Но теперь надо прочитать &lt;a href="https://antonlyakh.ru/blog/all/knigi-o-dispersionnom-analize/"&gt;хорошие книги о дисперсионном анализе&lt;/a&gt;?&lt;/p&gt;
&lt;p&gt;Нет, совсем не обязательно. Автоматизация статистических вычислений, в настоящее время, достигла таких высот, что вам всего лишь нужно нажать правильные кнопки. Все остальное сделает машина. Например так работает Сигмаплот. Он сам проверит данные на нормальность и выберет правильный тип дисперсионного анализа.&lt;/p&gt;
&lt;p&gt;Наши данные оказались ненормальными, поэтому Сигмаплот предложил &lt;i&gt;непараметрический дисперсионный анализ крускала-уолиса (H-тест)&lt;/i&gt; и объяснил полученные результаты.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/kruskal-wallis-anova.png" width="579" height="376" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Если бы мы воспользовались Статистикой или Эр, нам пришлось бы интерпретировать полученные цифры. Для этого следует хорошо разобраться в дисперсионном анализе и сопутствующих методах. То есть пройти хороший курс биометрии.&lt;/p&gt;
&lt;p&gt;Но тот-кто-знает, что «&lt;a href="https://designershandbook.ru/term/interface-evil"&gt;интерфейс — зло&lt;/a&gt;» и «&lt;a href="https://maximilyahov.ru/blog/all/must-sweat/"&gt;потеть должна машина&lt;/a&gt;», тот выберет способ «нажал на кнопку и получил развернутый ответ». Мозги, в этом случае, пригодятся для интерпретации ответа.&lt;/p&gt;
&lt;p&gt;&lt;img src="https://img.artlebedev.ru/kovodstvo/sections/153/lebedev-pyramid.gif" title="Пирамида Лебедева"/&gt;&lt;br/&gt;&lt;small&gt;&lt;a href="https://www.artlebedev.ru/kovodstvo/sections/153/"&gt;Пирамида Лебедева&lt;/a&gt;&lt;/small&gt;&lt;/p&gt;
&lt;p&gt;Выбирайте сами. И, да — это не реклама Сигмаплота. Просто мне понравилось, как он интерпретировал результат.&lt;/p&gt;
&lt;p&gt;Книги, в любом случае, читать полезно.&lt;/p&gt;
</description>
</item>

<item>
<title>Книги о дисперсионном анализе</title>
<guid isPermaLink="false">421</guid>
<link>https://antonlyakh.ru/blog/all/knigi-o-dispersionnom-analize/</link>
<pubDate>Fri, 12 Mar 2021 21:58:49 +0300</pubDate>
<author>Антон Лях</author>
<comments>https://antonlyakh.ru/blog/all/knigi-o-dispersionnom-analize/</comments>
<description>
&lt;p&gt;М. попросила проверить, достоверно ли различие между длинами раковин моллюсков? Причем с помощью дисперсионного анализа. А я, как это бывает, позабыл как его выполнить. Чтобы вспомнить, принялся читать книги. И родился у меня рейтинг прочитанного.&lt;/p&gt;
&lt;p&gt;Не мудрствуя лукаво, разделил книги на две категории: многоразовые — к которым буду обращаться и перечитывать, и одноразовые — пролистал и выбросил в корзину.&lt;/p&gt;
&lt;h2&gt;Многоразовые книги&lt;/h2&gt;
&lt;div id="mastickiy-statistica"&gt;&lt;/div&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/macnbwrbq.png" width="300" height="425" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;&lt;b&gt;Мастицкий С. Э. (2009)&lt;/b&gt; Методическое пособие по использовании программы Statistica при обработке данных биологических исследований.&lt;/i&gt; Минск: Ин-т рыбного хозяйства.&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;b&gt;Прекрасное руководство для прикладных статистов.&lt;/b&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Автор кратко описывает для каких рядов данных подходит тот или иной прием и рассказывает, как их выполнить в «Статистике». Книга полезна, даже если вы не используете «Статистику».&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;&lt;hr/&gt;&lt;br /&gt;
&lt;br/&gt;&lt;br/&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Lyubischev---Dispersionny-analiz.png" width="300" height="454" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;&lt;b&gt;Любищев А. А. (1986)&lt;/b&gt; Дисперсионный анализ в биологии.&lt;/i&gt; М.: Изд-во Моск. ун-та.&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;b&gt;О том как планировать эксперименты и интерпретировать результаты без помощи компьютера.&lt;/b&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Книга написана в середине 20-го века. Написано легко, с разбором многочисленных примеров и методикой ручных вычислений. Буду не раз к ней возвращаться.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="800" data-ratio="1.25"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Lyubischev---primer-0.png" width="800" height="640" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Lyubischev---primer.png" width="800" height="600" alt="" /&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;hr/&gt;&lt;br /&gt;
&lt;br/&gt;&lt;br/&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Plohinskiy---oblozhka.png" width="400" height="588" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;&lt;b&gt;Плохинский Н. А. (1960)&lt;/b&gt; Дисперсионный анализ.&lt;/i&gt; Новосибирск: Изд-во СО АН СССР.&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;b&gt;Дисперсионный анализ на бумаге.&lt;/b&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Ясно и прекрасно.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="400" data-ratio="0.64935064935065"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Plohinskiy---primer-1.png" width="400" height="616" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Plohinskiy---primer-2.png" width="400" height="614" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Plohinskiy---primer-3.png" width="400" height="614" alt="" /&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;hr/&gt;&lt;br /&gt;
&lt;br/&gt;&lt;br/&gt;&lt;/p&gt;
&lt;h2&gt;Одноразовые книги&lt;/h2&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Arens-Leyter-(1985)-Mnogomerny-dispersionny-analiz.png" width="300" height="459" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;&lt;b&gt;Аренс Х., Лёйтер Ю. (1985)&lt;/b&gt; Многомерный дисперсионный анализ&lt;/i&gt; / Пер. с немецкого. М.: Финансы и статистика.&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;b&gt;Полезно, кратко, по делу.&lt;/b&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Книга попала в одноразовые, потому что ее основная аудитория — программисты, которые собираются писать софт для стат. анализа с нуля.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="400" data-ratio="0.63191153238547"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Arens-Leyter-(1985)-Blok-shema-mnogomernogo-disp-i-diskr-analizov.png" width="400" height="633" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Arens-Leyter-(1985)-Primer-formul---2.png" width="400" height="329" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Arens-Leyter-(1985)-Primer-formul.png" width="400" height="323" alt="" /&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;hr/&gt;&lt;br /&gt;
&lt;br/&gt;&lt;br/&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Markova-i-dr-(1982)---Dispers-analiza-na-EVM.png" width="300" height="457" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;&lt;b&gt;Маркова Е. В., Денисов В. И., Полетаева И. А., Пономарев В. В. (1982)&lt;/b&gt; Дисперсионный анализ и синте планов на ЭВМ.&lt;/i&gt; М.: Наука.&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;b&gt;За деревьями леса не видно.&lt;/b&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Много деталей, но не всегда ясна суть. Ориентирована на программистов, на что и указывает название.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="400" data-ratio="0.60422960725076"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Markova-i-dr-(1982)---primer-2.png" width="400" height="662" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Markova-i-dr-(1982)---primer.png" width="400" height="655" alt="" /&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;hr/&gt;&lt;br /&gt;
&lt;br/&gt;&lt;br/&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Sheffe-(1980)-Disp-analiz.gif" width="300" height="468" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;&lt;b&gt;Шеффе Г. (1980)&lt;/b&gt; Дисперсионный анализ&lt;/i&gt; / Пер. с английского. Изд. второе. М.: Наука. Гл. ред. физ.-мат. лит-ры.&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;b&gt;Сложно, для истинных математиков.&lt;/b&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Книга переполнена формулами, определениями и доказательствами. Написана для математиков, которые хотят досконально во всем разобраться и, возможно, сделать лучше. Остальные не увидят здесь сути анализа.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="400" data-ratio="0.63694267515924"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Sheffe-(1980)---primer.png" width="400" height="628" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Sheffe-(1980)---primer-2.png" width="400" height="628" alt="" /&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;hr/&gt;&lt;br /&gt;
&lt;br/&gt;&lt;br/&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Yakovlev-Yakovleva-(2015)---Oblozhka.png" width="300" height="446" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;i&gt;&lt;b&gt;Яковлев В., Яковлева О. (2015) &lt;/b&gt;Дисперсионный анализ в Excel&lt;/i&gt;. Lap Lambert Acad. Publ.&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;b&gt;Хрень полная.&lt;/b&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Не тратьте время — выбрасывайте в корзину, не читая.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="400" data-ratio="1.0810810810811"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Yakovlev-(2015)---Uboy-bychkov.png" width="400" height="370" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Yakovlev-(2015)---Schelknite-OK.png" width="400" height="345" alt="" /&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;hr/&gt;&lt;br /&gt;
&lt;br/&gt;&lt;br/&gt;&lt;/p&gt;
&lt;p&gt;Рейтинг отражает мое лично впечатление от указанных книг. Ваше мнение может быть другим.&lt;/p&gt;
&lt;p&gt;&lt;br/&gt;&lt;br/&gt;&lt;/p&gt;
&lt;p&gt;Читайте книги.&lt;/p&gt;
</description>
</item>


</channel>
</rss>