<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Математик среди биологов: заметки с тегом вопрос</title>
<link>https://antonlyakh.ru/blog/tags/vopros/</link>
<description>Я немного умею складывать, но от вычитания у меня всегда кружится голова</description>
<author>Антон Лях</author>
<language>ru</language>
<generator>E2 (v3559; Aegea)</generator>

<itunes:owner>
<itunes:name>Антон Лях</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>Я немного умею складывать, но от вычитания у меня всегда кружится голова</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>Дисперсионный анализ средних длин раковин моллюсков</title>
<guid isPermaLink="false">423</guid>
<link>https://antonlyakh.ru/blog/all/dispersionny-analiz-srednih-dlin-rakovin-mollyuskov/</link>
<pubDate>Sat, 27 Mar 2021 00:00:31 +0300</pubDate>
<author>Антон Лях</author>
<comments>https://antonlyakh.ru/blog/all/dispersionny-analiz-srednih-dlin-rakovin-mollyuskov/</comments>
<description>
&lt;p&gt;Коллега попросил помочь с выполнение дисперсионного анализа. Рассказываю, что получилось.&lt;/p&gt;
&lt;p&gt;У нас есть три ряда длин раковин моллюсков, полученные в три разных года: 1981, 1998 и 2012. Мы хотим узнать, есть ли статистически достоверное различие между средними длинами в каждый период или нет? Расскажу, как это сделать.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Ishodnye-dannye.png" width="304" height="336" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Фрагмент исходных данных&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Сначала посмотрим на &lt;i&gt;статистическое описание данных.&lt;/i&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Opisatelnaya-statistika.png" width="469" height="175" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Средние и медианы неплохо отличаются, наверное различия все-таки есть.&lt;/p&gt;
&lt;p&gt;Потом построим &lt;i&gt;диаграммы размахов,&lt;/i&gt; в простонародье — &lt;i&gt;ящики с усами.&lt;/i&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Diagrammy-rasseyaniya.png" width="514" height="383" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Второй и третий ящики практически полностью пересекаются с первым. Значит различия недостоверны?&lt;/p&gt;
&lt;p&gt;Теперь попробуем попарно сравнить средние при помощи &lt;i&gt;t-теста стьюдента:&lt;/i&gt; первое со вторым, второе с третьим и третье с первым. Наши данные независимы, потому что мы каждый раз измеряли разных моллюсков. Значит применим t-тест для независимых выборок. Но предварительно проверим данные на нормальность. Если выборки имеют нормальное распределение, используем t-тест. Если ненормальное, &lt;a href="https://antonlyakh.ru/blog/all/knigi-o-dispersionnom-analize/#mastickiy-statistica"&gt;прочитаем Сергея Мастицкого&lt;/a&gt; (стр. 36):&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Если значение распределены ненормально, применение параметрического t-теста будет часто приводить к искаженным результатам. В таких случаях следует воспользоваться непараметрическим аналогом теста стьюдента. Например можно использовать u-тест манна-уитни.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Вперед.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="579" data-ratio="2.8522167487685"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/t-test-1981-1998.png" width="579" height="203" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/t-test-2012-1998.png" width="579" height="203" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/t-test-2012-1981.png" width="579" height="203" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-caption"&gt;Попарные сравнения u-тестом манна-уитни&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Попарные сравнения показали отличия средних.&lt;/p&gt;
&lt;p&gt;А теперь читаем книгу Мастицкого уже на стр. 43:&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Тесть стьюдента и его непараметрические аналоги предназначены для сравнения &lt;i&gt;исключительно двух выборок.&lt;/i&gt; Очень часто исследователи допускают ошибку: используют t-тест для попарных сравнений более двух выборок.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Надо же, оказывается мы допустили частую ошибку статистических профанов. И как нам быть?&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Для избежания данной ошибки необходимо использовать дисперсионный анализ.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Алилуя! Но теперь надо прочитать &lt;a href="https://antonlyakh.ru/blog/all/knigi-o-dispersionnom-analize/"&gt;хорошие книги о дисперсионном анализе&lt;/a&gt;?&lt;/p&gt;
&lt;p&gt;Нет, совсем не обязательно. Автоматизация статистических вычислений, в настоящее время, достигла таких высот, что вам всего лишь нужно нажать правильные кнопки. Все остальное сделает машина. Например так работает Сигмаплот. Он сам проверит данные на нормальность и выберет правильный тип дисперсионного анализа.&lt;/p&gt;
&lt;p&gt;Наши данные оказались ненормальными, поэтому Сигмаплот предложил &lt;i&gt;непараметрический дисперсионный анализ крускала-уолиса (H-тест)&lt;/i&gt; и объяснил полученные результаты.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/kruskal-wallis-anova.png" width="579" height="376" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Если бы мы воспользовались Статистикой или Эр, нам пришлось бы интерпретировать полученные цифры. Для этого следует хорошо разобраться в дисперсионном анализе и сопутствующих методах. То есть пройти хороший курс биометрии.&lt;/p&gt;
&lt;p&gt;Но тот-кто-знает, что «&lt;a href="https://designershandbook.ru/term/interface-evil"&gt;интерфейс — зло&lt;/a&gt;» и «&lt;a href="https://maximilyahov.ru/blog/all/must-sweat/"&gt;потеть должна машина&lt;/a&gt;», тот выберет способ «нажал на кнопку и получил развернутый ответ». Мозги, в этом случае, пригодятся для интерпретации ответа.&lt;/p&gt;
&lt;p&gt;&lt;img src="https://img.artlebedev.ru/kovodstvo/sections/153/lebedev-pyramid.gif" title="Пирамида Лебедева"/&gt;&lt;br/&gt;&lt;small&gt;&lt;a href="https://www.artlebedev.ru/kovodstvo/sections/153/"&gt;Пирамида Лебедева&lt;/a&gt;&lt;/small&gt;&lt;/p&gt;
&lt;p&gt;Выбирайте сами. И, да — это не реклама Сигмаплота. Просто мне понравилось, как он интерпретировал результат.&lt;/p&gt;
&lt;p&gt;Книги, в любом случае, читать полезно.&lt;/p&gt;
</description>
</item>

<item>
<title>Вопрос-ответ. Кратко о доверительном интервале</title>
<guid isPermaLink="false">325</guid>
<link>https://antonlyakh.ru/blog/all/vopros-otvet-kratko-o-doveritelnom-intervale/</link>
<pubDate>Thu, 06 Feb 2020 18:32:38 +0300</pubDate>
<author>Антон Лях</author>
<comments>https://antonlyakh.ru/blog/all/vopros-otvet-kratko-o-doveritelnom-intervale/</comments>
<description>
&lt;p&gt;Коллега спросила:&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;скажи мне простыми словами, что показывает доверительный интервал.  Что значит &lt;nobr&gt;13493 ± 192&lt;/nobr&gt;, где 13493 — это число животных на метр квадратный, а 192 — это доверительный интервал.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Отвечаю.&lt;/p&gt;
&lt;p&gt;Все количественные оценки в биологии — вероятностные. Это значит, что приведенное значение 13,5 тыс. животных на метр квадратный, с некоторой вероятностью описывает реальное кол-во животных на данной площади. Не факт, что на соседних площадках их будет столько же, но если исследована достаточно большая площадь, то в среднем эта величина неплоха.&lt;/p&gt;
&lt;p&gt;Доверительный интервал — это еще одна вероятностная величина. Он показывает границы диапазона, в который с вероятностью (обычно) 95% попадет среднее значение при выборе иных исследуемых площадок. То есть, вот ты исследовала один участок, нашла среднее значение организмов и посчитала дов. интервал. Так вот, если ты исследуешь другой соседний участок и найдешь среднее число животных на нем, то с вероятностью 95% эта средняя величина будет находиться в интервале: 13301=13493-192 и 13685=13493+192.&lt;/p&gt;
&lt;p&gt;Кстати, я бы не стал с такой точностью приводит среднее, а округлил бы его до 13,5 тыс. ± 200.&lt;/p&gt;
</description>
</item>

<item>
<title>Ищу ответ. Для чего нужна глобальная система идентифкации биологических данных?</title>
<guid isPermaLink="false">278</guid>
<link>https://antonlyakh.ru/blog/all/ischu-otvet-na-vopros-o-globalnoy-sisteme-identifkacii-dannyh/</link>
<pubDate>Sat, 16 Mar 2019 23:27:15 +0300</pubDate>
<author>Антон Лях</author>
<comments>https://antonlyakh.ru/blog/all/ischu-otvet-na-vopros-o-globalnoy-sisteme-identifkacii-dannyh/</comments>
<description>
&lt;p&gt;Не могу ответить на простой вопрос:&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Зачем нужна глобальная система однозначной идентификации биологических данных?&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;То есть чтобы ввел номер, а тебе в ответ, бац, связанные с ним биологические данные.&lt;/p&gt;
&lt;p&gt;Для чего нам это нужно? Что нам это дает? Какие преимущества мы получаем? Или наоборот — только беды?&lt;/p&gt;
&lt;p&gt;Приветствую вразумительные ответы или ссылки на ресурсы, где ответы даны.&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;«Потому что во многой мудрости много печали; и кто умножает познания, умножает скорбь». &lt;i&gt;Экклезиаст.&lt;/i&gt;&lt;/p&gt;
&lt;/blockquote&gt;
</description>
</item>

<item>
<title>Вопрос-ответ. Как написать о методах и результатах в отчете РФФИ</title>
<guid isPermaLink="false">269</guid>
<link>https://antonlyakh.ru/blog/all/vopros-otvet-kak-napisat-o-metodah-i-rezultatah-v-otchete-rffi/</link>
<pubDate>Fri, 01 Mar 2019 12:29:08 +0300</pubDate>
<author>Антон Лях</author>
<comments>https://antonlyakh.ru/blog/all/vopros-otvet-kak-napisat-o-metodah-i-rezultatah-v-otchete-rffi/</comments>
<description>
&lt;p&gt;Меня спросили, что писать в отчете по проекту РФФИ. Вспомнил Макса Ильяхова и решил ответить в блоге.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Вопрос&lt;/b&gt;&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Подскажите, в какой форме и в каком объеме вы заполняете пункт отчета &lt;i&gt;«Полученные за период, на который предоставлен грант, результаты с описанием методов и подходов, использованных при реализации Проекта (описать, уделив особое внимание степени оригинальности и новизны)»?&lt;/i&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;По сути это основная часть отчета — и здесь должно быть представлено все, что сделано за текущий период. Однако из того, что я узнала у людей — одни сюда вставляют целые статьи, другие кратко пишут в один абзац основные результаты и их новизну.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Есть еще пункт 11 в инструкции по заполнению отчета, в нем говориться что необходимо прикрепить еще файл содержащий информацию о полученных результатах в доступной широкому кругу читателей форме на 1-2 страницы.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;&lt;b&gt;Ответ&lt;/b&gt;&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;По моему опыту здесь важен не объем, а содержание. В целом надо следовать поговорке: «краткость — сестра таланта».&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Рецензент — это тоже человек. Читать огромный многостраничный чужой текст ему, как и многим, не хочется. Поэтому лучше дать небольшой текст.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Небольшое описание результатов разбитое на абзацы, в каждом абзаце по результату на два-три предложения. Обязательно упомянуть степень новизны, т. е. написать: новое для науки, новое для региона или тривиальный результат подтверждающий известные факты (даже об этом можно написать).&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;То же самое для методики. Не расписывать ее всю, а дать основные вехи и сослаться на литературу для более детального ознакомления. Если использован какой-то модифицированный или новый подход, обязательно об этом упомянуть.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Чтобы написать для всех, надо представить, что пишешь для школьников или своей бабушки. Представить, что им будет интересно услышать и как им это лучше подать. То есть язык должен быть понятным. Здесь можно даже прикрепить презентацию с картинками.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Предлагаю всем, кто пишет отчеты по проектам, поделиться своим опытом в комментариях.&lt;/p&gt;
</description>
</item>


</channel>
</rss>