<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Математик среди биологов: заметки с тегом интерфейс</title>
<link>https://antonlyakh.ru/blog/tags/interfeys/</link>
<description>Я немного умею складывать, но от вычитания у меня всегда кружится голова</description>
<author>Антон Лях</author>
<language>ru</language>
<generator>E2 (v3559; Aegea)</generator>

<itunes:owner>
<itunes:name>Антон Лях</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>Я немного умею складывать, но от вычитания у меня всегда кружится голова</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>Дисперсионный анализ средних длин раковин моллюсков</title>
<guid isPermaLink="false">423</guid>
<link>https://antonlyakh.ru/blog/all/dispersionny-analiz-srednih-dlin-rakovin-mollyuskov/</link>
<pubDate>Sat, 27 Mar 2021 00:00:31 +0300</pubDate>
<author>Антон Лях</author>
<comments>https://antonlyakh.ru/blog/all/dispersionny-analiz-srednih-dlin-rakovin-mollyuskov/</comments>
<description>
&lt;p&gt;Коллега попросил помочь с выполнение дисперсионного анализа. Рассказываю, что получилось.&lt;/p&gt;
&lt;p&gt;У нас есть три ряда длин раковин моллюсков, полученные в три разных года: 1981, 1998 и 2012. Мы хотим узнать, есть ли статистически достоверное различие между средними длинами в каждый период или нет? Расскажу, как это сделать.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Ishodnye-dannye.png" width="304" height="336" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Фрагмент исходных данных&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Сначала посмотрим на &lt;i&gt;статистическое описание данных.&lt;/i&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Opisatelnaya-statistika.png" width="469" height="175" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Средние и медианы неплохо отличаются, наверное различия все-таки есть.&lt;/p&gt;
&lt;p&gt;Потом построим &lt;i&gt;диаграммы размахов,&lt;/i&gt; в простонародье — &lt;i&gt;ящики с усами.&lt;/i&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/Diagrammy-rasseyaniya.png" width="514" height="383" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Второй и третий ящики практически полностью пересекаются с первым. Значит различия недостоверны?&lt;/p&gt;
&lt;p&gt;Теперь попробуем попарно сравнить средние при помощи &lt;i&gt;t-теста стьюдента:&lt;/i&gt; первое со вторым, второе с третьим и третье с первым. Наши данные независимы, потому что мы каждый раз измеряли разных моллюсков. Значит применим t-тест для независимых выборок. Но предварительно проверим данные на нормальность. Если выборки имеют нормальное распределение, используем t-тест. Если ненормальное, &lt;a href="https://antonlyakh.ru/blog/all/knigi-o-dispersionnom-analize/#mastickiy-statistica"&gt;прочитаем Сергея Мастицкого&lt;/a&gt; (стр. 36):&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Если значение распределены ненормально, применение параметрического t-теста будет часто приводить к искаженным результатам. В таких случаях следует воспользоваться непараметрическим аналогом теста стьюдента. Например можно использовать u-тест манна-уитни.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Вперед.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="579" data-ratio="2.8522167487685"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/t-test-1981-1998.png" width="579" height="203" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/t-test-2012-1998.png" width="579" height="203" alt="" /&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/t-test-2012-1981.png" width="579" height="203" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-caption"&gt;Попарные сравнения u-тестом манна-уитни&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Попарные сравнения показали отличия средних.&lt;/p&gt;
&lt;p&gt;А теперь читаем книгу Мастицкого уже на стр. 43:&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Тесть стьюдента и его непараметрические аналоги предназначены для сравнения &lt;i&gt;исключительно двух выборок.&lt;/i&gt; Очень часто исследователи допускают ошибку: используют t-тест для попарных сравнений более двух выборок.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Надо же, оказывается мы допустили частую ошибку статистических профанов. И как нам быть?&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Для избежания данной ошибки необходимо использовать дисперсионный анализ.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Алилуя! Но теперь надо прочитать &lt;a href="https://antonlyakh.ru/blog/all/knigi-o-dispersionnom-analize/"&gt;хорошие книги о дисперсионном анализе&lt;/a&gt;?&lt;/p&gt;
&lt;p&gt;Нет, совсем не обязательно. Автоматизация статистических вычислений, в настоящее время, достигла таких высот, что вам всего лишь нужно нажать правильные кнопки. Все остальное сделает машина. Например так работает Сигмаплот. Он сам проверит данные на нормальность и выберет правильный тип дисперсионного анализа.&lt;/p&gt;
&lt;p&gt;Наши данные оказались ненормальными, поэтому Сигмаплот предложил &lt;i&gt;непараметрический дисперсионный анализ крускала-уолиса (H-тест)&lt;/i&gt; и объяснил полученные результаты.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/kruskal-wallis-anova.png" width="579" height="376" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Если бы мы воспользовались Статистикой или Эр, нам пришлось бы интерпретировать полученные цифры. Для этого следует хорошо разобраться в дисперсионном анализе и сопутствующих методах. То есть пройти хороший курс биометрии.&lt;/p&gt;
&lt;p&gt;Но тот-кто-знает, что «&lt;a href="https://designershandbook.ru/term/interface-evil"&gt;интерфейс — зло&lt;/a&gt;» и «&lt;a href="https://maximilyahov.ru/blog/all/must-sweat/"&gt;потеть должна машина&lt;/a&gt;», тот выберет способ «нажал на кнопку и получил развернутый ответ». Мозги, в этом случае, пригодятся для интерпретации ответа.&lt;/p&gt;
&lt;p&gt;&lt;img src="https://img.artlebedev.ru/kovodstvo/sections/153/lebedev-pyramid.gif" title="Пирамида Лебедева"/&gt;&lt;br/&gt;&lt;small&gt;&lt;a href="https://www.artlebedev.ru/kovodstvo/sections/153/"&gt;Пирамида Лебедева&lt;/a&gt;&lt;/small&gt;&lt;/p&gt;
&lt;p&gt;Выбирайте сами. И, да — это не реклама Сигмаплота. Просто мне понравилось, как он интерпретировал результат.&lt;/p&gt;
&lt;p&gt;Книги, в любом случае, читать полезно.&lt;/p&gt;
</description>
</item>

<item>
<title>Сила примеров</title>
<guid isPermaLink="true">https://antonlyakh.ru/blog/all/sila-primerov/</guid>
<link>https://antonlyakh.ru/blog/all/sila-primerov/</link>
<pubDate>Fri, 16 Mar 2018 02:13:11 +0300</pubDate>
<author>Антон Лях</author>
<comments>https://antonlyakh.ru/blog/all/sila-primerov/</comments>
<description>
&lt;p&gt;Это выжимка из &lt;a href="https://t.me/dangry/192"&gt;заметки Антона Жиянова&lt;/a&gt;. Антон &lt;a href="https://dangry.ru/sin/"&gt;снимает шелуху с интерфейсов&lt;/a&gt;, обнажая их идеальную сущность.&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;[...]&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Для меня лучшая формула обучения чему угодно — «порция теории + вагон примеров». Забавно, что при этом для большинства преподавателей (да и вообще профессионалов) выдать примеры — огромная трудность.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Любой спец с лёгкостью напишет, как «лучше быть богатым и здоровым, чем бедным и больным» — но заскрипит на примерах. Если попросить профи написать статью — он изложит десяток хороших и правильных принципов, и в лучшем случае один натужный пример (хорошо если не выдуманный).&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Я думаю, что успех рассылок и курсов Ильяхова именно в том, что он всегда и всё подаёт на примерах. То же самое в других хороших курсах — например, «Аналитике для предпринимателей» Алексея Куличевского или «Better Web Type» Матея Латина. То же самое стараюсь делать и я в «Интерфейсах для нормальных людей».&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;Кажется, от примеров выигрывает всё что угодно.&lt;/p&gt;
&lt;/blockquote&gt;
</description>
</item>

<item>
<title>Как не нужно делать поиск таксонов: пример Микобанка</title>
<guid isPermaLink="true">https://antonlyakh.ru/blog/all/kak-ne-nuzhno-delat-poisk-taksonov-v-mikobanke/</guid>
<link>https://antonlyakh.ru/blog/all/kak-ne-nuzhno-delat-poisk-taksonov-v-mikobanke/</link>
<pubDate>Sat, 07 Jan 2017 17:31:59 +0300</pubDate>
<author>Антон Лях</author>
<comments>https://antonlyakh.ru/blog/all/kak-ne-nuzhno-delat-poisk-taksonov-v-mikobanke/</comments>
<description>
&lt;p&gt;&lt;a href="http://www.mycobank.org"&gt;Микобанк&lt;/a&gt; — база данных с научными названиями грибов.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/mycobank-database.png" width="1000" height="260" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В конце 2015 года база содержала более 360 тыс. видовых, около 50 тыс. внутривидовых и свыше 3 тыс. названий высших таксонов.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/mycobank-stat.png" width="1000" height="512" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Круговые диаграммы здесь не нужны — достаточно написать число таксонов&lt;/div&gt;
&lt;/div&gt;
&lt;h2&gt;Что имеем&lt;/h2&gt;
&lt;p&gt;Простая функция перечисления всех названий видов грибов в Микобанке отсутствует. Если вы не знаете вида гриба — вы не узнаете ничего. База для гиков-микологов.&lt;/p&gt;
&lt;p&gt;Микобанк предлагает шесть вариантов поиска: простой, базовый, продвинутый, типовых экземпляров, терминов и библиографических ссылок.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/mycobank-search-variants.gif" width="274" height="178" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Простой поиск сложен. Пробую найти информацию о белом грибе с установленным флажком семейства — система ничего не находит.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/mycobank-simple-search.png" width="1001" height="250" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Базовый поиск еще сложнее. Он содержит несколько полей и дополнительно предлагает сконструировать запрос. Я умею программировать и понимаю, что от меня хотят. Гики-микологи тоже разберуться, нормальные биологи — вряд ли.&lt;/p&gt;
&lt;p&gt;После праздников промахиваюсь и пишу название вида в поле для идентификатора записи базы данных. Система ничего не находит.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/mycobank-basic-search.png" width="1000" height="804" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В продвинутом поиске число полей в 1,5 раза больше. Ухожу с сайта.&lt;/p&gt;
&lt;h2&gt;Как надо&lt;/h2&gt;
&lt;p&gt;Для поиска достаточно оставить одно поле, а разбор запроса передать системе.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://antonlyakh.ru/blog/pictures/mycobank-new-search.png" width="1000" height="451" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Воображаемый поиск в Микобанке&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Так программировать сложно, но чтобы расти, этому надо учиться.&lt;/p&gt;
&lt;h2&gt;На чем учиться&lt;/h2&gt;
&lt;p&gt;Микобанк разрешает скачать &lt;a href="http://www.mycobank.org/localfiles/MBList.zip"&gt;список научных названий грибов&lt;/a&gt; (25 Мбт). Это большой интересный набор данных. С его помощью вы разберетесь с названиями таксонов, научитесь строить &lt;a href="http://antonlyakh.ru/blog/all/sozdaem-taksonomicheskuyu-bazu-dannyh/"&gt;таксономическую базу данных&lt;/a&gt; и прокачаете навыки разработки интерфейсов.&lt;/p&gt;
&lt;p&gt;О достижениях пишите.&lt;/p&gt;
&lt;p&gt;&lt;small&gt;Спасибо Бюро Артема Горбунова за принцип «&lt;a href="http://artgorbunov.ru/bb/ui/evil/"&gt;Интерфейс — зло&lt;/a&gt;».&lt;/small&gt;&lt;/p&gt;
</description>
</item>


</channel>
</rss>