{
    "version": "https:\/\/jsonfeed.org\/version\/1",
    "title": "Математик среди биологов: заметки с тегом вопрос",
    "_rss_description": "Я немного умею складывать, но от вычитания у меня всегда кружится голова",
    "_rss_language": "ru",
    "_itunes_email": "",
    "_itunes_categories_xml": "",
    "_itunes_image": "",
    "_itunes_explicit": "",
    "home_page_url": "https:\/\/antonlyakh.ru\/blog\/tags\/vopros\/",
    "feed_url": "https:\/\/antonlyakh.ru\/blog\/tags\/vopros\/json\/",
    "icon": false,
    "author": {
        "name": "Антон Лях",
        "url": "https:\/\/antonlyakh.ru\/blog\/",
        "avatar": false
    },
    "items": [
        {
            "id": "423",
            "url": "https:\/\/antonlyakh.ru\/blog\/all\/dispersionny-analiz-srednih-dlin-rakovin-mollyuskov\/",
            "title": "Дисперсионный анализ средних длин раковин моллюсков",
            "content_html": "<p>Коллега попросил помочь с выполнение дисперсионного анализа. Рассказываю, что получилось.<\/p>\n<p>У нас есть три ряда длин раковин моллюсков, полученные в три разных года: 1981, 1998 и 2012. Мы хотим узнать, есть ли статистически достоверное различие между средними длинами в каждый период или нет? Расскажу, как это сделать.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/antonlyakh.ru\/blog\/pictures\/Ishodnye-dannye.png\" width=\"304\" height=\"336\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Фрагмент исходных данных<\/div>\n<\/div>\n<p>Сначала посмотрим на <i>статистическое описание данных.<\/i><\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/antonlyakh.ru\/blog\/pictures\/Opisatelnaya-statistika.png\" width=\"469\" height=\"175\" alt=\"\" \/>\n<\/div>\n<p>Средние и медианы неплохо отличаются, наверное различия все-таки есть.<\/p>\n<p>Потом построим <i>диаграммы размахов,<\/i> в простонародье — <i>ящики с усами.<\/i><\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/antonlyakh.ru\/blog\/pictures\/Diagrammy-rasseyaniya.png\" width=\"514\" height=\"383\" alt=\"\" \/>\n<\/div>\n<p>Второй и третий ящики практически полностью пересекаются с первым. Значит различия недостоверны?<\/p>\n<p>Теперь попробуем попарно сравнить средние при помощи <i>t-теста стьюдента:<\/i> первое со вторым, второе с третьим и третье с первым. Наши данные независимы, потому что мы каждый раз измеряли разных моллюсков. Значит применим t-тест для независимых выборок. Но предварительно проверим данные на нормальность. Если выборки имеют нормальное распределение, используем t-тест. Если ненормальное, <a href=\"https:\/\/antonlyakh.ru\/blog\/all\/knigi-o-dispersionnom-analize\/#mastickiy-statistica\">прочитаем Сергея Мастицкого<\/a> (стр. 36):<\/p>\n<blockquote>\n<p>Если значение распределены ненормально, применение параметрического t-теста будет часто приводить к искаженным результатам. В таких случаях следует воспользоваться непараметрическим аналогом теста стьюдента. Например можно использовать u-тест манна-уитни.<\/p>\n<\/blockquote>\n<p>Вперед.<\/p>\n<div class=\"e2-text-picture\">\n<div class=\"fotorama\" data-width=\"579\" data-ratio=\"2.8522167487685\">\n<img src=\"https:\/\/antonlyakh.ru\/blog\/pictures\/t-test-1981-1998.png\" width=\"579\" height=\"203\" alt=\"\" \/>\n<img src=\"https:\/\/antonlyakh.ru\/blog\/pictures\/t-test-2012-1998.png\" width=\"579\" height=\"203\" alt=\"\" \/>\n<img src=\"https:\/\/antonlyakh.ru\/blog\/pictures\/t-test-2012-1981.png\" width=\"579\" height=\"203\" alt=\"\" \/>\n<\/div>\n<div class=\"e2-text-caption\">Попарные сравнения u-тестом манна-уитни<\/div>\n<\/div>\n<p>Попарные сравнения показали отличия средних.<\/p>\n<p>А теперь читаем книгу Мастицкого уже на стр. 43:<\/p>\n<blockquote>\n<p>Тесть стьюдента и его непараметрические аналоги предназначены для сравнения <i>исключительно двух выборок.<\/i> Очень часто исследователи допускают ошибку: используют t-тест для попарных сравнений более двух выборок.<\/p>\n<\/blockquote>\n<p>Надо же, оказывается мы допустили частую ошибку статистических профанов. И как нам быть?<\/p>\n<blockquote>\n<p>Для избежания данной ошибки необходимо использовать дисперсионный анализ.<\/p>\n<\/blockquote>\n<p>Алилуя! Но теперь надо прочитать <a href=\"https:\/\/antonlyakh.ru\/blog\/all\/knigi-o-dispersionnom-analize\/\">хорошие книги о дисперсионном анализе<\/a>?<\/p>\n<p>Нет, совсем не обязательно. Автоматизация статистических вычислений, в настоящее время, достигла таких высот, что вам всего лишь нужно нажать правильные кнопки. Все остальное сделает машина. Например так работает Сигмаплот. Он сам проверит данные на нормальность и выберет правильный тип дисперсионного анализа.<\/p>\n<p>Наши данные оказались ненормальными, поэтому Сигмаплот предложил <i>непараметрический дисперсионный анализ крускала-уолиса (H-тест)<\/i> и объяснил полученные результаты.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/antonlyakh.ru\/blog\/pictures\/kruskal-wallis-anova.png\" width=\"579\" height=\"376\" alt=\"\" \/>\n<\/div>\n<p>Если бы мы воспользовались Статистикой или Эр, нам пришлось бы интерпретировать полученные цифры. Для этого следует хорошо разобраться в дисперсионном анализе и сопутствующих методах. То есть пройти хороший курс биометрии.<\/p>\n<p>Но тот-кто-знает, что «<a href=\"https:\/\/designershandbook.ru\/term\/interface-evil\">интерфейс — зло<\/a>» и «<a href=\"https:\/\/maximilyahov.ru\/blog\/all\/must-sweat\/\">потеть должна машина<\/a>», тот выберет способ «нажал на кнопку и получил развернутый ответ». Мозги, в этом случае, пригодятся для интерпретации ответа.<\/p>\n<p><img src=\"https:\/\/img.artlebedev.ru\/kovodstvo\/sections\/153\/lebedev-pyramid.gif\" title=\"Пирамида Лебедева\"\/><br\/><small><a href=\"https:\/\/www.artlebedev.ru\/kovodstvo\/sections\/153\/\">Пирамида Лебедева<\/a><\/small><\/p>\n<p>Выбирайте сами. И, да — это не реклама Сигмаплота. Просто мне понравилось, как он интерпретировал результат.<\/p>\n<p>Книги, в любом случае, читать полезно.<\/p>\n",
            "date_published": "2021-03-27T00:00:31+03:00",
            "date_modified": "2022-11-06T00:00:43+03:00",
            "image": "https:\/\/antonlyakh.ru\/blog\/pictures\/Ishodnye-dannye.png",
            "_date_published_rfc2822": "Sat, 27 Mar 2021 00:00:31 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "423",
            "_e2_data": {
                "is_favourite": true,
                "links_required": [
                    "system\/library\/jquery\/jquery.js",
                    "system\/library\/fotorama\/fotorama.css",
                    "system\/library\/fotorama\/fotorama.js"
                ],
                "og_images": [
                    "https:\/\/antonlyakh.ru\/blog\/pictures\/Ishodnye-dannye.png",
                    "https:\/\/antonlyakh.ru\/blog\/pictures\/Opisatelnaya-statistika.png",
                    "https:\/\/antonlyakh.ru\/blog\/pictures\/Diagrammy-rasseyaniya.png",
                    "https:\/\/antonlyakh.ru\/blog\/pictures\/t-test-1981-1998.png",
                    "https:\/\/antonlyakh.ru\/blog\/pictures\/t-test-2012-1998.png",
                    "https:\/\/antonlyakh.ru\/blog\/pictures\/t-test-2012-1981.png",
                    "https:\/\/antonlyakh.ru\/blog\/pictures\/kruskal-wallis-anova.png"
                ]
            }
        },
        {
            "id": "325",
            "url": "https:\/\/antonlyakh.ru\/blog\/all\/vopros-otvet-kratko-o-doveritelnom-intervale\/",
            "title": "Вопрос-ответ. Кратко о доверительном интервале",
            "content_html": "<p>Коллега спросила:<\/p>\n<blockquote>\n<p>скажи мне простыми словами, что показывает доверительный интервал.  Что значит <nobr>13493 ± 192<\/nobr>, где 13493 — это число животных на метр квадратный, а 192 — это доверительный интервал.<\/p>\n<\/blockquote>\n<p>Отвечаю.<\/p>\n<p>Все количественные оценки в биологии — вероятностные. Это значит, что приведенное значение 13,5 тыс. животных на метр квадратный, с некоторой вероятностью описывает реальное кол-во животных на данной площади. Не факт, что на соседних площадках их будет столько же, но если исследована достаточно большая площадь, то в среднем эта величина неплоха.<\/p>\n<p>Доверительный интервал — это еще одна вероятностная величина. Он показывает границы диапазона, в который с вероятностью (обычно) 95% попадет среднее значение при выборе иных исследуемых площадок. То есть, вот ты исследовала один участок, нашла среднее значение организмов и посчитала дов. интервал. Так вот, если ты исследуешь другой соседний участок и найдешь среднее число животных на нем, то с вероятностью 95% эта средняя величина будет находиться в интервале: 13301=13493-192 и 13685=13493+192.<\/p>\n<p>Кстати, я бы не стал с такой точностью приводит среднее, а округлил бы его до 13,5 тыс. ± 200.<\/p>\n",
            "date_published": "2020-02-06T18:32:38+03:00",
            "date_modified": "2020-02-06T18:32:52+03:00",
            "_date_published_rfc2822": "Thu, 06 Feb 2020 18:32:38 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "325",
            "_e2_data": {
                "is_favourite": true,
                "links_required": [],
                "og_images": []
            }
        },
        {
            "id": "278",
            "url": "https:\/\/antonlyakh.ru\/blog\/all\/ischu-otvet-na-vopros-o-globalnoy-sisteme-identifkacii-dannyh\/",
            "title": "Ищу ответ. Для чего нужна глобальная система идентифкации биологических данных?",
            "content_html": "<p>Не могу ответить на простой вопрос:<\/p>\n<blockquote>\n<p>Зачем нужна глобальная система однозначной идентификации биологических данных?<\/p>\n<\/blockquote>\n<p>То есть чтобы ввел номер, а тебе в ответ, бац, связанные с ним биологические данные.<\/p>\n<p>Для чего нам это нужно? Что нам это дает? Какие преимущества мы получаем? Или наоборот — только беды?<\/p>\n<p>Приветствую вразумительные ответы или ссылки на ресурсы, где ответы даны.<\/p>\n<blockquote>\n<p>«Потому что во многой мудрости много печали; и кто умножает познания, умножает скорбь». <i>Экклезиаст.<\/i><\/p>\n<\/blockquote>\n",
            "date_published": "2019-03-16T23:27:15+03:00",
            "date_modified": "2019-06-22T00:54:07+03:00",
            "_date_published_rfc2822": "Sat, 16 Mar 2019 23:27:15 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "278",
            "_e2_data": {
                "is_favourite": false,
                "links_required": [],
                "og_images": []
            }
        },
        {
            "id": "269",
            "url": "https:\/\/antonlyakh.ru\/blog\/all\/vopros-otvet-kak-napisat-o-metodah-i-rezultatah-v-otchete-rffi\/",
            "title": "Вопрос-ответ. Как написать о методах и результатах в отчете РФФИ",
            "content_html": "<p>Меня спросили, что писать в отчете по проекту РФФИ. Вспомнил Макса Ильяхова и решил ответить в блоге.<\/p>\n<p><b>Вопрос<\/b><\/p>\n<blockquote>\n<p>Подскажите, в какой форме и в каком объеме вы заполняете пункт отчета <i>«Полученные за период, на который предоставлен грант, результаты с описанием методов и подходов, использованных при реализации Проекта (описать, уделив особое внимание степени оригинальности и новизны)»?<\/i><\/p>\n<\/blockquote>\n<blockquote>\n<p>По сути это основная часть отчета — и здесь должно быть представлено все, что сделано за текущий период. Однако из того, что я узнала у людей — одни сюда вставляют целые статьи, другие кратко пишут в один абзац основные результаты и их новизну.<\/p>\n<\/blockquote>\n<blockquote>\n<p>Есть еще пункт 11 в инструкции по заполнению отчета, в нем говориться что необходимо прикрепить еще файл содержащий информацию о полученных результатах в доступной широкому кругу читателей форме на 1-2 страницы.<\/p>\n<\/blockquote>\n<p><b>Ответ<\/b><\/p>\n<blockquote>\n<p>По моему опыту здесь важен не объем, а содержание. В целом надо следовать поговорке: «краткость — сестра таланта».<\/p>\n<\/blockquote>\n<blockquote>\n<p>Рецензент — это тоже человек. Читать огромный многостраничный чужой текст ему, как и многим, не хочется. Поэтому лучше дать небольшой текст.<\/p>\n<\/blockquote>\n<blockquote>\n<p>Небольшое описание результатов разбитое на абзацы, в каждом абзаце по результату на два-три предложения. Обязательно упомянуть степень новизны, т. е. написать: новое для науки, новое для региона или тривиальный результат подтверждающий известные факты (даже об этом можно написать).<\/p>\n<\/blockquote>\n<blockquote>\n<p>То же самое для методики. Не расписывать ее всю, а дать основные вехи и сослаться на литературу для более детального ознакомления. Если использован какой-то модифицированный или новый подход, обязательно об этом упомянуть.<\/p>\n<\/blockquote>\n<blockquote>\n<p>Чтобы написать для всех, надо представить, что пишешь для школьников или своей бабушки. Представить, что им будет интересно услышать и как им это лучше подать. То есть язык должен быть понятным. Здесь можно даже прикрепить презентацию с картинками.<\/p>\n<\/blockquote>\n<p>Предлагаю всем, кто пишет отчеты по проектам, поделиться своим опытом в комментариях.<\/p>\n",
            "date_published": "2019-03-01T12:29:08+03:00",
            "date_modified": "2020-02-06T18:32:30+03:00",
            "_date_published_rfc2822": "Fri, 01 Mar 2019 12:29:08 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "269",
            "_e2_data": {
                "is_favourite": true,
                "links_required": [],
                "og_images": []
            }
        }
    ],
    "_e2_version": 3559,
    "_e2_ua_string": "E2 (v3559; Aegea)"
}