5 заметок с тегом

таксономическая база данных

Разнообразие способов цитирования омонимов таксономических названий

Омонимы и гемиомонимы

Когда разные виды или роды организмов имеют одинаковые научные названия, они являются омонимами или гемиомонимами.

Platydactylus australis Dumeril, 1856
Platydactylus australis Walker, 1869
Platydactylus australis Saussure, 1878

Если одинаково названы организмы из одного царства — это омонимы (англ. homonyms). Если из разных — гемиомонимы (англ. hemyhomonyms). Ниже, для удобства, гемиомонимы я тоже буду называть омонимами.

Термин гемиомоним ввел Старобогатов в 1991 году.

Откуда беруться омонимы

Омонимы появляются по двум причинам.

Первая — когда исследователь, назвавший организм, не знал о том, что такое название уже кто-то использовал. Больше всего таких омонимов появилось в 19 — начале 20 века.

Platydactylus australis Dumeril, 1856 — так Думерил назвал австралийского геккона;
Platydactylus australis Walker, 1869 — Валкер назвал так же найденного позже сверчка;
Platydactylus australis Saussure, 1878 — Сасю так же назвал еще одного сверчка.

Вторая — когда исследователь принял организм нового неизвестного вида за известный. Такие истуации случаются до сих пор.

Drosophila pygmaea Duda, 1926 — так Дуда назвал вид плодовых мушкек;
Drosophila pygmaea Duda, 1927 — а потом еще раз отнес к нему мушек другого вида;
Drosophila pygmaea (Bulliard) Quélet, 1886 — а вообще так изначально был назван гриб.

Как цитировать омонимы

Когда в статье приведено научное название вида, которое является омонимом, и нет дополнительных указаний, что это за организм, то получить однозначную информацию о нем, руководствуясь только названием, не удастся. Если в таксономической базе данных хранятся омонимичные названия, то найти нужную запись только по такому названию тоже не получиться — результат будет неоднозначным.

Orestias elegans — это рыба или орхидея?

Поэтому, чтобы отличить омонимы друг от друга, используют несколько приемов:

  • указывают автора или год;
  • дописывают высший таксон;
  • указывают нетаксономическую группу или аббревиатуру царства;
  • используют идентификатор записи вбазе данных.

Цитируем омонимы по автору или году

Обычно к названию таксона дописывают авторов и год, когда данный таксон был описан.

Orestias elegans Ridley, 1887 — орхидея,
Orestias elegans Garman, 1895 — рыба.

Но когда авторов много или у них длинные фамилии, перечислять их неудобно. Поэтому Дубоис предложил писать только год появления названия.

Orestias elegans 1887
Orestias elegans 1895

Это позволяет сократить запись и отличить омонимы друг от друга, потому что омонимов с одинаковым годом описания не существует.

Цитируем омонимы по высшему таксону

В другом способе записи между родовым и видовым эпитетом в скобках указывают высший таксон (обычно — семейство), к которому относится вид.

Orestias (Orchidaceae) elegans
Orestias (Cyprinodontoidei) elegans

Либо семейство дописывают после названия вида.

Orestias elegans (Orchidaceae)
Orestias elegans (Cyprinodontoidei)

Так как придумано несколько тысяч названий семейств, то определить по названию семейства царство организма могут единицы. Поэтому перед семейством дописывают название отряда или царства.

Orestias elegans (Plantae: Orchidaceae)
Orestias elegans (Animalia: Cyprinodontoidei)

Указываем группу организмов или аббревиатуру царства

В данном случае после названия указывают нетаксономическую группу организма.

Orestias elegans (fish)
Orestias elegans (plant)

Алексей Шипунов после названий омонимов, пишет односимвольную аббревиатуру царства.

Orestias elegans (z)
Orestias elegans (b)

Но если в одном царстве несколько омонимов, прием не сработает.

Platydactylus australis (z)
Platydactylus australis (z)
Platydactylus australis (z)

Drosophila pygmaea (f)
Drosophila pygmaea (z)
Drosophila pygmaea (z)

Цитируем омонимы по идентификаторы записи в базе данных

Во всех упомянутых подходах используются понятные человеку обозначения. Это человекоориентированная запись омонимов. Но, так как сеть и базы данных все больше и больше занимают умы, некоторые систематики предлагают использовать машинный подход к обозначению таксонов.

Так, Рамболд с сотоварищами вместо авторов и года публикации названий видов, предложили писать числовой идентификатор записи с названием из таксономической базе данных.

Lecanora varia (Hoffm.) Ach.
Lecanora varia [#389546]

Авторы ограничились только царством грибов. Потому что владельцы трех микологических баз данных (Fungal Names, Index Fungorium, MycoBank) договорились о единой системе идентификации записей. То есть во всех трех базах совпадают номера записей с одними и теми же названиями.

Авторы пишут, что так компьютерам будет удобнее понимать названия в тексте, да и люди смогут их различить. Но этот прием нарушает основной принцип разработки интерфейсов — человечность.

К счастью, сообщество систематиков достаточно консервативно, поэтому в ближайшее время прием не приживется.

Как правильно цитировать омонимы

Среди всех перечисленных способов цитирования омонимов, мне нравится цитирование по году. Кратко, красиво и понятно:

Platydactylus australis 1856
Platydactylus australis 1869
Platydactylus australis 1878

Drosophila pygmaea 1886
Drosophila pygmaea 1926
Drosophila pygmaea 1927

Пишите, какая из записей омонимов вам более по душе, или предлагайте свою.

Полезное

Актуальный перечень омонимичных названий семейств, родов и видов.

16 августа   автор таксона   название таксона   омоним   таксономическая база данных

Используем цвет для обозначения названий таксонов

Про оформление списка таксонов в Электронной коллекции морских паразитов и Альгабейзе

В электронной коллекции морских паразитов я использую несколько фишек для обозначения состояния таксономических названий:

  • Названия родов и видов начертаны курсивов, а имена авторов прямым шрифтом — этого требуют правила оформления таксономических имен.
  • Валидные (действующие) названия таксонов покрашены в синий цвет, а синонимы — в серый, чтобы сразу было видно статус таксона.
  • За синонимом → идет действущее название, чтобы было понятно, чей это синоним.
  • Таксоны, которые оцифрованы и помещены в электронную коллекцию, помечены фоновым цветом.
  • Слева от названия стоит цветной индикатор, который показывает, есть ли у таксона картинки (красный квадратик) и описание (желтый).

На разнообразных сайтах с таксономическими названиями такие приемы ранее никто не использовал. Наш сайт стал первым.

***

Намедни открыл страницу Альгабейз, а там — невалидные таксоны выкрашены серым валидные таксоны выкрашены в синий.

Мне аж приятно стало — идею подхватили коллеги по ремеслу. Еще в 2017 Альгабейз красила все в синий серый, и валидные названия не отличались от синонимов.

Ждем продолжения от ВОРМСа и Энциклопедии жизни.

Журналы для научных публикаций — 2

Математическая биология и биоинформатика. Публикует оригинальные научные статьи по применению теории алгоритмов, методов прикладной математики и статистики для решения биологических задач.

Тематика:

  • биоинформатика, применение алгоритмов и статистических процедур для анализа огромных объемов информации, порождаемой высокотехнологичными методами экспериментальной биологии и молекулярной генетики;
  • математическая биология, формализация и математическое моделирование биологических объектов и их сообществ;
  • вычислительная геномика, изучение структуры и функций геномов клеток и организмов;
  • молекулярное моделирование, математическое моделирование биологических процессов, включая имитационное моделирование;
  • структурная биология, моделирование и предсказание по экспериментальным данным структур биомолекул и их комплексов;
  • вычислительная биохимия и биофизика, кинетические и термодинамические модели клеточных процессов и их взаимодействий, методы молекулярной динамики.

Является рецензируемым двуязычным (рус. и англ.) научным периодическим изданием.

Входит в ВАК, РИНЦ и Скопус.

P. S. Завернул нашу статью о структуре таксономической базы данных :-).

2017   где публиковаться   журнал   таксономическая база данных

Как не нужно делать поиск таксонов: пример Микобанка

Микобанк — база данных с научными названиями грибов.

В конце 2015 года база содержала более 360 тыс. видовых, около 50 тыс. внутривидовых и свыше 3 тыс. названий высших таксонов.

Круговые диаграммы здесь не нужны — достаточно написать число таксонов

Что имеем

Простая функция перечисления всех названий видов грибов в Микобанке отсутствует. Если вы не знаете вида гриба — вы не узнаете ничего. База для гиков-микологов.

Микобанк предлагает шесть вариантов поиска: простой, базовый, продвинутый, типовых экземпляров, терминов и библиографических ссылок.

Простой поиск сложен. Пробую найти информацию о белом грибе с установленным флажком семейства — система ничего не находит.

Базовый поиск еще сложнее. Он содержит несколько полей и дополнительно предлагает сконструировать запрос. Я умею программировать и понимаю, что от меня хотят. Гики-микологи тоже разберуться, нормальные биологи — вряд ли.

После праздников промахиваюсь и пишу название вида в поле для идентификатора записи базы данных. Система ничего не находит.

В продвинутом поиске число полей в 1,5 раза больше. Ухожу с сайта.

Как надо

Для поиска достаточно оставить одно поле, а разбор запроса передать системе.

Воображаемый поиск в Микобанке

Так программировать сложно, но чтобы расти, этому надо учиться.

На чем учиться

Микобанк разрешает скачать список научных названий грибов (25 Мбт). Это большой интересный набор данных. С его помощью вы разберетесь с названиями таксонов, научитесь строить таксономическую базу данных и прокачаете навыки разработки интерфейсов.

О достижениях пишите.

Спасибо Бюро Артема Горбунова за принцип «Интерфейс — зло».

2017   грибы   интерфейс   как не надо делать   микобанк   поиск таксонов   таксономическая база данных

Создаем таксономическую базу данных

Таксономические связи между ядовитыми видами тропических лягушек-древолазов (рисунок из статьи Брауна и др., 2011)

Заметка-конспект для составителей таксономических баз данных

Таксономическая база данных (ТБД) нужна для составления компьютерных списков таксонов, виртуальных коллекций, атласов и определителей. Это костяк любой таксономической информационной системы.

ТБД хранит названия таксонов, которые суть ключи для доступа к биологической, экологической, генетической, географической и морфологической информации об организмах.

Концепция биологического таксона сегодня нам не понадобится. Важно запомнить, что биологические таксоны относят к семи основным рангам: виду, роду, семейству, отряду животных или порядку растений, классу, типу животных или отделу растений и царству. Вид — это низший ранг, царство — наивысший ранг.

Вид → Род → Семейство → Отряд или Порядок → Класс → Тип или Отдел → Царство

Ранг вида — основной. Он является началом отсчета, как ноль в математике. Таксоны рангом выше вида — от рода, до царства — называются высшими таксонами. Бывают таксоны рангом ниже вида: подвиды, вариететы и формы. Встречаются промежуточные ранги: подпорядки, инфраотряды, надсемейства. Однако исследователи оспаривают их необходимость, поэтому обойдемся без них.

Вид — начало отсчета; таксоны от рода до царства — высшие таксоны

В дальнейшем я буду различать виды и таксоны рангом выше вида, которые буду называть просто таксонами.

Ранги иерархически подчинены друг другу: таксоны высших рангов содержат таксоны нижних рангов. Например, род пантер (Panthera) относится к семейству кошачьих (Felidae) и содержит четыре вида: Panthera tigris (тигр), P. leo (лев), P. pardus (леопард) и P. onca (ягуар). Иерархические связи между таксонами разных рангов удобно визуализировать в виде дерева. Его называют деревом таксонов.

По мнению систематиков, дерево таксонов должно отображать естественные эволюционные связи между организмами: показывать, кто от кого произошел. На практике многие таксономические деревья не являются естественными.

Я оставлю спор о таксономических деревьях систематикам и кратко сформулирую требования к ТБД, рассмотрю научные названия и авторов таксонов, синонимы и омонимы, коснусь фрагментарности таксономического дерева и закончу описанием первичной структуры ТБД.

Требования к ТБД

Три необходимых требования к таксономической базе данных:

  1. Хранит дерево названий таксонов. Дерево может быть фрагментарным — содержит таксоны не всех уровней.
  2. Название таксона удовлетворяет правилам биологической номенклатуры.
  3. Каждое название таксона уникально. Если названия совпадают, значит у них разные авторы. Если авторы не указаны, но названия совпадают, значит они омонимы и относятся к разным царствам. Другие случаи запрещены.

Латинские названия таксонов

Правила номенклатуры регулируют построение латинского названия таксона. Высший таксон — одно слово, вид — два слова, внутривидовой таксон — три или четыре слова. Слова состоят из латинских букв, могут иметь тире. Название таксона всегда пишут с заглавной буквы

Так как вид — основная единица эволюции, начну с него.

Название вида — биномен. Состоит из двух частей: названия рода и видового эпитета. Например Rapana venosa — хищный брюхоногий моллюск: Rapana — название рода, venosa — видовой эпитет. Видовой эпитет без названия рода не употребляется.

Rapana venosa занесен в Черное море в 30-х годах прошлого века и за несколько десятков лет полностью уничтожил устричные банки. Однако он оказался полезным. Правильно приготовленное мясо рапаны любят гурманы, оно годится для наживки, красивая раковина идет на сувениры и в ней обожают селиться раки-отшельники Clibanarius erythropus. (Источники фото знает Гугл)

Для краткости в видовом названии род сокращают до первой буквы, если он был упомянут ранее. Так как о раках-отшельниках клебанариях я написал под рисунком, то теперь род раков можно сократить: «На каменистом мелководье я нахожу отшельников C. erythropus».

Сначала пишем полностью — Mytilus galloprovincialis, потом кратко — M. galloprovincialis

Название вида всегда курсивом

Название вида позволяет определить род, к которому относится организм.

Название высшего таксона — униномен, значит состоит из одного слова. Вот так: «Род Rapana относится к семейству Muricidae класса Gastropoda».

Название рода, как и вида, всегда пишут курсивом. Названия высших таксонов — нет, но если напишете, ничего страшного не произойдет.

Специфические окончания названий некоторых высших таксонов помогают опознать ранг. Так названия семейств животных оканчиваются на -idae.

Аллигатор миссисипский — один из представителей Alligatoridae. Окончание -idae показывает, что перед нами семейство животных

Название внутривидового таксона — триномен или квадромен (слышал о пентомене, но не видел) — начинается с названия вида, за которым следует один или два внутривидовых эпитета.

Внутривидовое название чаще всего обозначает подвид, вариетет или форму.

  • Эпитет подвида пишут следом за видом: Pilorcula trifilaris quadrifilaris
  • Эпитет вариетета отделяют сокращением var.: Vivipata pyramidalis var. erjaveci
  • Эпитет формы отделяют сокращением f.: Mya truncata f. ovata

Внутривидовые названия признает не каждый исследователь. Систематики стараются переописать внутривидовой таксон — сделать из него вид, в крайнем случае подвид, а отвергнутые внутривидовые названия становятся синонимами.

Авторы таксона

Я занимаюсь микроводорослями, поэтому больше знаком с ботаническим кодексом. Он отличается от зоологического в требовании ко включению авторов таксонов в название таксона.

Международный кодекс ботанической номенклатуры обязует, чтобы за названием таксона-растения следовали фамилии исследователей — авторов таксона, — которые впервые придумали это название и описали таксон.

Фамилии обычно сокращают. После пишут год открытия или ревизии таксона. В целом получается полноценная ссылка на публикацию.

Mya Linnaeus, 1758 — Линней в 1758 году опубликовал описание моллюсков рода Миа в монографическом труде

Международный кодекс зоологической номенклатуры утверждает, что фамилия автора не входит в название таксона и приводить ее необязательно.

Получается, что ТБД может содержать авторов таксонов или обходиться без них. По собственному опыту скажу, что с авторами удобнее работать с данными.

ТБД без авторов таксонов, в соответствии со сформулированными выше требованиями, не должна содержать одинаковые названия таксонов, относящиеся к одному царству. Но она разрешает названия-омонимы, о которых я расскажу ниже.

ТБД с авторами таксонов должна понимать разнообразные способы написания фамилии и инициалов одного автора. Иначе в ТБД появится множество идентичных по смыслу записей — множество ключей от одной двери. Так O. F. Müller, O.F. Müller, Müller, O. Müller и OF Muller — один и тот же человек. Для опознания совпадающих фамилий, например, можно использовать автоматически наполняемый словарь или специально обученного инженера.

Научите систему понимать, что O. F. Müller, O.F. Müller, Müller, O. Müller, OF Muller и прочие Мюллеры — один человек

Синонимы

Синонимы — вторичные названия одного таксона. Они соответствуют правилам номенклатуры, но не считаются валидными — действующими названиями.

Синонимы появляются, когда исследователь не знает, что таксону уже дано название, или когда он относит таксон к другому рангу. Синоним может называться также, как и правильный таксон, тогда он отличается от него автором.

Chaetoceros socialis H. S. Lauder — валидное название вида диатомовых водорослей, которое имеет пять синонимов:

  • Chaetoceros radians F. Schutt 1895
  • Chaetoceros socialis f. autumnalis A. I. Proshkina-Lavrenko 1953
  • Chaetoceros socialis f. vernalis A. I. Proshkina-Lavrenko 1953
  • Chaetoceros socialis f. radians (F. Schutt) A. I. Proshkina-Lavrenko 1963
  • Chaetoceros socialis var. radians (F. Schutt) P. M. Tsarenko 2009
Chaetoceros socialis H. S. Lauder — Хетоцерос социальный. Вид планктонных диатомовых водорослей, образующих «социум» — спутанную колонию

Синонимичное название связано с принятым названием таксона. Я изображаю такую связь стрелкой, направленной от синонима к валидному названию.

Chaetoceros radians F. Schutt → Chaetoceros socialis H. S. Lauder

Для хранения синонимов я создаю в ТБД поле, где указываю идентификатор валидного названия или помещаю ноль, если название валидно.

Омонимы

Омонимы — это одинаковые названия таксонов, которые относятся к разным видам или таксономическим группам. Например Centropogon australis обозначает вид рыбы и растения.

Симпатичный красный цветок и рыба, похожая на ерша, по латыни называются одинаково — Centropogon australis

По правилам биологической номенклатуры омонимы должны попадать под юрисдикцию разных кодексов биологической номенклатуры, то есть относится к разным царствам. Поэтому омонимы из разных царств допустимы. Так Empusa — это разрешенное название рода богомолов (царство животных) и энтомофторовых зигомицетов (царство грибов). Недопустимые омонимы систематики отлавливают и переписывают.

Омонимичные названия отличаются фамилиями авторов: только так их можно опознать при чтении. C. australis (White, 1790) — это вид рыбы, а C. australis (E. Wimm.) Gleason — вид растения. Кстати, Энциклопедия жизни игнорирует это правило — она не выносит авторов в заголовок, но в результатах поиска указывает высшие таксоны.

Омонимы нарушают идиллию разработчика ТБД. Разработчику важно запомнить, что название таксона само по себе не уникально и не может служить уникальным индексом записей базы данных. Для уникального ключа нужна пара: название таксона, автор. При этом имена авторов должны быть унифицированы, о чем я говорил выше.

Структура таксономической базы данных

Для представления в БД таксономического дерева использую вложенные множества.

Родителя узла-таксона храню в отдельном поле. Потому что часто надо определить идентификатор рода, к которому относится заданный вид, а средствами вложенных множества это делать неудобно.

Ранг таксона тоже в отдельное поле. Это позволяет строить дерево с произвольной иерархией.

Синоним — поле со ссылкой на идентификатор принятого таксономического названия.

Получается следующая структура:

  • [Представление вложенных множеств]
  • Ранг таксона
  • Название таксона
  • Автор таксона
  • Ссылка на валидное название таксона, если синоним

Нужны ли высшие ранги?

Нет. Если вы не разрабатываете специальную базу для систематиков, то полная иерархия высших таксономических рангов не понадобится. Вместо них потребуется один-два высших ранга, род и вид.

Пусть я собираю информацию о форме оболочек мироводорослей. Сначала я делю микроводоросли на классы: диатомовые, динофлагелляты, кокколитофориды и прочие. Потом на роды и виды. Внутривидовым таксонам, если встречаются, присваиваю ранг вида — пользователь по названию разберет, что это внутривидовой таксон, а мне удобно хранить данные. Получается трехступенчатая иерархия: класс → род → вид.

Теперь я дополняю базу формами рыб. Разделяю рыб на уровне сеймества, использую род и вид. Опять получается три ступени: семейство → род → вид.

Помню, что рыбы — животные, а микроводоросли — растения. Чтобы их отделить, вставляю самый верхний ранг — царство. Поучается четыре иерархических ступени, у которых вторые уровни отличаются.

Царство животных → семейство → род → вид
Царство растений → класс → род → вид

Из примеров следует, что две ступени таксономической иерархии — род и вид — используются в любой ТБД. К ним добавляется третья — один из высших таксономических рангов. Если организмы из разных царств, добавляем четвертую ступень.

Для организмов из одного царства достаточно трех ступеней, из разных — четырех: царство → какой-то высший ранг → род → вид

Высший ранг может быть любым подходящим для группы организмов. Вот я решил добавить в упомянутую базу данные о раковинах моллюсков: брюхоногих из класса Gastropoda и двустворчатых из класса Bivalvia. Для них определяю в базе ранг класса, не вижу смысла разделять моллюсков на уровне семейства, поэтому получаю следующую структуру:

Царство животных → семейство рыб → род → вид
Царство животных → класс моллюсков → род → вид
Царство растений → класс микроводорослей → род → вид

Структура базы позволяет хранить такое фрагментарное дерево.

Ключевые положения

  1. Храню авторов таксонов, так как они помогают отличить валидные таксоны, синонимы и омонимы.
  2. Фамилии авторов следует унифицировать.
  3. Синоним — это ссылка на валидное название.
  4. Не обязательно запоминать все высшие таксоны вида.

На этом все. В следующий раз опишу логику функций для работы с ТБД.

Дополнительное чтение

Семь подходов для хранения деревьев в БД.

Аббревиатуры фамилий ботаников. Например, L. — Карл Линней (1707—1778).

В названиях таксонов используют массу сокращений. Например, f. sp. (сокр. от лат. forma specialis) в ботанике и микологии указывает на форму паразита, адаптированного к специфическому хозяину.

Наша статья о пользе таксономических баз данных на примере севастопольского Института морских биологических исследований РАН.

Омонимы в царстве растений, животных и бактерий.