1 заметка с тегом

синоним

Создаем таксономическую базу данных

Таксономические связи между ядовитыми видами тропических лягушек-древолазов (рисунок из статьи Брауна и др., 2011)

Заметка-конспект для составителей таксономических баз данных

Таксономическая база данных (ТБД) нужна для составления компьютерных списков таксонов, виртуальных коллекций, атласов и определителей. Это костяк любой таксономической информационной системы.

ТБД хранит названия таксонов, которые суть ключи для доступа к биологической, экологической, генетической, географической и морфологической информации об организмах.

Концепция биологического таксона сегодня нам не понадобится. Важно запомнить, что биологические таксоны относят к семи основным рангам: виду, роду, семейству, отряду животных или порядку растений, классу, типу животных или отделу растений и царству. Вид — это низший ранг, царство — наивысший ранг.

Вид → Род → Семейство → Отряд или Порядок → Класс → Тип или Отдел → Царство

Ранг вида — основной. Он является началом отсчета, как ноль в математике. Таксоны рангом выше вида — от рода, до царства — называются высшими таксонами. Бывают таксоны рангом ниже вида: подвиды, вариететы и формы. Встречаются промежуточные ранги: подпорядки, инфраотряды, надсемейства. Однако исследователи оспаривают их необходимость, поэтому обойдемся без них.

Вид — начало отсчета; таксоны от рода до царства — высшие таксоны

В дальнейшем я буду различать виды и таксоны рангом выше вида, которые буду называть просто таксонами.

Ранги иерархически подчинены друг другу: таксоны высших рангов содержат таксоны нижних рангов. Например, род пантер (Panthera) относится к семейству кошачьих (Felidae) и содержит четыре вида: Panthera tigris (тигр), P. leo (лев), P. pardus (леопард) и P. onca (ягуар). Иерархические связи между таксонами разных рангов удобно визуализировать в виде дерева. Его называют деревом таксонов.

По мнению систематиков, дерево таксонов должно отображать естественные эволюционные связи между организмами: показывать, кто от кого произошел. На практике многие таксономические деревья не являются естественными.

Я оставлю спор о таксономических деревьях систематикам и кратко сформулирую требования к ТБД, рассмотрю научные названия и авторов таксонов, синонимы и омонимы, коснусь фрагментарности таксономического дерева и закончу описанием первичной структуры ТБД.

Требования к ТБД

Три необходимых требования к таксономической базе данных:

  1. Хранит дерево названий таксонов. Дерево может быть фрагментарным — содержит таксоны не всех уровней.
  2. Название таксона удовлетворяет правилам биологической номенклатуры.
  3. Каждое название таксона уникально. Если названия совпадают, значит у них разные авторы. Если авторы не указаны, но названия совпадают, значит они омонимы и относятся к разным царствам. Другие случаи запрещены.

Латинские названия таксонов

Правила номенклатуры регулируют построение латинского названия таксона. Высший таксон — одно слово, вид — два слова, внутривидовой таксон — три или четыре слова. Слова состоят из латинских букв, могут иметь тире. Название таксона всегда пишут с заглавной буквы

Так как вид — основная единица эволюции, начну с него.

Название вида — биномен. Состоит из двух частей: названия рода и видового эпитета. Например Rapana venosa — хищный брюхоногий моллюск: Rapana — название рода, venosa — видовой эпитет. Видовой эпитет без названия рода не употребляется.

Rapana venosa занесен в Черное море в 30-х годах прошлого века и за несколько десятков лет полностью уничтожил устричные банки. Однако он оказался полезным. Правильно приготовленное мясо рапаны любят гурманы, оно годится для наживки, красивая раковина идет на сувениры и в ней обожают селиться раки-отшельники Clibanarius erythropus. (Источники фото знает Гугл)

Для краткости в видовом названии род сокращают до первой буквы, если он был упомянут ранее. Так как о раках-отшельниках клебанариях я написал под рисунком, то теперь род раков можно сократить: «На каменистом мелководье я нахожу отшельников C. erythropus».

Сначала пишем полностью — Mytilus galloprovincialis, потом кратко — M. galloprovincialis

Название вида всегда курсивом

Название вида позволяет определить род, к которому относится организм.

Название высшего таксона — униномен, значит состоит из одного слова. Вот так: «Род Rapana относится к семейству Muricidae класса Gastropoda».

Название рода, как и вида, всегда пишут курсивом. Названия высших таксонов — нет, но если напишете, ничего страшного не произойдет.

Специфические окончания названий некоторых высших таксонов помогают опознать ранг. Так названия семейств животных оканчиваются на -idae.

Аллигатор миссисипский — один из представителей Alligatoridae. Окончание -idae показывает, что перед нами семейство животных

Название внутривидового таксона — триномен или квадромен (слышал о пентомене, но не видел) — начинается с названия вида, за которым следует один или два внутривидовых эпитета.

Внутривидовое название чаще всего обозначает подвид, вариетет или форму.

  • Эпитет подвида пишут следом за видом: Pilorcula trifilaris quadrifilaris
  • Эпитет вариетета отделяют сокращением var.: Vivipata pyramidalis var. erjaveci
  • Эпитет формы отделяют сокращением f.: Mya truncata f. ovata

Внутривидовые названия признает не каждый исследователь. Систематики стараются переописать внутривидовой таксон — сделать из него вид, в крайнем случае подвид, а отвергнутые внутривидовые названия становятся синонимами.

Авторы таксона

Я занимаюсь микроводорослями, поэтому больше знаком с ботаническим кодексом. Он отличается от зоологического в требовании ко включению авторов таксонов в название таксона.

Международный кодекс ботанической номенклатуры обязует, чтобы за названием таксона-растения следовали фамилии исследователей — авторов таксона, — которые впервые придумали это название и описали таксон.

Фамилии обычно сокращают. После пишут год открытия или ревизии таксона. В целом получается полноценная ссылка на публикацию.

Mya Linnaeus, 1758 — Линней в 1758 году опубликовал описание моллюсков рода Миа в монографическом труде

Международный кодекс зоологической номенклатуры утверждает, что фамилия автора не входит в название таксона и приводить ее необязательно.

Получается, что ТБД может содержать авторов таксонов или обходиться без них. По собственному опыту скажу, что с авторами удобнее работать с данными.

ТБД без авторов таксонов, в соответствии со сформулированными выше требованиями, не должна содержать одинаковые названия таксонов, относящиеся к одному царству. Но она разрешает названия-омонимы, о которых я расскажу ниже.

ТБД с авторами таксонов должна понимать разнообразные способы написания фамилии и инициалов одного автора. Иначе в ТБД появится множество идентичных по смыслу записей — множество ключей от одной двери. Так O. F. Müller, O.F. Müller, Müller, O. Müller и OF Muller — один и тот же человек. Для опознания совпадающих фамилий, например, можно использовать автоматически наполняемый словарь или специально обученного инженера.

Научите систему понимать, что O. F. Müller, O.F. Müller, Müller, O. Müller, OF Muller и прочие Мюллеры — один человек

Синонимы

Синонимы — вторичные названия одного таксона. Они соответствуют правилам номенклатуры, но не считаются валидными — действующими названиями.

Синонимы появляются, когда исследователь не знает, что таксону уже дано название, или когда он относит таксон к другому рангу. Синоним может называться также, как и правильный таксон, тогда он отличается от него автором.

Chaetoceros socialis H. S. Lauder — валидное название вида диатомовых водорослей, которое имеет пять синонимов:

  • Chaetoceros radians F. Schutt 1895
  • Chaetoceros socialis f. autumnalis A. I. Proshkina-Lavrenko 1953
  • Chaetoceros socialis f. vernalis A. I. Proshkina-Lavrenko 1953
  • Chaetoceros socialis f. radians (F. Schutt) A. I. Proshkina-Lavrenko 1963
  • Chaetoceros socialis var. radians (F. Schutt) P. M. Tsarenko 2009
Chaetoceros socialis H. S. Lauder — Хетоцерос социальный. Вид планктонных диатомовых водорослей, образующих «социум» — спутанную колонию

Синонимичное название связано с принятым названием таксона. Я изображаю такую связь стрелкой, направленной от синонима к валидному названию.

Chaetoceros radians F. Schutt → Chaetoceros socialis H. S. Lauder

Для хранения синонимов я создаю в ТБД поле, где указываю идентификатор валидного названия или помещаю ноль, если название валидно.

Омонимы

Омонимы — это одинаковые названия таксонов, которые относятся к разным видам или таксономическим группам. Например Centropogon australis обозначает вид рыбы и растения.

Симпатичный красный цветок и рыба, похожая на ерша, по латыни называются одинаково — Centropogon australis

По правилам биологической номенклатуры омонимы должны попадать под юрисдикцию разных кодексов биологической номенклатуры, то есть относится к разным царствам. Поэтому омонимы из разных царств допустимы. Так Empusa — это разрешенное название рода богомолов (царство животных) и энтомофторовых зигомицетов (царство грибов). Недопустимые омонимы систематики отлавливают и переписывают.

Омонимичные названия отличаются фамилиями авторов: только так их можно опознать при чтении. C. australis (White, 1790) — это вид рыбы, а C. australis (E. Wimm.) Gleason — вид растения. Кстати, Энциклопедия жизни игнорирует это правило — она не выносит авторов в заголовок, но в результатах поиска указывает высшие таксоны.

Омонимы нарушают идиллию разработчика ТБД. Разработчику важно запомнить, что название таксона само по себе не уникально и не может служить уникальным индексом записей базы данных. Для уникального ключа нужна пара: название таксона, автор. При этом имена авторов должны быть унифицированы, о чем я говорил выше.

Структура таксономической базы данных

Для представления в БД таксономического дерева использую вложенные множества.

Родителя узла-таксона храню в отдельном поле. Потому что часто надо определить идентификатор рода, к которому относится заданный вид, а средствами вложенных множества это делать неудобно.

Ранг таксона тоже в отдельное поле. Это позволяет строить дерево с произвольной иерархией.

Синоним — поле со ссылкой на идентификатор принятого таксономического названия.

Получается следующая структура:

  • [Представление вложенных множеств]
  • Ранг таксона
  • Название таксона
  • Автор таксона
  • Ссылка на валидное название таксона, если синоним

Нужны ли высшие ранги?

Нет. Если вы не разрабатываете специальную базу для систематиков, то полная иерархия высших таксономических рангов не понадобится. Вместо них потребуется один-два высших ранга, род и вид.

Пусть я собираю информацию о форме оболочек мироводорослей. Сначала я делю микроводоросли на классы: диатомовые, динофлагелляты, кокколитофориды и прочие. Потом на роды и виды. Внутривидовым таксонам, если встречаются, присваиваю ранг вида — пользователь по названию разберет, что это внутривидовой таксон, а мне удобно хранить данные. Получается трехступенчатая иерархия: класс → род → вид.

Теперь я дополняю базу формами рыб. Разделяю рыб на уровне сеймества, использую род и вид. Опять получается три ступени: семейство → род → вид.

Помню, что рыбы — животные, а микроводоросли — растения. Чтобы их отделить, вставляю самый верхний ранг — царство. Поучается четыре иерархических ступени, у которых вторые уровни отличаются.

Царство животных → семейство → род → вид
Царство растений → класс → род → вид

Из примеров следует, что две ступени таксономической иерархии — род и вид — используются в любой ТБД. К ним добавляется третья — один из высших таксономических рангов. Если организмы из разных царств, добавляем четвертую ступень.

Для организмов из одного царства достаточно трех ступеней, из разных — четырех: царство → какой-то высший ранг → род → вид

Высший ранг может быть любым подходящим для группы организмов. Вот я решил добавить в упомянутую базу данные о раковинах моллюсков: брюхоногих из класса Gastropoda и двустворчатых из класса Bivalvia. Для них определяю в базе ранг класса, не вижу смысла разделять моллюсков на уровне семейства, поэтому получаю следующую структуру:

Царство животных → семейство рыб → род → вид
Царство животных → класс моллюсков → род → вид
Царство растений → класс микроводорослей → род → вид

Структура базы позволяет хранить такое фрагментарное дерево.

Ключевые положения

  1. Храню авторов таксонов, так как они помогают отличить валидные таксоны, синонимы и омонимы.
  2. Фамилии авторов следует унифицировать.
  3. Синоним — это ссылка на валидное название.
  4. Не обязательно запоминать все высшие таксоны вида.

На этом все. В следующий раз опишу логику функций для работы с ТБД.

Дополнительное чтение

Семь подходов для хранения деревьев в БД.

Аббревиатуры фамилий ботаников. Например, L. — Карл Линней (1707—1778).

В названиях таксонов используют массу сокращений. Например, f. sp. (сокр. от лат. forma specialis) в ботанике и микологии указывает на форму паразита, адаптированного к специфическому хозяину.

Наша статья о пользе таксономических баз данных на примере севастопольского Института морских биологических исследований РАН.

Омонимы в царстве растений, животных и бактерий.



Если вам вдруг непреодолимо захотелось меня поблагодарить, переведите мне 200 руб. на чашеку кофе.