shikhalev.org

Я уже неоднократно упоминал123 о сай­те iNa­tu­ra­list.org и, на­до полагать, буду упоминать еще. Проект по мно­гим параметрам интересный и значимый. В этом посте я постараюсь рассказать, как о про­ек­те в це­лом, так и о том, как я лично с ним обращаюсь и что об этом думаю.

Если совсем кратко, то iNaturalist — это, с одной стороны, сайт для распознавания всякого разного живого по фото- и аудио-наблюдениям, а с другой стороны — упорядоченная база таких наблюдений.

Таким образом, любой может сфотографировать, например, жука или птицу, загрузить фото на сайт и узнать, кого же это он увидел. Первичное распознавание делает нейросеть (которая на этой же базе данных тренируется, как я понимаю), но что отдельно приятно — затем происходит уточнение и опознание силами сообщества. Когда идентификация набирает несколько подтверждений, в ней как-то больше уверенности.

Для примера несколько моих наблюдений:

  • Вертишейку (см. наблюдение #60427458) и самку сорокопута-жулана (#57882298) я бы самостоятельно не опознал, попросту не ожидая их там и не зная, с чего начинать определение. И неуверенностью бы терзался, даже если бы через какое-то время нашел.

  • А, скажем, осоеда (#58370577) я и вовсе принял за коршуна, и именно благодаря идентификации сообщества смог исправиться.

Один из важных плюсов iNaturalist — то, что там водятся и профессиональные биологи, которые могут подсказать «куда смотреть». А водятся они там как раз потому, что это большая упорядоченная база наблюдений. Так что посредством iNaturalist можно не только удовлетворить свое собственное любопытство, но и чуть-чуть помочь науке, тем самым удовлетворив уже чувство собственной важности.

Основное

На самом деле, в первую очередь это научный проект, в котором может поучаствовать любой желающий, а потом уже определитель, конечно.

Загружать наблюдения и участвовать в идентификациях можно как через сайт, так и через мобильное приложение. Я предпочитаю первое, но я и снимаю на зеркалку…

Некоторым неудобством для кого-то может стать необходимость регистрации, однако для любителей анонимности тоже есть вариант, о котором я еще скажу ниже. Но если нет веских препятствий, то лучше все-таки зарегистрироваться и оставлять полноценные наблюдения.

Порядок загрузки через сайт такой:

  1. Загружаем материалы — фото и аудио (видео на данный момент не поддерживается, насколько я понимаю, не по техническим, а по финансовым причинам).

  2. Объединяем, если нужно несколько материалов друг с другом. Например, фото одной и той же птицы с разных ракурсов, плюс запись ее же голоса. Но при этом разные особи даже одного и того же вида должны идти в разных наблюдениях, равно как и одна и та же особь в существенно разное время (разные дни, например) или в существенно разных местах.

    Если у нас в одном кадре имеются особи разных видов, то нужно дублировать наблюдение и атрибутировать дубли разными видами. См. например мои наблюдения #75018530 и #75018531, где ворон и сорока летят вместе. Дублирование, объединение и разделение производятся в интерфейсе редактирования на сайте, заново загружать ничего не придется.

  3. Проверяем и по необходимости заполняем поля времени и места наблюдения. По умолчанию ставятся данные из EXIF фотографий, но координаты умеют записывать не все камеры, так что может понадобиться и ручной выбор.

    У меня камера также не имеет GPS-приемника, я обычно использую приложение на телефоне — Locus Map4 — для записи трека, а затем прописываю его в EXIF посредством exiftool (встроенный инструмент в Darktable почему-то нормально работать не хочет). Точность оставляет желать лучшего, и частенько приходится руками после загрузки немного корректировать координаты, но так все равно удобнее, чем задавать их с нуля.

  4. Ну и заполняем, что мы, собственно, видели. Или выбираем из подсказок, или через поле поиска. Если фотография подробная и удачная, скорее всего в посказках будет нужный вид, или как минимум род.

  5. PROFIT! Нажимаем «Подтвердить наблюдения» и можем ждать, что участники сообщества поправят или подтвердят нашу идентификацию.

Что интересно: абсолютно все данные не обязательны. Можно даже создать наблюдение без единой фотографии или аудиозаписи, просто написав в комментариях (хотя и это не обязательно): «Давеча видал чупакабру за овином». Понятно, что никакой ценности такое «наблюдение» нести не будет, и если так сделать несколько раз, можно получить бан. За однократную фигню в данных не карают, такие наблюдения официально считаются «тестовыми», но злоупотреблять не стоит.

Данные

Вообще, то, что на первый взгляд ограничений не видно, еще не значит, что их нет. Основной workflow рассчитан на добросовестных участников, но модерация в принципе имеется. Хотя не нарушая правила, ее заметить будет не просто. Понятно, что запрещен спам, оскорбления и все в том же духе. Аналогично бан может последовать и за оффтопик — скажем, за загрузку картинок, не относящихся к делу.

Отдельно стоит проговорить запрет использования чужих картинок. Это не просто копирайтный запрет — если вы найдете фотографию под свободной лицензией, ее тоже загружать нельзя. Можно загружать чужие фото только непосредственно от име­ни и по по­ру­че­нию автора этих фото (а если по сути, то важна гарантия, что снято именно в то время и в том месте, где указано). Как я понял из документации не все понимают, что загружать нужно свои материалы и иногда пытаются проиллюстрировать свое наблюдение более удачной фотографией из интернетов… — так нельзя. Ну и нарушения копирайта тоже караются.

Что до копирайта на загружаемые материалы, то а) все права остаются у автора фото или аудиозаписи; б) вы выбираете лицензию, под которой их публикуете — это может быть public domain, одна из лицензий Creative Commons или же отсутствие лицензии, которое означает, что кроме как на сайте iNaturalist эти данные использованы быть не могут, что, в свою очередь запрещает их передачу в научные базы, размещение в Википедии и так далее. Не надо так. Если нет каких-то очень уж веских обстоятельств, лучше размещать свои фото под открытыми лицензиями или в public domain. Еще один момент с лицензиями, уже менее очевидный, у разных баз разные требования. Так, например, глобальная база данных по биоразнообразию GBIF допускает лицензии CC-BY и CC-BY-NC, но не допускает CC-BY-SA, тогда как Википедия, напротив, допускает CC-BY и CC-BY-SA, но не CC-BY-NC… В итоге, если вы хотите, чтобы ваши наблюдения не лежали мертвым грузом и могли принести максимум пользы человечеству, выбор остается только из CC-BY и CC0 (оно же public domain). В итоге я для себя выбрал CC-BY, хотя предпочел бы CC-BY-SA.

И я весьма рекомендую сразу после регистрации в настройках аккаунта выбрать для себя приемлемую лицензию, чтобы в даль­ней­шем о ней не думать. Коротко:

  • CC0 — полный отказ от авторских прав.
  • CC-BY — позволяет использовать материалы и наблюдения где угодно при условии сохранения авторства.
  • CC-BY-NC — позволяет использовать только в некоммерческих целях (что на самом деле более серьезное ограничение, чем кажется), не подходит для Википедии.
  • CC-BY-SA — позволяет использовать и распространять под той же лицензией, не подходит, как минимум, для GBIF.
  • Без лицензии — никому ничего делать нельзя, ваше личное удовольствие кем-то оплаченное.

Про «кем-то оплаченное» — это не шутка. Для такого проекта оплата хранения всех этих фотографий и звуков влетает в копеечку, которая копеечка собирается с миру по нитке — коммерческой-то деятельности проект не ведет, даже рекламу не крутит. К счастью у компании Amazon есть программа поддержки открытых данных, и в ее рамках значительная (возможно, бо́льшая) часть материалов наблюдений хостится бесплатно. Как определяется эта часть? А вот по лицензии и определяется: public domain или Creative Commons — добро пожаловать, «All-rights reserved» — только за денежку.

Если не хотите ни лицензировать свои фотографии, ни обременять кого-либо затратами на хостинг, см. ниже то же самое решение, что и для принципиальных анонимов.

Что будет, если не заполнить поля времени и места? Наблюдение получит статус «обыкновенное» и не будет учитываться в научных базах. Этот же статус получают домашние животные и культивируемые растения. Такие наблюдения не запрещены, но не приветствуются — все-таки задача проекта в фиксации наблюдений дикой природы. При этом синантропные виды животных и растений считаются дикими, так что для изучения природы городов iNaturalist вполне подходит и предназначен.

Теперь о ключевом поле — таксона. Вносить туда можно таксон любого уровня, но чтобы получить лычку «исследовательский статус» и послужить науке, нужен вид (подвид уже не обязательно), что не значит, что вы обязаны его предоставить сразу — на то и сообщество. Более того, сразу определенный вид все равно потребует подтверждения от других участников, чтобы получить лычку. На начальном этапе лучше вводить самый узкий таксон, в котором все же более-менее уверен, и не оставлять поле совсем не заполненным. И вот почему: на разные группы живых существ имеются разные специалисты, и они, конечно, не могут просматривать весь поток проходящий через сайт, но зачастую подписаны на те группы, которые входят в круг их научных интересов; таким образом, чем точнее мы укажем к кому предположительно относится существо, тем больше шансов, что это увидит профильный специалист.

Правда и внимание специалиста не гарантирует полной идентификации до вида. Увы, многие живые существа практически неотличимы визуально, или отличимы в таких деталях, которые обычно не попадают на фотографию, а требуют сильного макрообъектива или микроскопа — с насекомыми это не редкость. И даже многие птицы различаются не внешне, а по песенке или особенностям поведения, так что если есть возможность записать голос, лишним не будет, ну и дополнять наблюдение комментарием по делу тоже не стесняемся.

Что касается качества фото, то каких-либо ограничений нет, но понятно, что из ниоткуда информация не возьмется и из размытой закорючинки определить вид не сможет ни нейросеть, ни опытные участники сообщества. С другой стороны, загружать стомегапиксельные фотографии, наверное, тоже не стоит, даже если они у вас есть… Тут вся надежда на здравый смысл.

Личный опыт

Чтоб было понятно, что это за опыт, см. мой профиль и список наблюдений.

Сразу отмечу главное: русскоязычное сообщество есть, активное, компетентное и дружелюбное. Это на самом деле важно, и с этим все в порядке. Я мало пишу комментариев к своим и чужим наблюдениям, но когда пишу, делаю это по-русски. Впрочем, это потому, что я подписан на наблюдения только в соседних областях.

Да, можно подписываться на наблюдения в разрезе географии или на определенные таксоны. Из таксонов я подписан только на «Груздь настоящий», чтобы оперативно «браковать» оттуда подгруздок белый — очень уж распространенная ошибка, а географически — на Свердловскую и Челябинскую области, Башкортостан и Пермский край — там природа достаточно похожа на нашу5, чтобы я мог более-менее уверенно принимать участие в идентификации.

Замечу, что, идентифицируя чужие наблюдения, я требую от себя большей уверенности, чем когда указываю вид в своих собственных. И не столько потому, что чужие/собственные, сколько потому что первичное определение еще не дает наблюдению исследовательский статус, и велик шанс, что меня поправят до того, как неверное значение уйдет в базы.

Что до идентификации моих наблюдений сообществом, то тут я заметил следующее:

  • Довольно быстро определяют птиц и млекопитающих — если фотография достаточно качественная, то задержек обычно не бывает.

  • Чуть похуже, но тоже хорошо — земноводных и пресмыкающихся.

  • Так же неплохо все с высшими растениями, если правильно снять. Тут важно вот что: нужны не только красивые цветочки-ягодки, но и общий вид, листья крупным планом, крепление листьев к побегам и прочее, и прочее. Довольно часто близкие виды отличаются друг от друга какой-нибудь небольшой деталью, и желательно эту деталь зафиксировать. А поскольку я не специалист и не знаю, на что обращать внимание в некотором конкретном случае, стараюсь снимать побольше с разных ракурсов.

  • С насекомыми как-то не очень. Видимо, мало специалистов. Хорошо определяются бабочки, но тут зачастую тоже важны мелкие детали. Мелких жучков-листоедов определяют как-то не очень, или мне просто не везло. Шмели обычно определяются до рода, в лучшем случае подрода, а дальше на фотографии они слабо различимы.

  • Грибы определяют откровенно плохо. Мало микологов в сообществе, мало… А сам я хорошо ориентируюсь только в той части съедобных, которую собираю.

  • Грустно и печально со мхами и лишайниками. Даже качественные фото остаются неидентифицированными.

  • Рыб тоже не очень, но тут я особо не слежу.

Но в целом число участников растет, так что есть надежда, что ситуация будет улучшаться и в тех группах, где сейчас есть пробелы.

Отдельный момент: загружать или не загружать наблюдения, когда их много? А у меня так бывает. Тут я исхожу из недублирования, образно выражаясь, по ключу «вид² × место × время», где «вид²» — это «биологический вид × внешний вид». То есть стараюсь не загружать одинаковых существ, снятых в то же время и в том же месте. Понятно, что тождественность времени и места вещь несколько относительная, ибо формально и с разницей в секунду это разное время. Реально же я смотрю по сезонам, но не по четырем большим, а так сказать по микросезонам: снег есть и снег сошел — разные сезоны, почки распустились — еще один. Тот же подход и с местом: улицы поселка и лес на расстоянии километра друг от друга — это разные места, а такой же лес еще на километр дальше — уже то же самое. Ну и про вид: с биологическим все ясно, а что до внеш­не­го, то тут могут быть различия по полу, возрасту, сезону опять же, хорошо видимые на фотографии. Кроме того, если мне удается снять какой-то вид намного лучше, чем до этого — ближе, при лучшем освещении и т.д. — то я такое улучшенное наблюдение тоже загружаю, фото ведь можно смотреть не только, чтобы определить вид, но и наоборот, рассмотреть детали, чтобы пользоваться этим знанием в будущем. Короче, стараюсь быть информативным, чего и всем желаю.

Seek (приложение)

Итак. Для анонимов и тех, кто не желает делиться своими драгоценными наблюдениями ни с кем (а также для детей до 13 лет6), имеется приложение, позволяющее определять живые природы без передачи данных наружу. На­зы­ва­ет­ся оно Seek и содержит уже натренированную нейросетку. Со­от­вет­с­т­вен­но, отпадают все фичи, связанные с сообществом, вместо этого добавляется геймификация и т.д.

Если хотите, чтобы ваш ребенок пропадал одновременно в те­ле­фо­не и в пам­па­сах — это вот оно.

Бёрдвотчерам же, натуралистам, походникам и прочим, чьи увлечения предполагают наблюдение и фотографирование живой природы, я таки советую основную версию приложения iNaturalist, а лучше и вовсе сайт.

  1. «Птицы на кормушке и их поведение», 2021.04.04 

  2. «Съемка птиц на кормушке», 2021.04.10 

  3. «Птицы (и не только) в большом городе», 2021.05.23 

  4. Возможно, Locus Map и не лучший вариант именно в качестве GPS-логгера, но первый, который начал у меня приемлемо работать. Не исключаю, что в дальнейшем найду боле удобное приложение, рекомендации принимаются. 

  5. А сам я нахожусь в Артинском районе Свердловской области

  6. Да, для полноценной регистрации нужно быть не моложе 13 лет. Я не знаю, чем это обусловлено, вероятно как раз копирайтными заморочками, т.е. нужна какая-никакая дееспособность. Кроме того, отметки места и времени могут относиться к чувствительным данным, и надо осознавать, что таким образом ты их публичишь.