Среднее время прочтения — 9 мин.

Ученые используют машинное обучение, чтобы подслушивать за голыми землекопами, крыланами, воронами и китами и отвечать им.

Читает Александр Тарасов
Подкаст на YouTube, Apple, Spotify и других сервисах

Голый землекоп, может, и не красавец, но ему есть что сказать. Как многие муравьи, эти морщинистые усатые грызуны живут большими подземными колониями и обладают богатым вокальным репертуаром. Они свистят и чирикают, а еще кряхтят, икают, шипят и издают трели.

И когда два разговорчивых зверька встречаются в темном туннеле, они обмениваются стандартным приветствием. «Они издают приглушенный писк, а затем пищат еще раз, — отмечает Элисон Баркер, нейробиолог из Института исследований мозга Макса Планка в Германии. — У них выстраивается небольшой диалог».

Доктор Баркер и ее коллеги обнаружили, что в этом обычном обмене репликами скрывается огромный массив социальной информации. Они использовали алгоритмы машинного обучения для анализа 36 тыс записей такого писка в семи колониях землекопов.

Мало того, что каждый землекоп обладал уникальным вокальным почерком, каждая колония также общалась на особом диалекте, который передавался из поколения в поколение как объект культуры. Во времена социальной нестабильности, например, через несколько недель после насильственного свержения королевы колонии, эти целостные диалекты распадались. Когда к власти приходила новая королева, в колонии закреплялся новый диалект.

«Обычное приветствие, от которого я не ожидала сюрпризов, оказалось невероятно сложным явлением, — признается доктор Баркер, которая стала заниматься изучением множества других звуков, издаваемых грызунами. — Можно сказать, что машинное обучение коренным образом изменило мое исследование».

Системы машинного обучения, в которых используются алгоритмы для обнаружения закономерностей в больших массивах данных, стали весьма успешно справляться с анализом человеческого языка. Это привело к появлению голосовых помощников с распознаванием речи, программного обеспечения для преобразования речи в текст и цифровых инструментов для перевода с одного языка на другой.

В последние годы ученые начали внедрять эту технологию для расшифровки сообщений, которыми обмениваются животные. Алгоритмы машинного обучения помогают определить, когда писк мыши сигнализирует о стрессе или что означают крики крыланов. Сейчас осуществляются еще более амбициозные проекты: создание всеобъемлющего каталога криков воронов, составление схемы синтаксиса языка кашалотов и даже разработка технологий, позволяющих людям передавать ответные сообщения.

«Давайте попробуем найти Google Переводчик для животных», — предлагает Дайана Рейсс, эксперт по когнитивным способностям и коммуникации дельфинов в Хантерском колледже и соучредитель аналитического центра «Межвидовой интернет», занимающегося облегчением коммуникации между видами.

Переводчики с языка животных 1
Элисон Баркер, нейробиолог из Института исследований мозга Макса Планка. Фото: Феликс Шмитт для The New York Times

Это всё еще молодое направление, и многие проекты проходят лишь период становления. Вряд ли человечество вот-вот обнаружит Розеттский камень для расшифровки песен китов или сможет посплетничать с кошками. Но проведенная работа уже показывает, что коммуникация животных намного сложнее, чем может различить человеческое ухо, а их разговоры позволяют получить более полную картину мира за пределами нашего вида.

«Очень любопытно, что машины могут приблизить нас к живой природе, а искусственный интеллект помочь распознать интеллект биологический, — отмечает Том Мастилл, режиссер фильмов о дикой природе и науке, а также автор готовящейся к изданию книги «Как говорить на китовьем». — Это схоже с изобретением телескопа — нового инструмента, который позволяет нам постигать то, что всегда было на виду, но чего мы не могли видеть раньше».

Подслушивание 2.0

Исследования коммуникации животных проводились и раньше, но алгоритмы машинного обучения позволили выявлять незаметные закономерности, которые могут ускользнуть от человеческого уха. Например, ученые показали, что эти программы различают голоса отдельных животных, разбирают звуки, издаваемые живыми организмами в разных обстоятельствах, и делят их голосовые сигналы на более мелкие фрагменты, что является решающим шагом в расшифровке смысла.

«Очень радует, что в мире звуков животных все еще существует так много загадок, а для их решения мы можем применить вычисления», — делится Дэн Стоуэлл, эксперт по машинному восприятию звуков в Тилбургском университете и центре биоразнообразия Naturalis в Нидерландах.

Несколько лет назад исследователи из Вашингтонского университета использовали машинное обучение для разработки программы под названием DeepSqueak, которая позволяет автоматически обнаруживать, анализировать и классифицировать голосовые сигналы грызунов на ультразвуковой волне.

С ее помощью также можно различать сложные, похожие на песни, звуки, которые издают животные, когда они чувствуют себя хорошо, и протяжные низкие звуки, издаваемые, когда им плохо. «Вы можете узнать, как животное себя чувствует непосредственно из первых уст», — заявляет Кевин Коффи, исследователь в сфере поведенческой нейробиологии из Вашингтонского университета, который был частью команды разработчиков DeepSqueak.

Со временем программа DeepSqueak была приспособлена для изучения и иных видов, включая лемуров и китов. Другие же команды разработали свои собственные системы, чтобы автоматически определять, является ли кудахтанье цыплят или визжание свиней признаком воспринимаемой опасности.

Расшифровка значения

Переводчики с языка животных 2
Йоси Йовель, нейроэколог из Тель-Авивского университета, наблюдает за крыланами, которые живут открытой колонией в его лаборатории. Фото: Амит Элькаям для The New York Times

Для расшифровки значения криков животных также требуются большие объемы данных о контексте, который сопровождает каждый визг и писк.

Чтобы узнать больше о голосовых сигналах нильских крыланов, исследователи в течение 75 дней записывали группы этих животных на видеокамеры и микрофоны. Затем они просмотрели записи, скрупулезно отмечая некоторые важные детали, в том числе, какой крылан издавал звук и в каком контексте это происходило. Таким образом было проверено почти 15 000 криков.

Летучие мыши склонны к дракам, а их густонаселенные колонии часто становятся местом шумных разборок. Подавляющее большинство их голосовых сигналов носит агрессивный характер. «Они попросту толкаются, — рассказывает Йоси Йовель, нейроэколог из Тель-Авивского университета, который руководил исследованием. — Представьте себе большой стадион, на котором каждый хочет найти себе место».

Но система машинного обучения могла с точностью до 61% различать агрессивные крики, издаваемые в четырех различных контекстах. Определялось, был ли конкретный крик издан во время драки из-за пищи, спаривания, места на ветке или сна. Доктор Йовель отметил, что это отнюдь не идеальный показатель, но он значительно лучше, чем точность в 25%, достигаемая при случайном предположении.

Доктор Йовель с удивлением обнаружил, что программное обеспечение также может точнее, чем при угадывании, определить, какой крылан являлся адресатом агрессии.

«Таким образом, летучая мышь, которая слышит эти звуки, теоретически  способна, по крайней мере с некоторой точностью, определить, обращается ли особь А к особи Б или особи В», — написали исследователи в своей статье 2016 года.

Несмотря на то, что эта гипотеза пока не доказана, летучие мыши могут варьировать издаваемые ими голосовые сигналы в зависимости от их отношения к обидчику и имеющихся о нем знаний так же, как люди могут обращаться к разным аудиториям разным тоном.

«Это колония. Они хорошо адаптированы к социальной жизни. Они знают друг друга, — объясняет доктор Йовель. —  Возможно, ситуация, когда я кричу на вас из-за еды, отличается от ситуации, когда я кричу по той же причине на кого-то другого. Таким образом, один и тот же крик будет иметь некоторые тонкости, которые мы и смогли обнаружить с помощью машинного обучения».

Но обнаружение закономерностей — это только начало. После этого ученым необходимо определить, раскрыли ли алгоритмы что-то значимое о поведении животных в реальном мире.

«Нужно быть очень осторожным, чтобы не выявить закономерностей, которых на самом деле нет», — предостерегает доктор Стоуэлл.

После того как алгоритмы предположили, что во всех колониях голых землекопов имеются свои диалекты, доктор Баркер и ее коллеги подтвердили, что грызуны гораздо чаще реагировали на приглушенный писк членов собственных колоний, чем на писк представителей чужих колоний. Чтобы исключить возможность того, что голые землекопы лишь реагировали на знакомые голоса, исследователи повторили эксперимент с искусственным писком, сгенерированным в соответствии с диалектом родной колонии отдельного животного. Результаты подтвердились.

В дикой природе диалекты, характерные для колоний, могут помочь голым землекопам исключить ситуацию, когда им приходится делить и так скудные ресурсы с незнакомыми особями. Кроме того, они могут являться средством обеспечения социальной конформности. «В этих больших подземных туннелях нужно удостовериться, что правила соблюдаются всеми, — объясняет доктор Баркер. — И есть один очень быстрый способ это проверить: убедиться, что все говорят единообразно».

Китовьи байки

Переводчики с языка животных 3
[Картинка 3] Группа кашалотов социализируется в водах близ Доминики в Карибском море. Фото: Blue Planet Archive/Alamy

Сейчас реализуются и другие крупные проекты. Проект CETI, аббревиатура от Cetacean Translation Initiative (Инициатива по переводу языка китообразных), объединяет экспертов по машинному обучению, морских биологов, робототехников, лингвистов, криптографов и других участников из более чем десятка учреждений, чтобы расшифровать коммуникацию кашалотов. Эти животные общаются посредством серий щелчков, которые образуют ряды звуков, схожие по структуре с сообщениями на азбуке Морзе. Каждый такой ряд называется кодой.

Этой осенью команда планирует установить у берегов Доминики «базовые станции для прослушивания китов», каждая из которых оборудована 28 подводными микрофонами. Для ведения аудио- и видеозаписи планируется использовать роботизированных рыб, а для записи голосовых сигналов и движений отдельных животных — небольшие акустические маячки.

Затем исследователи попытаются расшифровать синтаксис и семантику языка китов и ответить на более общие научные вопросы, связанные с поведением и когнитивной деятельностью кашалотов, например, как большие группы координируют свои действия и как детеныши китов учатся общаться.

«Новые вопросы подстерегают нас на каждом шагу, — рассказывает Дэвид Грубер, морской биолог из Колледжа Баруха, который возглавляет проект CETI. — Если бы неделю назад произошло какое-то важное событие, как бы мы узнали, что они все еще говорят о нем? Знают ли киты математику?»

Также сотрудничает с биологами и  некоммерческая организация Earth Species Project (проект «Земные виды») из Калифорнии. Этот проект призван опробовать различные подходы к машинному обучению в отношении китов и других видов.

Например, ведется работа с морскими биологами, чтобы понять, могут ли алгоритмы машинного обучения автоматически определять поведение усатых китов в настоящий момент на основе данных о передвижении, собранных с помощью отслеживающих маячков.

«Помечаются ли особым образом в данных вдох или кормление животного?» — конкретизирует Ари Фридлендер, морской эколог из Калифорнийского университета в Санта-Крузе, который сотрудничает в проекте.

Исследователи надеются наложить эти поведенческие характеристики на аудиозаписи, чтобы понять, существуют ли конкретные звуки, которые киты систематически издают в определенных контекстах.

«У нас появляется много интересных вариантов, например, мы можем посмотреть, как двигаются косатки, и перевести движение в сопровождающий его звук, — рассказывает Аза Раскин, председатель и соучредитель проекта Earth Species Project. — Или можно начать с аудиозаписи и задаться вопросом, какое поведение соответствует тому, что они говорят».

Говорим в ответ

Переводчики с языка животных 4
Мишель Фурне, морской акустический эколог, пыталась расшифровать коммуникацию горбатых китов, наблюдая, как животные реагируют на воспроизведение их криков через подводные динамики. Фото: Тристан Спински для The New York Times

Другое направление исследований, которыми занимаются эксперты Earth Species Project, связано с использованием алгоритмов машинного обучения для создания перечня всех типов голосовых сигналов, издаваемых гавайскими воронами. В дикой природе эти птицы вымерли два десятилетия назад и сейчас содержатся в неволе.

Затем ученые сравнят результаты с сохранившимися записями диких гавайских воронов, чтобы определить конкретные типы криков, которые птицы могли утратить за годы пребывания в неволе.

«Возможно, со временем их вокальный репертуар сократился, а это представляет собой реальную проблему для сохранения их вида», — объясняет Кристиан Рутц, поведенческий эколог из Сент-Эндрюсского университета в Шотландии, который сотрудничает с некоммерческой организацией в рамках этого проекта. «Птиц содержат в вольерах, чтобы разводить для выпуска в дикую природу. Но что, если они больше не владеют вороновым языком?»

В таком случае ученые смогут изучить функцию любых утерянных криков и, возможно, даже возродить наиболее важные из них в колониях, которые содержат люди.

В рамках Earth Species Project также велось сотрудничество с Мишель Фурне, морским акустическим экологом из Университета Нью-Гэмпшира. Исследовательница пыталась расшифровать коммуникацию горбатых китов, наблюдая, как животные реагируют на воспроизведение записанных заранее криков китов через подводные динамики.

Сейчас ученые Earth Species Project используют алгоритмы для создания новых голосовых сигналов горбатых китов, то есть, по словам доктора Фурне, «криков, не существующих в природе, но аналогичных им по звучанию». «Сложно описать, насколько это здорово — представить новую часть природы, а затем прослушать ее».

По ее словам, воспроизведение этих новых криков диким китам может помочь ученым проверить гипотезы о функции определенных голосовых сигналов.

По словам экспертов, при наличии достаточного объема данных о том, как киты общаются друг с другом, системы машинного обучения смогут генерировать адекватные ответы на конкретные крики китов и сразу же их воспроизводить. Это означает, что ученые фактически смогут использовать китовые чат-боты для «общения» с морскими млекопитающими еще до того, как полностью поймут, что говорят эти животные.

Эти опосредованные машиной разговоры могут помочь исследователям усовершенствовать свои модели и лучше понять коммуникацию китов. «В какой-то момент это может перерасти в настоящий диалог», — предполагает Майкл Бронштейн, эксперт по машинному обучению в Оксфорде и участник проекта CETI.

Он добавляет: «Это, вероятно, самый безумный проект, в котором я когда-либо участвовал как ученый».

Учимся слушать

Переводчики с языка животных 5
Гавайские вороны вымерли в дикой природе два десятилетия назад и сейчас разводятся в неволе. Фото: Джек Джеффри/Photo Resource Hawaii, Alamy

Перспектива постоянного двустороннего диалога с другими видами остается туманной. Но настоящий разговор потребует выполнения нескольких «предварительных условий», в том числе совпадающие типы интеллекта, совместимые сенсорные системы и, что особенно важно, взаимное желание общаться. Такого мнения придерживается Натали Уомини, эксперт по когнитивной эволюции в Институте эволюционной антропологии Макса Планка.

«У обеих сторон должна быть мотивация, чтобы стремиться к общению», — говорит она.

Даже в таком случае некоторые животные могут обладать опытом, настолько отличным от нашего, что часть идей просто потеряется при переводе. «Например, у нас есть понятие „промокнуть“, — поясняет доктор Бронштейн. —  Я думаю, что киты не смогли бы даже понять, что это значит».

Эксперты признают, что эти эксперименты также могут вызвать этические проблемы. «Если вы находите в животном мире закономерности, которые позволяют вам понять общение живых организмов, это открывает путь для манипулирования их коммуникацией», — предупреждает господин Мастилл.

Но технологию можно применять и на благо животных, помогая экспертам следить за благополучием как дикой, так и домашней фауны. Ученые надеются, что новый взгляд на жизнь животных, полученный в результате этого исследования, сможет привести к более масштабным изменениям в обществе. Многие отмечали активизацию общества после выхода в 1970 году альбома «Песни горбатого кита», в котором содержались записи таинственных звуков китов. Считается, что он положил начало глобальному движению за спасение китов.

Биолог Роджер Пейн, который продюсировал этот альбом, теперь участвует в проекте CETI. Многие ученые также надеются, что новые попытки использовать высокие технологии, чтобы понять голосовые сигналы китов, а заодно воронов, летучих мышей и даже голых землекопов, будут иметь столь же глубокое влияние и предоставят новые способы установить связь и понимание с нашими соседями по планете.

«Для меня важно скорее не то, что говорят киты, — делится своим мнением доктор Грубер, — а тот факт, что мы их слушаем».

По материалам The New York Times 
Автор: Эмили Антес
Заглавное фото: Феликс Шмитт для The New York Times

Переводил: Дмитрий Кравцов 
Редактировали: Юлия Мухтасимова, Фёдор Каузов