Вычислительные системы, которые, по-видимому, генерируют мозговую активность, могут быть результатом того, что исследователи направляют их к определенному результату.
Нейронные сети, тип вычислительной системы, в общих чертах моделирующий организацию человеческого мозга, составляют основу многих систем искусственного интеллекта для таких приложений, как распознавание речи, компьютерное зрение и анализ медицинских изображений.
В области неврологии исследователи часто используют нейронные сети, чтобы попытаться смоделировать те же задачи, которые выполняет мозг, в надежде, что модели могут предложить новые гипотезы относительно того, как сам мозг выполняет эти задачи. Однако группа исследователей из Массачусетского технологического института призывает проявлять большую осторожность при интерпретации этих моделей.
При анализе более 11 000 нейронных сетей, которые были обучены моделировать работу ячеек сетки — ключевых компонентов навигационной системы мозга, — исследователи обнаружили, что нейронные сети производят активность, подобную ячейкам сетки, только тогда, когда им даются очень специфические ограничения, которые не встречаются в биологических системах.
«Это говорит о том, что для получения результата с ячейками сетки исследователи, обучающие модели, должны были запечь эти результаты с помощью конкретных, биологически неправдоподобных вариантов реализации», — говорит Райлан Шеффер, бывший старший научный сотрудник Массачусетского технологического института.
Без этих ограничений команда Массачусетского технологического института обнаружила, что очень немногие нейронные сети генерируют активность, подобную ячейкам сетки, что позволяет предположить, что эти модели не обязательно генерируют полезные прогнозы того, как работает мозг.
Шеффер, который в настоящее время является аспирантом в области компьютерных наук в Стэнфордском университете, является ведущим автором нового исследования, которое будет представлено на конференции 2022 года по системам обработки нейронной информации в этом месяце. Ила Фите, профессор мозговых и когнитивных наук и член Института исследований мозга Макговерна Массачусетского технологического института, является старшим автором статьи. Микаил Хона, аспирант Массачусетского технологического института по физике, также является автором.
Моделирование ячеек сетки
Нейронные сети, которые исследователи десятилетиями используют для выполнения различных вычислительных задач, состоят из тысяч или миллионов процессоров, связанных друг с другом. Каждый узел имеет соединения различной силы с другими узлами в сети. Поскольку сеть анализирует огромные объемы данных, сила этих соединений меняется по мере того, как сеть учится выполнять желаемую задачу.
В этом исследовании исследователи сосредоточились на нейронных сетях, которые были разработаны для имитации функции клеток решетки мозга, которые находятся в энторинальной коре головного мозга млекопитающих. Вместе с клетками места, найденными в гиппокампе, клетки сетки образуют мозговую цепь, которая помогает животным знать, где они находятся и как перемещаться в другое место.
Было показано, что ячейки места срабатывают всякий раз, когда животное находится в определенном месте, и каждая ячейка места может реагировать более чем на одно место. С другой стороны, ячейки сетки работают совсем по-другому. Когда животное перемещается в пространстве, таком как комната, ячейки решетки срабатывают только тогда, когда животное находится в одной из вершин треугольной решетки. Различные группы ячеек сетки создают решетки немного разных размеров, которые перекрывают друг друга. Это позволяет ячейкам сетки кодировать большое количество уникальных позиций, используя относительно небольшое количество ячеек.
Этот тип кодирования местоположения также позволяет предсказать следующее местоположение животного на основе заданной начальной точки и скорости. В нескольких недавних исследованиях исследователи обучали нейронные сети выполнять ту же задачу, известную как интеграция путей.
Чтобы научить нейронные сети выполнять эту задачу, исследователи вводят в них начальную точку и скорость, которая меняется со временем. Модель, по сути, имитирует активность животного, бродящего по пространству, и вычисляет обновленные позиции по мере его движения. По мере того, как модель выполняет задачу, можно измерить модели активности различных единиц в сети. Активность каждой единицы можно представить в виде паттерна возбуждения, аналогичного паттерну возбуждения нейронов в мозгу.
В нескольких предыдущих исследованиях исследователи сообщали, что их модели создавали единицы с паттернами активности, которые точно имитируют паттерны возбуждения ячеек сетки. Эти исследования пришли к выводу, что представления, подобные ячейкам сетки, естественным образом возникнут в любой нейронной сети, обученной выполнять задачу интеграции пути.
Однако исследователи Массачусетского технологического института получили совсем другие результаты. Проанализировав более 11 000 нейронных сетей, которые они обучили интеграции путей, они обнаружили, что, хотя почти 90 процентов из них успешно усвоили задачу, только около 10 процентов этих сетей генерировали паттерны активности, которые можно было бы классифицировать как подобные ячейкам сетки. . Это включает в себя сети, в которых даже только одно устройство получило высокий балл сетки.
По словам команды Массачусетского технологического института, более ранние исследования с большей вероятностью генерировали активность, подобную ячейкам сетки, только из-за ограничений, которые исследователи закладывают в эти модели.
«В более ранних исследованиях была представлена история о том, что если вы обучаете сети интегрировать пути, вы получите ячейки сетки. Что нам нужно «Вместо этого вы должны сделать длинную последовательность выбора параметров, которые, как мы знаем, несовместимы с биологией, а затем в небольшой части этих параметров вы получите желаемый результат», — говорит Шеффер.
Больше биологических моделей
Одно из ограничений, обнаруженных в более ранних исследованиях, заключается в том, что исследователям требовалось, чтобы модель преобразовывала скорость в уникальное положение, сообщаемое одним блоком сети, который соответствует ячейке места. Чтобы это произошло, исследователи также требовали, чтобы каждая клетка места соответствовала только одному местоположению, а биологические клетки места не работают так: исследования показали, что клетки места в гиппокампе могут реагировать на до 20 различных мест, а не только на одно.
Когда команда Массачусетского технологического института скорректировала модели так, чтобы ячейки мест были больше похожи на биологические ячейки мест, модели по-прежнему могли выполнять задачу интеграции пути, но они больше не производили активность, подобную ячейкам сетки. Активность, подобная сетке, также исчезла, когда исследователи проинструктировали модели генерировать различные типы выходных данных о местоположении, такие как местоположение на сетке с осями X и Y или местоположение в виде расстояния и угла относительно исходной точки.
«Если единственное, о чем вы просите эту сеть, — это интегрировать пути, и вы предъявляете ряд очень специфических, не физиологических требований к блоку считывания, тогда можно получить ячейки сетки», — говорит Фите. «Но если вы ослабите любой из этих аспектов этого блока считывания, это сильно ухудшит способность сети создавать ячейки сетки. На самом деле, обычно они этого не делают, хотя и решают задачу интеграции путей».
Следовательно, если бы исследователи еще не знали о существовании ячеек сетки и управляли моделью для их создания, маловероятно, чтобы они появились как естественное следствие обучения модели.
Исследователи говорят, что их результаты показывают, что при интерпретации моделей нейронных сетей мозга требуется большая осторожность.
«Когда вы используете модели глубокого обучения, они могут быть мощным инструментом, но нужно быть очень осмотрительным в их интерпретации и в определении того, действительно ли они делают прогнозы de novo или даже проливают свет на то, что именно оптимизирует мозг. ", - говорит Фите.
Кеннет Харрис, профессор количественной неврологии в Университетском колледже Лондона, надеется, что новое исследование побудит нейробиологов быть более осторожными при определении того, что можно показать с помощью аналогий между нейронными сетями и мозгом.
«Нейронные сети могут быть полезным источником прогнозов. Если вы хотите узнать, как мозг выполняет вычисления, вы можете обучить сеть выполнять их, а затем проверить гипотезу о том, что мозг работает таким же образом. Подтвердится гипотеза или нет, вы узнаете что-то новое», — говорит Харрис, не участвовавший в исследовании. «Эта статья показывает, что «постдиктион» менее эффективен: нейронные сети имеют много параметров, поэтому заставить их воспроизводить существующий результат не так уж удивительно».
Исследователи Массачусетского технологического института говорят, что при использовании этих моделей для прогнозирования работы мозга важно учитывать реалистичные, известные биологические ограничения при построении моделей. Сейчас они работают над моделями ячеек сетки, которые, как они надеются, позволят более точно предсказать, как работают ячейки сетки в мозгу.
«Модели глубокого обучения дадут нам представление о мозге, но только после того, как вы введете в модель много биологических знаний», — говорит Хона. «Если вы используете правильные ограничения, то модели могут дать вам решение, похожее на мозг».
Исследование финансировалось Управлением военно-морских исследований, Национальным научным фондом, Фондом Саймонса через сотрудничество Саймонса по глобальному мозгу и Медицинским институтом Говарда Хьюза через Программу преподавателей факультета. Микаил Хона получил поддержку MathWorks Science Fellowship.
No comments:
Post a Comment