Абстрактный
Недавние события выдвинули исследования РНК в центр внимания. Продолжающиеся открытия РНК с неожиданными разнообразными функциями в здоровых и больных клетках, такие как роль РНК как источника и средства противодействия инфекции тяжелого острого респираторного синдрома коронавируса 2, разжигают новую страсть к пониманию этой функционально и структурно универсальной молекулы. Хотя структура РНК является ключом к функционированию, многие фундаментальные характеристики структуры РНК понимаются неправильно, и состояние РНК по умолчанию часто рассматривается и изображается как одна гибкая нить. Цель этой точки зрения — помочь скорректировать ментальные модели, вооружить сообщество для лучшего использования фундаментальных аспектов структурной информации РНК в новых механистических моделях, улучшить экспериментальный дизайн для проверки этих моделей и уточнить интерпретацию данных. Мы обсудим шесть основных наблюдений, посвященных внутренней природе структуры РНК и тому, как включить эти характеристики для лучшего понимания структуры РНК. Мы также предлагаем некоторые идеи для будущих усилий, чтобы сделать проверенную информацию о структуре РНК доступной и легко используемой всеми исследователями.
Исследования РНК процветают. Открытия новых РНК происходят часто, репертуар РНК-зависимых биологических функций расширяется, и разрабатываются все более мощные РНК-центрические методы. Поток данных продолжает подавляющим большинством подтверждать идею о том, что функция любой РНК всегда до некоторой степени определяется ее структурой, и исследователи стремятся интегрировать роль структуры в свое понимание биологии РНК. Пандемия, вызванная РНК-коронавирусом, тяжелым острым респираторным синдромом, коронавирусом 2, горько напомнила миру, что РНК является мощным агентом как болезней, так и терапевтических средств — РНК — это «молекула из списка лучших».
Изучению РНК и ее структуры суждено расширяться, но, к сожалению, иногда это быстрое расширение сопровождается потерей общих знаний о важных фундаментальных свойствах структуры РНК. Заблуждения и ложные предположения укореняются, когда игнорируются ключевые свойства РНК. Твердое общее понимание структуры РНК важно для разработки строгих механистических гипотез, разработки экспериментов для их проверки и получения надлежащих интерпретаций. Сейчас больше, чем когда-либо, наше сообщество должно стремиться думать и говорить о структуре РНК таким образом, чтобы отражать ее истинное поведение. Это имеет практические преимущества: например, ученые Moderna продемонстрировали важность структуры мРНК для стабильности и, следовательно, эффективности РНК, лежащей в основе их вакцины (1).
Сравните, например, свои мысленные образы матричной РНК (мРНК) и рибосомной РНК (рРНК). Многим первый кажется волнистой удлиненной линией, тогда как последний имеет сложную и определенную архитектуру с парами оснований. Подразумевается, что рРНК структурирована, а мРНК — нет, но представляет собой образ мРНК в виде «мягких спагетти», основанный на данных, подтверждающих отсутствие структуры внутри РНК, кодирующей белок, или же он основан на недостатке данных, укоренившихся предположениях, а "предания"? Правильно ли думать о РНК как о по своей природе протяженной, гибкой и «неструктурированной», за исключением особых случаев?
Общепринятое представление о структуре РНК по умолчанию, вероятно, несколько устарело с тех пор, когда ученые рассматривали РНК в первую очередь как временного мессенджера между ДНК и компактно свернутыми белками. В этой парадигме белки и ДНК выполняли работу, обусловленную структурой, в то время как мРНК представляла собой в основном линейную молекулу-шаблон без какой-либо необходимой локальной структуры или структуры более высокого порядка. Хотя известно, что некоторые высокоспециализированные молекулы РНК (например, транспортная РНК [тРНК], рРНК, рибозимы, рибопереключатели и т. д.) принимают функциональные структуры, они, вероятно, воспринимались как исключения из нормы. По умолчанию состояние большинства РНК, вероятно, предполагалось растянутым, гибким и «неструктурированным». С открытием определенных и важных структур в различных РНК, включая мРНК, из всех доменов жизни и из вирусов (2–5), почему эта предвзятость часто сохраняется? Студенты рассказали нам, что формальное изучение структуры РНК и ее прямого отношения к функциям встречается редко. В его отсутствие человеческое восприятие, вероятно, формируется тем, что мы постоянно видим и слышим (6). Когда изображают молекулы жизни, РНК часто изображают волнистой линией, белки по умолчанию рисуют компактными глобулярными объектами, а ДНК — структурированной двойной спиралью. Мы утверждаем, что просмотр этих стандартных карикатур неоднократно укрепляет предположения о структурных состояниях этих молекул по умолчанию.
Точно так же то, как обсуждается структура РНК, вероятно, влияет на мышление. Термины «структурированная» или «неструктурированная» РНК часто используются для обозначения строгой бинарной демаркации, где «структура» используется как синоним «спаривания Уотсона-Крика», хотя структура РНК требует других типов взаимодействий. Хотя алгоритмы предсказания вторичной структуры РНК могут быть полезными и мощными, часто их рассматривают как черные ящики, вывод которых считается правильным, или как методы определения того, какие РНК «структурированы», а какие нет. Использование более детального и описательного языка и лучшее понимание ограничений методов прогнозирования и определения структуры РНК может оказать сильное положительное влияние на эту область.
Здесь мы рассмотрим шесть фундаментальных свойств структуры и динамики РНК, которые могут быть неочевидными, но рассмотрение которых, как мы надеемся, будет способствовать более глубокому пониманию РНК. Мы стремимся вновь подчеркнуть некоторые частично забытые знания, развеять несколько мифов о природе структуры РНК и предложить некоторые передовые методы изображения и обсуждения РНК. Мы также предлагаем рекомендации по использованию автоматически сгенерированных предсказаний структуры РНК, критерии для руководства и сравнения различных типов исследований структуры РНК, а также направления, в которых новые инструменты или общие ресурсы будут широко полезны. Обратите внимание, что эта точка зрения не предназначена для полного обзора современной или исторической литературы по этим темам, а скорее является отправной точкой для индивидуального исследования. Наша цель — дать исследователям из всех дисциплин возможность лучше интегрировать знания о структуре РНК в свою работу. rk и, возможно, подтолкнуть к новым размышлениям о взаимосвязи между структурой и функцией РНК.
Стекинг как драйвер структуры РНК
Обзор некоторых основных физических характеристик РНК полезен для понимания структуры РНК. Внутри нити РНК отрицательно заряженная рибозо-фосфатная цепь, составляющая две трети массы нуклеотида, создает стерические и электростатические ограничения на конформацию остова. Основания, на долю которых приходится оставшаяся треть массы, представляют собой плоские ароматические кольца, украшенные частично заряженными донорами и акцепторами водородных связей. Таким образом, каждая мономерная нуклеотидная единица содержит заряженные, полярные и ароматические группы, которые могут вступать в различные типы взаимодействий с водой, ионами, аминокислотами, малыми молекулами и другими нуклеотидами. Другими словами, в своей обычной водной среде нуклеотиды РНК очень социальны — они созданы для взаимодействия друг с другом (7, 8).
Осознание того, что каждый нуклеотид в цепи РНК может благоприятно взаимодействовать с любым другим нуклеотидом, имеет решающее значение для размышлений о структуре РНК и о том, чем она отличается от структуры белка. В белках различные характеристики боковой цепи означают, что некоторые из 20 аминокислот более благоприятно взаимодействуют друг с другом; некоторые легче размещаются внутри складок (например, фенилаланин из-за его ароматического кольца), в то время как другие находятся на поверхности, взаимодействующей с растворителем (например, заряженные аминокислоты). Биохимики регулярно испытывают влияние типа и распределения аминокислот на растворимость данного белка. Напротив, хотя РНК содержит плоское ароматическое основание в каждом звене своей цепи, РНК растворима в соленой воде. Этот кажущийся парадокс разрешается, потому что нековалентные взаимодействия заставляют основания РНК укладываться друг на друга, открывая их заряженные экзоциклические группы молекулам воды и ионам в водной среде, что приводит к «сольватации» РНК (9, 10).
Удобные и полезные представления РНК (и ДНК) в виде шара и палочки или «лестницы» в популярных мультипликационных изображениях обычно показывают «пространство» между основаниями внутри спирали. На самом деле основания укладываются как монеты в рулон без пространства между ними для растворителя (рис. 1 и 2А). Сложенные основания отстоят друг от друга примерно на 3,4 Å, потому что все атомы углерода, азота и кислорода имеют ван-дер-ваальсовы радиусы около 1,7 Å, и эти тесные взаимодействия в сочетании с остовными ограничениями создают знакомые нам спиральные конформации (7, 9, 11). Таким образом, спиральная структура РНК (и ДНК) не индуцируется спариванием Уотсона-Крика. Скорее, внутри индуцированного стэкингом спирального расположения пары оснований могут собираться в спирали А-формы или другие структурные элементы (12). Таким образом, чтобы понять структуру РНК, необходимо понять укладку оснований.
Каковы экспериментальные доказательства того, что стэкинг оснований управляет структурой РНК? Начиная с 1950-х годов биофизические исследования олигонуклеотидов РНК в растворе показали, что неспаренные основания укладываются в спиральные конфигурации. Даже одиночный динуклеотид АрА принимает «начало одноцепочечной спирали» (13). Эта спираль была смоделирована в 1975 г. на основе кристаллической структуры ApApA (рис. 2B) (14). На самом деле полиаденозин [поли(А)] образует параллельную двойную спираль, хотя и не может образовывать пары Уотсона-Крика. Об этой «второй двойной спирали» впервые сообщили Уотсон и Крик в 1961 г. (рис. 2А) (15), а ее структура была подтверждена много десятилетий спустя (рис. 2С) (16).
Врожденная укладка оснований, приводящая к спиральным конформациям, не является биофизической случайностью, но является ключом к биологии (17). Например, 3'-поли(А)-хвост, который регулирует стабильность эукариотической мРНК, распознается ферментами деаденилазы в первую очередь на основании характеристик его стэкинга (рис. 2D) (18, 19), тогда как в других случаях его структура может быть нарушена (рис. 2Д) (20). Точно так же исследователи РНК регулярно наблюдают и отслеживают эффекты стекинга оснований в лаборатории: термическая денатурация РНК (или ДНК) приводит к увеличению поглощения ультрафиолетового (УФ) излучения, потому что по мере денатурации молекулы стекинг оснований уменьшается (21).
«Внутренне структурированный» не означает «статичный»
В детских книгах Барбапапа 1970-х годов истории вращались вокруг красочных улыбающихся персонажей, похожих на капли, которые принимали всевозможные формы, в свою очередь, качели, музыкальный инструмент, лодку, дерево, что угодно, чтобы развлечь детей. Точно так же, хотя РНК имеет внутреннюю структуру, ее конформация может изменяться во многих временных масштабах, от наносекунд до миллисекунд и более, в зависимости от условий окружающей среды или присутствия лигандов (22–24). Эта встроенная динамика не делает РНК «неструктурированной»; они являются частью его структуры и, следовательно, его функции. Конформация РНК диктуется термодинамическим ландшафтом, который зависит от последовательности РНК и условий. В зависимости от характера ландшафта данная РНК заполняет ансамбль конформаций различной компактности, стабильности и гибкости. По мере увеличения длины РНК увеличивается сложность ландшафта и количество возможных неидентичных состояний, но предпочтительные состояния остаются. Описание структуры РНК (как и любой молекулярной структуры) как состоящей из конформационных ансамблей, диктуемых статистической термодинамикой, не ново, но его стоит запомнить.
В пределах данного ландшафта свободной энергии наиболее термостабильные складки заселяют долины; области выше соответствуют менее предпочтительным структурам. Для некоторых последовательностей РНК одна более глубокая лунка, соответствующая очень предпочтительной конформации, предотвращает частую выборку других состояний (рис. 3). Часто это нативное биологически релевантное состояние, и последовательное свертывание в это состояние выбирается эволюцией (25–28). Однако на дне глубокого колодца могут быть неглубокие углубления, позволяющие «шевелить» или «изгибать» нативную структуру в биологических условиях. Примерами являются зрелые полностью свернутые тРНК: их общая L-образная форма сохраняется, но они могут изгибаться, изгибаться или подвергаться локальным структурным изменениям, необходимым для прохождения через рибосому или взаимодействия с родственными им аминоацилсинтетазами (см. фильм S1 в ссылке 29). (30). Для других РНК в ландшафте может быть несколько глубоких ям, представляющих более одной предпочтительной отдельной конформации, которые могут преобразовываться друг в друга. В некоторых случаях эти конформации могут представлять собой одно или несколько «неправильно свернутых» состояний или стабильных промежуточных продуктов (31–33). Вместо этого некоторые последовательности РНК могут иметь более плоские складчатые ландшафты или более плоские области внутри более крупных ландшафтов с несколькими неглубокими углублениями. С этими РНК некогерентная укладка приводит к множеству легко взаимопревращающихся временных структур РНК, но не к отсутствию структуры.
Когда РНК рассматривается как потенциальная смесь конформаций, становится очевидной неадекватность дихотомии «структурированная/неструктурированная РНК». «Структурированные» РНК, которые принимают одно густонаселенное состояние, далеки от статичности. Точно так же, чтобы РНК была действительно «неструктурированной» в полностью расширенном смысле, ландшафт должен быть по существу плоским без предпочтительного состояния. Это нереально для РНК, так как потребовало бы неблагоприятного разрыва вездесущих внутримолекулярных взаимодействий, таких как стэкинг и водородные связи. Даже если возможное количество неидентичных состояний обычно увеличивается с длиной РНК, в целом более благоприятное коллапсированное состояние и, вероятно, некоторые специфические состояния будут более заселены.
Представление о РНК как о динамическом ансамбле взаимопревращающихся конформаций имеет важные функциональные и практические последствия (34, 35). В частности, конформационный ландшафт данной РНК может измениться при изменении условий, например, при изменении концентрации ионов, изменении pH, присутствии лигандов, взаимодействии с белками или другими молекулами, а также при химических модификациях или мутациях нуклеотидов (рис. 3). Однонуклеотидные варианты могут нарушать конформационный ансамбль, возможно, нарушая нативную биологически значимую структуру или благоприятствуя состояниям неправильной укладки, что приводит к заболеванию (36, 37). Кинетика синтеза РНК может привести к структурам РНК, которые не обязательно являются наиболее стабильными в пределах всего термодинамического ландшафта («котранскрипционная укладка»), а большие РНК могут иметь сложные пути укладки с промежуточными стадиями (38-40). Связывание лиганда с РНК часто происходит за счет захвата определенной конформации ансамбля, в большей степени, чем за счет индуцирования новой конформации (41, 42). Еще раз иллюстрируя преимущества рассмотрения РНК как популяции состояний, биоинформатики показали, что данные химического зондирования часто более надежно объясняются совокупностью различных вторичных структур, чем одной (34, 43–45).
РНК — это компактная молекула
Основания не «знают», в какой РНК они находятся (мРНК, рРНК, тРНК, малая интерферирующая РНК, длинная некодирующая РНК и т. д.). Термодинамически для них во всех случаях выгодно накладываться друг на друга и, возможно, образовывать водородные связи с образованием структуры, даже если только временно. Все типы оснований могут складываться и образовывать термодинамически выгодные водородные связи друг с другом, с сахаро-фосфатным остовом и с растворителем. Эти комбинированные взаимодействия заставляют одну цепь РНК по своей природе принимать самоассоциирующееся состояние в водных биологических условиях, зависящее от таких факторов, как температура. Когда нить загибается сама на себя, это приводит к общему уплотнению молекулы по сравнению с полностью растянутым состоянием.
Некоторые недавние доказательства компактности РНК были получены в результате картирования глобальной структуры, которое показало, что от 30 до 40% дуплексов РНК в живых клетках формируются из последовательностей, отстоящих друг от друга более чем на 200 нуклеотидов (46). Компактность и дальнее спаривание (47) в сочетании с модульностью РНК (35, 48, 49) и увеличением размера РНК со временем за счет аккреции (50, 51) приводят к тому, что 5'- и 3'-концы любой природная РНК находится в относительно близком пространственном соседстве (52–55). Для создания расширенного состояния, в котором часто изображают РНК, потребуется затрата энергии. Интересно, что аналогичная дихотомия существует между нашими схематическими изображениями белков с N- и C-концами на обоих концах горизонтальной линии, тогда как на самом деле концы находятся в пространственной близости через белковые структуры (56).
На первый взгляд может показаться, что представление о вездесущей самоассоциации и компактности РНК противоречит исследованиям, показавшим низкую степень структуры в кодирующих областях большинства мРНК в живых клетках (57, 58). Однако эти наблюдения на самом деле согласуются с идеей, что рибосомы, хеликазы или др. ремоделирующие белки РНК частично и временно раскручивают изначально структурированные области (57, 59, 60). В самом деле, когда трансляция ингибируется в живых клетках, мРНК претерпевают уменьшение своей общей сквозной длины (61, 62). Когда необходимо получить доступ к РНК, белкам может потребоваться «работать над открытием» внутренней структуры РНК.
Пара Уотсон-Крик важна, но немного переоценена
Спаривание оснований Уотсона-Крика важно, часто воспринимается как отличительная черта структуры РНК, и поэтому РНК со многими потенциальными парами оснований Уотсона-Крика считается «высокоструктурированным». Следует ли использовать спаривание Уотсона-Крика как синоним «структуры РНК»? На самом деле, в большинстве случаев складчатых трехмерных (3D) структур РНК пары, отличные от Watson-Crick, являются критическими для создания третичных взаимодействий, которые стабилизируют функциональную конформацию (Fig. 4). Эта информация теряется при типичном представлении РНК в виде стеблей, разделенных пузырьками и петлями «неспаренных» оснований, что часто происходит из алгоритма предсказания структуры РНК (рис. 1 и 4 и автоматические предсказания вторичной структуры РНК).
Чрезмерный акцент на парах Уотсона-Крика в структуре РНК, возможно, имеет несколько причин. Большинство из нас узнали о ДНК раньше, чем о РНК. ДНК редко существует без комплементарной цепи и, следовательно, образует двухцепочечные спирали с парами оснований Уотсона-Крика. Отклонения от этих «канонических» пар часто называют «несоответствиями», которые создают нестабильность, что является неправильным названием для структур РНК, где пары, отличные от Уотсона-Крика, являются ключевыми для фолдинга и связывания с белками или другими лигандами (63–65). Аналогичным образом, в случае с ДНК полезно учитывать содержание GC для оценки общей стабильности двойных спиралей, как это обычно делается при разработке гибридизирующих праймеров в лаборатории. Однако то же самое мышление не имеет такого смысла для неохарактеризованной РНК, если только не известно априори, что большинство нуклеотидов участвуют в парах Уотсона-Крика. Другими словами, содержание GC не является надежным предиктором «высокоструктурированных» РНК.
В целом тенденция сосредотачиваться на парах Уотсона-Крика может быть связана с тем фактом, что они являются основой гибридизации нуклеиновых кислот и что их легче идентифицировать, рисовать и рационально мутировать. Выравнивание гомологов последовательностей РНК более прямолинейно, когда рассматриваются только пары Уотсона-Крика, но на самом деле именно отклонения от комплементарности наиболее полезны для уверенного определения и выравнивания вторичных структур. Точно так же вычисление наиболее термостабильной предсказанной вторичной структуры данной последовательности основано на расчетах свободной энергии, основанных в основном на максимизации количества пар Уотсона-Крика в соответствии с измеренными параметрами «ближайших соседей» (66, 67). Однако состояние с наиболее предсказанными парами Уотсона-Крика может не отражать истинную биологически значимую вторичную структуру (см. Автоматические предсказания вторичной структуры РНК).
Третичное спаривание Уотсона-Крика дальнего действия часто представляют как движущую силу объединения дистальных частей структуры РНК, но в целом стэкинг оснований де-факто является первичным средством пространственной организации глобальной складки РНК. Укладка оснований и спаривание Уотсона-Крика создают стопки непрерывных и прерывистых спиралей, которые определяют эту вторичную структуру РНК. Однако не-Watson-Crick паттерны спаривания и укладки в спиральных соединениях и внутренних петлях формируют трехмерную архитектуру, которая диктует углы возникающих спиралей (сравните углы H7 и H34 на рис. 1) (35, 68-70). В результате определенные части РНК располагаются в пространстве так, чтобы легко устанавливать взаимодействия, часто с участием нуклеотидов, которые далеко друг от друга по последовательности, но не в трех измерениях. Независимо от того, включают ли эти взаимодействия пары оснований Уотсона-Крика (например, в псевдоузлах, которые возникают при спаривании оснований одноцепочечной области в петле и комплементарной последовательности в другом месте той же РНК) или другие благоприятные взаимодействия, партнерские области в пределах одной РНК могут взаимодействовать только в том случае, если структура между ними позволяет это.
Экспериментальные доказательства того, что глобальная складка предшествует спариванию оснований, находящихся далеко друг от друга в последовательности, получены, когда увеличение концентрации катионов (таких как K+ и Mg2+) восстанавливает функцию РНК, в которой спаривание оснований псевдоузлов нарушено мутациями (71, 72). ). Это происходит потому, что снижение конформационной стабильности в результате потери пар оснований компенсируется повышением стабильности общей архитектуры, вызванным ионами металлов, что диктуется специфическими структурами стэкинга и Н-связей в петлях, соединениях и выпуклостях. (73, 74). Глядя на это под этим углом, образование псевдоузла не создает глобальной складки; скорее, псевдоузел стабилизируется за счет складывания других элементов, которые сближают две дополнительные последовательности в пространстве.
Пейринг, не относящийся к Уотсону и Крику, очень недооценен
Парные области Уотсона-Крика составляют основу транскрипции, трансляции и репликации РНК. Когда они встречаются между разными молекулами, они обеспечивают код, который удобно расшифровывать ферментами. Спаривание Уотсона-Крика важно для роли РНК как носителя аналоговой информации, но его важность меняется в трехмерных структурах свернутых молекул РНК. Парные спиральные области Уотсона-Крика обычно действуют как прокладки с правильными геометрическими свойствами, необходимыми для позиционирования структурных элементов, стабилизированных парами, отличными от пар Уотсона-Крика. В свернутой РНК «холодными» частями являются изгибы, повороты и другие структурные мотивы, которые поддерживают глобальную складку или связывают белок или другой лиганд (75). Эти элементы основаны на парах, отличных от Уотсона-Крика (рис. 1 и 4), которые превосходят пары Уотсона-Крика по разнообразию на 11: 1 (76). Многие функции РНК помимо линейного носителя информации включены и зависят от спаривания, отличного от Уотсона-Крика; РНК является тем, чем она является, из-за этих взаимодействий.
Хотя верно, что изолированные пары, отличные от Watson-Crick, дестабилизируют внутри спиралей A-формы, в равной степени верно и то, что пары, отличные от Watson-Crick, образуют благоприятные, специфические и необходимые взаимодействия в специфических структурных контекстах (77). Не-W Пара Атсона-Крика в спирали может дестабилизировать эту индивидуальную спираль, но сделать возможными третичные взаимодействия, которые обеспечивают общую стабилизацию структуры. Учитывая то, что было известно о структуре РНК за последние четыре десятилетия, мы утверждаем, что разумно воздерживаться от приравнивания наличия пар, отличных от Уотсона-Крика, к отсутствию структуры; подразумевая, что РНК со многими парами, отличными от Уотсона-Крика, обязательно «нестабильна», неверно без дополнительной информации.
Не-Уотсон-Криковские пары в сочетании со спиральной укладкой порождают структурные мотивы, которые обеспечивают строительные блоки многих структур более высокого порядка, включая ультрастабильные тетрапетли и их рецепторы, изгибы, Е-петли и т. д. В то время как многие возможные не-петли Пары Уотсона-Крика кажутся пугающими, для описания, обсуждения и осмысления этих критических взаимодействий была принята хорошо разработанная классификация, номенклатура и система символов (76). Мы призываем сообщество РНК ознакомиться с этими альтернативными парами и богатыми структурными возможностями, которые они открывают, и избегать чрезмерного упрощения терминологии пар оснований «каноническая»/«неканоническая» в пользу более описательной и точной.
Что касается пар, отличных от Уотсона-Крика, использование точного языка поможет постоянно обновлять ментальные рамки. Важность посттранскрипционных химических модификаций вновь подчеркивается (78, 79), а такие явления, как таутомерия оснований и протонирование, остаются недостаточно изученными (80). Поскольку эти события могут проявлять свои эффекты в контексте альтернативных схем водородных связей и спаривания оснований, их биологические эффекты полностью понятны только в контексте взаимодействий, отличных от Уотсона-Крика.
Автоматические предсказания вторичной структуры РНК: будьте осторожны!
Когда исследователи сталкиваются с новой последовательностью РНК, они обычно «складывают» ее. В течение нескольких секунд появляется удобный прогноз вторичной структуры этой РНК с наименьшей предполагаемой свободной энергией, вычисленный с помощью алгоритма, основанного на термодинамике. К сожалению, часто эти выходные данные Mfold (или RNAfold, Sfold и других подобных инструментов (81–83)) представляются не как прогноз, являющийся результатом алгоритма, включающего предположения, а как представление истинной структуры. Альтернативные возможности спаривания с теоретически более высокими свободными энергиями обычно игнорируются, и предсказание вершины может даже распространяться в литературе без подтверждающих доказательств. Опасность рассмотрения только структуры с наименьшей свободной энергией и представления ее как вторичной структуры конкретной РНК заключается в том, что сообщество в конечном итоге принимает непроверенную возможность за чистую монету.
К сожалению, результаты программ складывания часто заменяют тщательное экспериментальное определение вторичной структуры. Программное обеспечение для предсказания вторичной структуры РНК, основанное на строгих измерениях стабильности пар оснований в различных контекстах ближайших соседей (84, 85), является ценным инструментом для быстрой оценки потенциального спаривания Уотсона-Крика и создания новых идей о структуре РНК. Однако они считают, что все нуклеотиды с одинаковой вероятностью могут быть вовлечены в элементы вторичной структуры, что часто приводит к ошибочным предположениям о парах оснований (86). Кроме того, поскольку эти алгоритмы имеют тенденцию максимизировать предсказанное количество пар Уотсона-Крика (равное наименьшей предсказанной свободной энергии), они наиболее точны, когда РНК имеет много таких пар. Проблема в том, что не все РНК это делают.
Чтобы проиллюстрировать это, мы использовали несколько алгоритмов вторичной структуры с различными входными РНК, для которых была известна правильная вторичная структура, причем каждая РНК содержала разное количество пар Уотсона-Крика. Мы наблюдали сильную положительную корреляцию между точностью выходных моделей и количеством пар Уотсона-Крика в пределах известных структур (рис. 5; линейная регрессия R2 = 0,8 с использованием 17 последних структур РНК из банка данных белков [PDB]). Это верно независимо от размера, поскольку R2 ∼ 0, если те же данные были нанесены на график в зависимости от длины РНК. Это, казалось бы, тривиальное упражнение подчеркивает тот факт, что, поскольку алгоритмы предназначены для поиска пар Уотсона-Крика, точность результатов зависит от того, действительно ли эта РНК складывается, чтобы максимизировать количество таких пар. Поскольку априори неизвестно, верно ли это для данной РНК, точность полученной модели трудно оценить без дополнительных данных.
Таким образом, правильное использование программ вторичной структуры требует сочетания их с различными экспериментальными методами для пошагового определения фактической структуры (рис. 6). Они могут включать химическое зондирование как in vitro, так и в клетках (87-89) и сайт-направленный мутагенез, который обеспечивает вероятностную оценку вторичных структур. Методы многомерного зондирования объединяют эти два подхода в строгий экспериментальный подход, который предоставляет информацию о взаимодействиях между конкретными основаниями (90), а новые методы стремятся предоставить информацию о близости оснований, удаленных друг от друга по последовательности (например, ссылки 46, 91 и 92). . Кроме того, если гомологичные последовательности РНК доступны в достаточном количестве и разнообразии, сравнительное выравнивание последовательностей является очень мощным способом получения подтвержденных эволюцией доказательств для конкретного предсказания вторичной структуры (93). В конечном счете, истинная вторичная структура может быть подтверждена при определении трехмерной структуры. Кристаллография, ЯМР, а теперь и криоэлектронная микроскопия высокого разрешения (крио-ЭМ) представляют собой сливки, а ЯМР и крио-ЭМ также потенциально могут обнаруживать конформационные ансамбли и динамику (94). В целом, риск того, что модель вторичной структуры неверна, уменьшается по мере усилий, затрачиваемых на определение и тестирование модели (рис. 6).
Идти вперед
Обновление дискурса о РНК.
По мере того, как все больше коллег вступают в борьбу с исследованиями РНК, наша ответственность как сообщества РНК состоит в том, чтобы гарантировать, что РНК обсуждается таким образом, который отражает ее истинную природу. РНК — это далеко не «как ДНК, с некоторыми дополнительными вещами…», а обобщения и упрощения только затуманивают понимание. Например, как сообщество мы могли бы воздержаться от обозначения конкретной РНК как «высокоструктурированной», «структурированной» или «неструктурированной» и вместо этого выбрать конкретный язык, описывающий существующие наблюдения относительно ее структуры и динамики. Точно так же описание пар, отличных от Уотсона-Крика, как «несовпадений» и «неканонических пар» только распространяет ошибочное представление о том, что такие пары менее важны, чем пары Уотсона-Крика. Слово «несоответствие» также отрицает эволюционный путь, который привел к сохранению пары, отличной от Уотсона-Крика, в определенном положении. Пары G.G и AG, показанные на рис. 1 и 4, например, на самом деле идеально совпадают, поскольку РНК эволюционировали, чтобы поддерживать такие пары. Простой, но точный разговор о РНК поможет области исследований РНК продвинуться в полную силу.
Разработка удобных приложений для изображения РНК.
Неожиданно оказалось, что программное обеспечение для простого рисования вторичных структур РНК встречается редко. Существующие программы также имеют тенденцию рассматривать исключительно пары Уотсона-Крика (традиционно единственный признак «вторичной» структуры) и/или нацелены только на определенные семейства РНК [см., например, XRNA (http://rna.ucsc.edu/rnacenter/). xrna/xrna_faq.html), Forna (95) или RiboVision (96)]. Были разработаны инструменты, которые выводят пары отличных от Уотсона-Крика из трехмерной структуры (97, 98), но программное обеспечение для рисования обычно не включает способов легкого их изображения. Вообще говоря, ни один инструмент для рисования не зарекомендовал себя за пределами лаборатории, из которой он был создан, за исключением, пожалуй, Варны (99) и R2R (100). Для полного принятия исследовательским сообществом остается задача разработать инструмент, который был бы эффективным, но простым в использовании. Усилия в этом направлении были предприняты совсем недавно, например, с помощью RNAPDBee (101), RNA2Drawer (102), R2DT (103) и RNArtist (https://github.com/fjossinet/RNArtist).
Классификация прогнозов вторичной структуры по уровню достоверности.
Точное определение вторичной структуры РНК обязательно требует объединения данных нескольких методов и постоянного уточнения по мере поступления новых данных. Следовательно, мы предлагаем классифицировать модели вторичной структуры на основе четырех (или более) уровней достоверности: уровень 1 для совокупности непроверенных расчетных предсказаний, уровень 2 для моделей, дополнительно подтвержденных косвенными экспериментальными доказательствами структуры (такими как сайт-направленный мутагенез и химические или ферментативное зондирование), уровень 3 для структуры, полученной в результате ковариационного анализа, и уровень 4 для модели, полученной из решенной трехмерной структуры высокого разрешения и т. д. (рис. 6). Некоторые из существующих хранилищ, такие как Rfam (104) или NDB (105), среди прочих, могли бы участвовать в проверке, стандартизации, архивировании и распространении моделей вторичной структуры, что является нормой для последовательностей, выравниваний последовательностей РНК (которые определения основаны на вторичной структуре) и третичных структурах. Создание базы данных вторичной структуры позволит гармонизировать сообщество РНК вокруг основных ценностей для справедливого использования и отображения структурной информации.
Интеграция распространяемых знаний для надежных прогнозов.
Перекрестное сравнение и объединение всех доступных данных о конкретной РНК и родственных молекулах остается основным подходом для получения надежных прогнозов двумерной и, возможно, трехмерной структуры. Такой «метаанализ» обычно проводится опытными исследователями с использованием нескольких OLS и информационные центры а-ля RNACentral (106). Интеграция существующих инструментов поможет сделать имеющуюся информацию более доступной для более широкой группы неспециалистов. Возможно, это могло бы предотвратить распространение неверной или устаревшей информации о вторичной структуре, связать модели вторичной структуры с другими данными и стимулировать разработку согласованных способов отображения и проверки прогнозов вторичной структуры. Имеющиеся данные являются глубокими и богатыми, но они должны быть более доступными и лучше интегрированными; это расширит возможности использования структуры РНК для информирования дальнейших экспериментов и повысит доверие широкой общественности к исследованиям РНК.
Заключительные замечания
Пришло время встряхнуть некоторые предположения о РНК. Представление РНК в виде волнистой линии удобно, но когда удобство предает биологию, возникают недостатки. Каждая РНК способна к самоассоциации, и структурированные РНК не редкость, даже если структуры могут быть мимолетными, динамичными или измененными взаимодействующими белками. Простое, но точное представление и обсуждение РНК поможет области исследований РНК развиваться в полную силу. Это становится необходимостью, поскольку специалисты по РНК изучают РНК все большего размера и сложности, выполняющие разнообразные регуляторные или терапевтические функции. РНК стала мейнстримом, поэтому давайте позаботимся о том, чтобы свойства структуры РНК вернулись на передний план.
No comments:
Post a Comment