Мы разработали искусственный интеллект для выявления противовирусных соединений, которые заслуживают дальнейшего изучения в качестве возможных фармацевтических методов лечения COVID-19.
Соавторы:
Семих Кантюрк, Аман Сингх, Патрик Сент-Аман, Джейсон Берманн, доктор философии и коллеги из Zetane Systems
Свяжитесь с авторами по электронной почте [email protected].
Это сокращенная версия исследовательской статьи, которую вы найдете здесь на arXiv.
Все результаты являются предварительными и еще не прошли независимую экспертную оценку. Результаты, представленные в этой статье, не должны использоваться для принятия клинических решений, а также не для определения окончательного лечения COVID-19.
Наша работа направлена на обнаружение основных ассоциаций между аминокислотными последовательностями вирусных белков и противовирусными агентами, которые эффективны против них, с использованием технологии искусственного интеллекта искусственных нейронных сетей (ИНС). Затем мы используем паттерны, обнаруженные нашей ИНС, для выявления потенциальных противовирусных агентов, которые могут быть эффективны против сопоставимых аминокислотных последовательностей, обнаруженных в SARS-CoV-2, вирусе, находящемся в центре всемирной пандемии COVID-19. Мы использовали общедоступные источники данных, чтобы создать набор данных, который объединяет аминокислотные последовательности с антивирусными препаратами, которые, как известно, связаны с определенными вирусными аминокислотными последовательностями. Этот набор данных служил для обучения сетей с долгой краткосрочной памятью (LSTM) и сверточных нейронных сетей (CNN). Предварительные результаты нашей модели искусственного интеллекта позволяют получить возможные безопасные для человека препараты-кандидаты для лечения SARS-CoV-2, и поэтому заслуживают дальнейшего изучения. Наши предварительные результаты показывают, что бринцидофовир, тилорон, рапамицин, артесунат, цидофовир, валацикловир, лопинавир и ритонавир представляют значительный интерес, учитывая, что некоторые из этих результатов дополняют недавние результаты заслуживающих внимания клинических исследований, таких как « Тройная комбинация интерферона бета-1b, лопинавира – ритонавира и рибавирина в лечении пациентов, госпитализированных с COVID-19: открытое рандомизированное исследование фазы II », недавно опубликованное в Ланцет.
Фон
Технология искусственного интеллекта (ИИ) - недавнее дополнение к биоинформатике, которое показывает многообещающие возможности для оптимизации открытия фармакологически активных соединений ( Stephenson et al., 2019). Поддомен ИИ, машинное обучение, дает особые преимущества в определении того, как лекарства, эффективные в одном контексте, могут быть полезны в неизвестном клиническом контексте или против новой патологии (Napolitano et al., 2013). Эта технология работает, обнаруживая закономерности в том, как фармацевтическая молекула проявляет свою активность, связываясь с определенными участками биомолекулы, такими как сегмент белка.
Прошлые исследования теперь предоставляют значительный банк информации о взаимодействиях лекарств и биомолекул. Обучение моделей машинного обучения с помощью этих результатов может выявить закономерности, закономерности, которые затем служат для вывода и прогнозирования будущих результатов. Используя в качестве примера перепрофилирование лекарств, теперь мы можем обучить алгоритмы машинного обучения определять закономерности связывания антивирусных соединений с белками различных видов вирусов. Мы стремимся обучить модель искусственного интеллекта, чтобы при представлении протеома нового вируса было выявлено присутствие белковых сегментов, аналогичных тем, которые были выявлены в прошлых исследованиях. Окончательный результат модели ИИ - это наиболее подходящий прогноз относительно того, какие известные противовирусные препараты могут ассоциироваться с этими знакомыми белковыми сегментами.
Применение ИИ в биомедицинских исследованиях предоставляет новые средства для проведения in-silico исследовательских исследований и высокопроизводительных анализов с использованием уже доступной информации. Помимо извлечения большей пользы из прошлых исследований, исследователи могут разработать технологию искусственного интеллекта за относительно короткие периоды времени.
Эти преимущества представляют особый интерес в условиях нынешнего кризиса здоровья, связанного с COVID-19. Новизна вируса SARS-CoV-2 требует, чтобы мы выполняли медицинские вмешательства на основе прошлых наблюдений. Борьба с непредвиденной пандемией без известных методов лечения или вакцин и когда каждый день уносит тысячи жизней, время становится драгоценным товаром, которого не хватает.
Потенциал для быстрых инноваций от технологий искусственного интеллекта имеет первостепенное значение. Возможность проводить множество сложных анализов с помощью ИИ позволяет нам быстро исследовать идеи, которые могут помочь направить нас в правильном направлении для будущих исследований, которые, вероятно, принесут плодотворные результаты. Прогнозы, сделанные ИИ, также могут предоставить дополнительные доказательства в сочетании с менее надежными исследованиями, выполнение которых выполняется быстрее и практичнее. Это может предложить большую поддержку для принятия обоснованных решений, поскольку мы ждем завершения длительных, хотя и необходимых и строгих клинических испытаний терапевтических средств и вакцин. Как компания, специализирующаяся на искусственном интеллекте, мы представляем здесь наши попытки разработать модели искусственного интеллекта, которые могут направлять усилия по перепрофилированию существующих противовирусных препаратов в качестве терапевтических средств против COVID-19.
Данные
Поиск и подготовка
Для этого исследования мы использовали два основных источника данных. Первой базой данных была База данных DrugVirus (Andersen et al., 2020); DrugVirus предоставляет базу данных антивирусных агентов широкого спектра действия (BSAA) и связанных вирусов, которые они подавляют. База данных охватывает 83 вида вирусов и 126 противовирусных соединений, предоставляя информацию о статусе каждой пары соединение-вирус. Эти статусы делятся на восемь категорий, представляющих прогрессивные фазы экспериментальных и клинических испытаний лекарств: культуры клеток / совместные культуры; Первичные клетки / органоиды; Модель на животных; Клинические испытания, фаза I; Фаза II; Фаза III; Фаза IV и одобрено.
Вторая база данных - это Вирусный портал Национального центра биотехнологической информации (NCBI); по состоянию на апрель 2020 года в этой базе данных содержится примерно 2,8 миллиона белковых (аминокислотных) и 2 миллиона нуклеотидных последовательностей вирусов, хозяевами которых являются люди. Каждая строка этой базы данных содержит образец аминокислотной последовательности из исследования, а также метаданные, которые включают соответствующие виды вирусов.
Объединив эти две базы данных, мы соединили каждую аминокислотную последовательность со списком антивирусных препаратов, определенных как эффективные против видов, от которых произошла аминокислотная последовательность. Мы считали пару "лекарство-вирус" "эффективной" только в том случае, если она прошла фазу II или дальнейшие испытания препарата, что означает некоторый успех на людях.
Предварительная обработка
Изучив данные, мы обнаружили несколько повторяющихся или почти идентичных вирусных аминокислотных последовательностей, что ожидается, учитывая, что мы ожидаем, что наши модели используют это сходство между последовательностями одного и того же вида вируса. Чтобы уменьшить эту возможность использования и создать более сложную проблему, мы удалили повторяющиеся последовательности, которые принадлежали к одному виду и имели точно такую же длину. Это уменьшило размер набора данных примерно на 98%. Этот процесс удаления дубликатов также уменьшил количество аминокислотных последовательностей SARS-CoV-2 с 481 до 98.
Наша основная база данных также содержала несбалансированность классов в количестве раз, когда определенные виды вирусов появлялись в базе данных. Мы провели избыточную выборку редких вирусов (например, вирус Западного Нила: 175 последовательностей) и исключили очень редкие виды, которые составляют менее 0,5% доступных уникальных образцов в наборе данных (например, вирус Анд: 4 последовательности), и занижали выборку общих вирусов ( например, гепатит C: 16040 последовательностей). В результате была получена более скромная база данных, содержащая 30 479 аминокислотных последовательностей, с образцами каждого вируса в диапазоне 400–900. Мы сохранили размер набора данных небольшим как для упрощения обучения и проверки модели на ранних итерациях, так и для более плавной обработки дисбаланса данных.
Проблема классового дисбаланса возникла и в отношении противовирусных препаратов. Даже со сбалансированными классами вирусов количество раз, когда каждое лекарство встречалось в наборе данных, сильно варьировалось, потому что некоторые лекарства имеют широкий спектр и, следовательно, применяются к большему количеству вирусов, чем другие. Чтобы облегчить это, мы вычислили веса классов для каждого препарата в виде dict, который затем предоставили моделям во время обучения. Это позволило провести более справедливую оценку и более разнообразное распределение лекарств в соответствии с прогнозируемыми результатами.
На заключительном этапе обработки данных были созданы наборы для обучения и проверки. Мы решили настроить разбиение наборов данных двумя разными способами, что привело к двум различным экспериментальным установкам. Эксперимент I основан на стандартном рандомизированном разбиении 80% обучения / 20% проверки для основного набора данных.
Для более «сложной» установки, которую мы называем экспериментом II, мы разделили данные по видам вирусов; в этом случае мы заставили наши модели предсказывать лекарства для видов, на которых они не обучались, и определять знакомые субструктуры в белковых последовательностях, чтобы предлагать лекарства. В этой последней настройке мы также гарантировали, что последовательности COVID-19 всегда были в тестовом наборе в дополнение к трем другим вирусам, случайно выбранным из набора данных.
Модели
Растущее число исследований демонстрирует успех использования искусственных нейронных сетей (ИНС) в оценке биологических последовательностей при репозиционировании и перепрофилировании лекарств (см. Donner, Kazmierczak, and Fortney, 2018; Zeng et al., 2019). Предыдущая работа по обучению нейронных сетей на нуклеотидных или аминокислотных последовательностях была успешной с рекуррентными моделями, такими как закрытые повторяющиеся единицы (GRU), сети долгой краткосрочной памяти (LSTM) и двунаправленные LSTM (biLSTM), а также 1D свертки и 2D сверточные нейронные сети (CNN) (Lee and Nguyen, 2016; Hou, Adhikari, and Cheng, 2018). Мы сосредоточены здесь на этих сетевых архитектурах, где мы проводили наши эксперименты с LSTM с одномерными свертками и двунаправленными уровнями, а также с двумя CNN, которые различаются по своим уровням встраивания. Наши результаты CNN были получены из CNN без слоя встраивания из-за преимуществ производительности.
LSTM и 1D свертки
Токенизатор (keras.preprocessing.text.Tokenizer) использовался для кодирования последовательностей FASTA (которые представляют собой последовательности символов) в векторы, потребляемые сетью. Затем последовательности дополнялись нулями или обрезались до фиксированной длины 500, чтобы сохранить фиксированный размер ввода.
После обучения мы сохраняем модель и отправляем ее в среду Zetane, где мы можем проверить архитектуру модели и фильтры в интерактивной настройке (на рисунке 2 представлены сводные видео и изображения модели LSTM):
Сверточная нейронная сеть
Для CNN входные функции были мгновенно закодированы с использованием методов, аналогичных подходу токенизатора, где каждой аминокислотной последовательности присваивается целое число, за исключением того, что целые числа предопределены порядком алфавита / кодировки FASTA: это помогает в интерпретируемости при рассмотрении входных 2D-массивов как изображений. Входные данные также имеют фиксированную длину в 500 аминокислотных символов, в результате чего получаются изображения размером 500x28, где 28 - количество элементов в кодировке FASTA.
Мы снова сохраняем обученную модель и отправляем ее в среду Zetane, где мы можем проверить архитектуру модели и фильтры в интерактивной настройке, как показано на рисунке 4 (видео модели доступно здесь):
Настройка эксперимента
Мы проводили эксперименты с использованием моделей Keras и TensorFlow. Мы использовали двоичную кросс-энтропию (BCE), оптимизатор Адама и точность и отзыв в качестве показателей, поскольку точность, как правило, ненадежная метрика, учитывая дисбаланс классов и разреженный характер наших результатов. После обучения и проверки на проверочном наборе были сделаны прогнозы, а результаты были подвергнуты последующей обработке для интерпретируемости. При постобработке мы применили пороговое значение к выходным сигналам сигмовидной функции нейронной сети, где мы присвоили каждому лекарству вероятность быть потенциальным противовирусным средством для данной аминокислотной последовательности. После экспериментов с разными значениями мы остановились на пороговом значении 0,2.
Постобработка выводит список выбранных лекарств, а также соответствующие вероятности того, что лекарства будут «эффективными» против вируса с данной аминокислотной последовательностью.
В наших экспериментах мы также провели некоторую настройку гиперпараметров. Подмножество протестированных значений гиперпараметров:
- Скорость обучения: 1e-2, 1e-3, 1e-4
- Размер партии: 32, 64, 128
- Порог: 0,9, 0,7, 0,5, 0,2
- Количество эпох: от 5 до 20
- Максимальная длина последовательностей: 500
Обратите внимание, что в отношении этой первой итерации экспериментов объем настройки гиперпараметров, а также архитектур ИНС ограничены. В этом направлении есть возможности для улучшения.
Предварительные результаты
Эксперимент I. Разделение обучающих тестов 80% и 20%
В обычной настройке мы выполнили разделение на 80% / 20% на наши данные из 30 479 аминокислотных последовательностей. Мы основываем наши лучшие результаты на проверке F1-Score и графиках соответствующих показателей, которые показаны на рисунке 7.
Наши модели успешно справились с обычной задачей, получив 0,958 балла F1 в постановке задачи с несколькими классами. Это означает, что модели точно распознают вид вируса по аминокислотной последовательности белковых субструктур и с большой точностью правильно назначают ингибирующие противовирусные препараты. Эти удовлетворительные результаты позволили нам реализовать эксперимент II.
Эксперимент II: прогнозы относительно неизвестных видов вирусов
В этой более сложной настройке мы попросили модели предсказать ингибирующие препараты для видов вирусов, которые отсутствуют в обучающем наборе данных. Это означало, что модели не могли рекомендовать лекарства, «распознавая» вирус по аминокислотной последовательности, и поэтому при назначении лекарств им приходилось полагаться только на белковые субструктуры в последовательностях. В результатах, представленных на рисунке 8, набор тестов состоит из COVID-19, вируса простого герпеса 1, вируса астровируса человека и вируса Эбола, последовательности которых были удалены из обучающего набора.
Здесь мы видим, что у CNN были проблемы с конвергенцией. Точность явно ниже, чем у их аналогов при обычной настройке, хотя это, безусловно, ожидаемо. Теперь обратимся к фактическим предсказаниям последовательностей и попытаемся их интерпретировать.
Изучите, например, прогнозы по лекарствам для вируса простого герпеса 1 (HSV-1). Здесь мы видим, что наш CNN вполне успешен. В базе данных DrugVirus все лекарства, прошедшие Фазу II или дальнейшие испытания лекарств для вируса, наиболее предсказуемы CNN, что мы считаем очень обнадеживающим, учитывая, что наша модель ранее не видела последовательности HSV-1 (см. Таблицу 3).
Прогнозы на SARS-CoV-2
С некоторыми вариациями между ними, и LSTM, и CNN, похоже, сходятся на ряде лекарств: ритонавир, лопинавир (оба - фаза III для БВРС-КоВ) и тилорон (одобренный для БВРС-КоВ) - три основных кандидата в обоих. , в то время как бринцидофовир, рапамицин, цидофовир, валацикловир и ганцикловир занимают высокие места в обоих списках.
Большинство остальных препаратов также присутствует в обоих списках. LSTM более консервативен в своих прогнозах, чем CNN, а общее количество SARS-CoV-2 значительно ниже, чем для вируса простого герпеса 1 для обоих, что указывает на относительную неуверенность в части модели в прогнозировании SARS-CoV. -2 последовательности.
Обсуждение и дальнейшая работа
Объединяя общие методы машинного обучения и биомедицинских наук, исследовательское сообщество получает дополнительные стратегии для продвижения инноваций в области здравоохранения с постоянно растущей скоростью. Мы приводим лишь один пример многочисленных и разнообразных исследований, проводимых по всему миру в рамках согласованных усилий по смягчению внезапного кризиса общественного здравоохранения. Здесь мы подтверждаем заметные сильные стороны использования ИИ для выявления предварительных противовирусных препаратов. Имея ограниченные ресурсы, наша команда в Zetane Systems, обладающая опытом в области машинного обучения, разработки программного обеспечения и биомедицинских наук, смогла использовать общедоступные наборы данных для углубления знаний о возможных методах лечения ранее неизвестного вируса - и все это в течение полутора месяцев. согласованных усилий. Такая скорость и изобретательность демонстрируют, как небольшие исследовательские группы могут внедрять технологии искусственного интеллекта в периоды быстрых изменений и неопределенности.
Отметим, что текущее обсуждение наших результатов будет узким; временные ограничения ограничивают наши возможности для оценки наших результатов после исчерпывающего обзора научной литературы, посвященной противовирусным препаратам для лечения коронавирусов. Вместо этого мы сравниваем наши результаты с несколькими недавними публикациями, чтобы продемонстрировать сильные и слабые стороны этого исследования. Тем не менее, представленные здесь предварительные результаты обнадеживают и заслуживают дальнейшего изучения.
Для начала отметим, что наши модели искусственного интеллекта предсказывают, что некоторые противовирусные препараты, которые являются многообещающими в качестве лечения против БВРС-КоВ, могут также быть эффективными против SARS-CoV-2. К ним относятся противовирусный тилорон широкого спектра действия (Ekins et al., 2020) и препарат лопинавир (Yao et al., 2020), последний из которых сейчас проходит 4-ю фазу клинических испытаний для определения его эффективности против COVID-19 (Basha 2020). Это имеет смысл, учитывая, что оба являются коронавирусами и, следовательно, имеют высокую степень сходства в своих генетических последовательностях и структурах белков. Такие наблюдения с большой уверенностью позволяют предположить, что наши модели искусственного интеллекта могут распознавать надежные закономерности между конкретными противовирусными препаратами и видами вирусов, содержащими гомологичные аминокислотные последовательности в своем протеоме.
Дополнительные наблюдения, подтверждающие наши выводы, были обнаружены в исследовании, опубликованном в The Lancet за неделю до этой статьи (Hung et al., 2020). Это открытое рандомизированное исследование фазы 2 показало, что комбинированное введение препаратов интерферона бета-1b, лопинавира-ритонавира и рибавирина обеспечивает эффективное лечение COVID-19 у пациентов с легкими и умеренными симптомами. Обе наши модели искусственного интеллекта отметили два препарата в этом испытании (обратите внимание, что интерферон не входил в наши наборы данных). По количеству случаев (подсчет) модель CNN поставила ритонавир на 8-е место (вместе с летермовиром) и рибавирин на 9-е место; модель LSTM поставила ритонавир на 7-е место (вместе с лопинавиром, циклоспорином и рапамицином) и рибавирин на 9-е место (вместе с 7 другими соединениями). Также на первом месте в наших списках находится противомалярийный препарат артесунат, который сейчас проходит 2-ю фазу клинических испытаний на COVID-19. Такие наблюдения обнадеживают. Они предполагают, что модели искусственного интеллекта могут иметь значение для выявления потенциально терапевтических соединений, заслуживающих приоритетного внимания для расширенных клинических испытаний. Эти наблюдения дополняют растущее число наблюдений, подтверждающих использование технологии искусственного интеллекта для оптимизации поиска лекарств. С этой точки зрения наши модели искусственного интеллекта предполагают, что противовирусный бринцидофовир широкого спектра действия, например, может стать главным кандидатом для клинических испытаний COVID-19 в ближайшем будущем.
В приведенном здесь списке многообещающих противовирусных препаратов есть некоторые заметные расхождения с результатами новых исследований. Например, наши модели искусственного интеллекта не выделили широко доступный антипаразитарный препарат ивермектин. Одно исследование, опубликованное при завершении этой рукописи, показало, что ивермектин может ингибировать репликацию SARS-CoV-2 in vitro (Caly et al., 2020). Дальнейшие исследования потребуют оценки того, насколько исследования in silico с использованием ИИ сравниваются с другими методами исследования; действительно, ни один метод исследования не является универсальным.
Другое исследование, в котором проводится крупномасштабный опрос о репозиционировании лекарств для противовирусных препаратов SARS-CoV-2 (Riva et al.2020), демонстрирует, что прогнозы, сделанные с помощью наших моделей искусственного интеллекта, имеют заметные пределы. В этом исследовании был проведен скрининг библиотеки из почти 12 000 лекарств и выявлено шесть противовирусных препаратов-кандидатов от SARS-CoV-2, которые заслуживают дальнейшей клинической оценки. К ним относятся ингибитор киназы PIKfyve Апилимод, ингибиторы цистеиновых протеаз MDL-28170, Z LVG CHN2, VBY-825 и ONO 5334, а также антагонист CCR1 MLN-3897. Неудивительно, что наш AI модели не идентифицировали эти шесть соединений, потому что наши наборы данных не содержали их. Здесь мы наблюдаем хорошо известный факт, касающийся ИИ: технология настолько хороша, насколько хороши данные, используемые для ее создания. Таким образом, дальнейшие усилия по укреплению наших моделей искусственного интеллекта потребуют от нас включения растущего банка новых данных из новых результатов исследований в наши протоколы обучения моделям.
Что касается наших моделей искусственного интеллекта, лучшее извлечение признаков может значительно улучшить прогнозы, позволяя нашим моделям обнаруживать более тонкие подпоследовательности белка, которые могут хорошо ассоциироваться с антивирусными препаратами. Этот шаг включает улучшения за счет более совершенной инженерии данных и работы с экспертами в предметной области, знакомыми с прикладной биоинформатикой, чтобы лучше понять природу наших данных и найти способы улучшить наш конвейер обработки данных. Вот предложения по будущей работе, которая может улучшить производительность нашей модели искусственного интеллекта:
- Включение дополнительных анализов экспертами в предметной области может привести к лучшему пониманию противовирусных препаратов и белковых последовательностей, на которые они нацелены. Это одновременно поможет понять, на какие пептидные структуры нацелены лекарства, предлагаемые нашими моделями, и приведет к лучшему пониманию процесса принятия решений в наших моделях.
- Лучшая обработка дубликатов или «псевдодубликатов» может улучшить качество наборов данных. На данный момент дубликаты помечаются только по виду вируса и длине аминокислотной последовательности, хотя последовательности одинаковой длины, принадлежащие к одному и тому же виду, не обязательно идентичны. Мы можем улучшить наш текущий подход, используя меры сходства строк, такие как коэффициент Дайса, косинусное сходство, расстояние Левенштейна и т. Д.
- Возможный подход может заключаться в использовании векторизатора (например, векторизатора Tf-Idf) для извлечения функций в виде n-граммов (небольших последовательностей символов), который успешно решает аналогичные проблемы (Szalkai and Grolmusz, 2017). Другие методы обучения без учителя, такие как разложение по сингулярным значениям, также использовались для кодирования информации о последовательности и могут быть применимы в нашем исследовании (Wu et al., 1995).
Мы приветствуем конструктивные отзывы об этом исследовании и предлагаем открытый призыв к сотрудничеству с организациями, которые хотели бы использовать нашу технологию искусственного интеллекта для продвижения своих собственных исследований. Время имеет решающее значение в наших усилиях по борьбе с COVID-19. Быстрые результаты, полученные здесь, и знание того, что проводятся многочисленные исследования, должны дать нам некоторое утешение, зная, что лечение нынешней пандемии вполне доступно. Несомненно, наши согласованные усилия гарантируют, что все будет хорошо, или, как мы говорим, в нашем шее, ça va bienaller.
Заявленный конфликт интересов
Авторы заявляют, что они не получат какой-либо прямой финансовой выгоды от расследования любого данного фармацевтического соединения и предоставления отчетов о нем. Следующее исследование финансируется работодателем авторов, компанией Zetane Systems, которая производит программное обеспечение для технологий искусственного интеллекта, применяемых в промышленных и корпоративных контекстах.
Вклад авторов
Кантюрк написал рукопись; Кантюрк, Сингх и Сент-Амант провели все исследования и разработали технологию искусственного интеллекта; Берманн выполнил внутреннюю рецензию и краткий обзор литературы, отредактировал и внес свой вклад в написание окончательной рукописи.
Благодарности
Мы хотели бы поблагодарить администраторов DrugVirus и NCBI Virus Portal за предоставление наборов данных, которые являются центральными для этого исследования. Мы ценим комментарии к предварительным наброскам этой рукописи от доктора Тарика Дауды из Массачусетской больницы общего профиля, Института Броуда, Гарвардской медицинской школы.
использованная литература
[1] Н. Стивенсон и др., « Обзор методов машинного обучения в открытии лекарств», Current Drug Metabolism, vol. 20, нет. 3, стр. 185–193, 2019 г., DOI: 10.2174 / 1389200219666180820112457
[2] Ф. Наполитано и др., « Репозиционирование лекарств: подход к машинному обучению через интеграцию данных», Journal of Cheminformatics, vol. 5, вып. 30 июня 2013 г., DOI: 10.1186 / 1758–2946–5–30
[3] П. И. Андерсен и др., «Открытие и разработка безопасных для человека противовирусных агентов широкого спектра действия», International Journal of Infectious Diseases, vol. 93, стр. 268–276, февраль 2020 г., DOI: 10.1016 / j.ijid.2020.02.018
[4] Й. Доннер, С. Казмерчак, К. Фортни, «Перепрофилирование лекарств с использованием глубоких встраиваний профилей экспрессии генов», Mol. Фармацевтика, т. 15, вып. 10, стр. 4314–4325, октябрь 2018 г., DOI: 10.1021 / acs.molpharmaceut.8b00284
[5] X. Zeng, S. Zhu, X. Liu, Y. Zhou, R. Nussinov и F. Cheng, «deepDR: сетевой подход глубокого обучения к репозиционированию лекарств in silico», Bioinformatics , т. 35, нет. 24, стр. 5191–5198, декабрь 2019 г., DOI: 10.1093 / bioinformatics / btz418.
[6] Т. К. Ли и Т. Нгуен, Классификация семейств белков с помощью нейронных сетей, 2016. URL: https://cs224d.stanford.edu/reports/LeeNguyen.pdf.
[7] Дж. Хоу, Б. Адхикари и Дж. Ченг, «DeepSF: глубокая сверточная нейронная сеть для отображения последовательностей белков в складки», Биоинформатика, т. 34, нет. 8, стр. 1295–1303, апрель 2018 г., DOI: 10.1093 / bioinformatics / btx780.
[8] S. Ekins, TR. Переулок, ПБ. Мадрид, «Тилорон: противовирусный препарат широкого спектра действия, изобретенный в США и коммерциализированный в России и за ее пределами», Pharm Res, т. 37, нет. 4, март 2020 г., doi: 10.1007 / s11095–020–02799–8
[9] TT. Яо, JD. Цянь, Вайоминг. Чжу, Ю. Ван, GQ. Ван, «Систематический обзор терапии лопинавиром при коронавирусе SARS и коронавирусе MERS - возможный справочник по варианту лечения коронавирусной болезни-19», Journal of Medical Virology, vol. 92, нет. 6, стр. 556–563, февраль 2020 г., DOI: 10.1002 / jmv.25729
[10] Ш. Баша, «Лекарства от вируса короны: краткий обзор прошлого, настоящего и будущего», Journal of PeerScientist, vol. 2, вып. 2, апрель 2020 г., DOI: 10.5281 / zenodo.3747641
[11] I. FN. Hung, KC. Lung, E. YK. Цо, Р. Лю, Т. WH. Чанг, МЫ. Чу и др. «Тройная комбинация интерферона бета-1b, лопинавира-ритонавира и рибавирина в лечении пациентов, госпитализированных с COVID-19: открытое рандомизированное исследование фазы 2», The Lancet, ранний выпуск, май 2020 г., 10.1016 / S0140–6736 (20) 31042-4
[12] L. Caly, JD. Дрюс, MG. Каттон, Д.А. Янс, К.М. Вагстафф, «Ивермектин, одобренный FDA, подавляет репликацию SARS-CoV-2 in vitro», Antiviral Research, vol. 178, стр. 104787, июнь 2020 г., DOI: 10.1016 / j.antiviral.2020.104787
[13] Л. Рива и др., «Крупномасштабное исследование репозиции лекарств для противовирусных препаратов SARS-CoV-2» bioRxiv, препринт, апрель 2020 г., doi : 10.1101 / 2020.04.16.044016
[14] Б. Салкаи и В. Гролмуш, Мульти-маркировочная классификация почти идеального белка с глубокими нейронными сетями, arXiv: 1703.10663 [cs, q-bio, stat], март 2017 г., дата обращения: 30 марта 2020 г. [Онлайн]. Доступно: http://arxiv.org/abs/1703.10663.
[15] К. Ву, М. Берри, С. Шивакумар и Дж. Макларти, «Нейронные сети для полномасштабной классификации белковых последовательностей: кодирование последовательностей с разложением по сингулярным числам», Mach Learn, vol. . 21, нет. 1-2, стр. 177-193, 1995, DOI: 10.1007 / BF00993384.