Pesquisadores usaram inteligência artificial (IA) para descobrir 70.500 vírus, até então desconhecidos pela ciência, muitos deles estranhos, e nada parecidos com espécies conhecidas. Os vírus de RNA foram identificados usando metagenômica, na qual cientistas coletam amostras de todos os genomas presentes no ambiente, sem precisar cultivar vírus individuais. O método mostra o potencial da IA para explorar a “matéria escura” do universo dos vírus de RNA. A matéria escura genômica geralmente se refere à porção de um genoma que não corresponde aos éxons (codificadores ou não codificadores) de mRNAs anotados.
Os vírus são microrganismos onipresentes que infectam animais, plantas e até bactérias, mas apenas uma pequena fração foi identificada e descrita. Há “essencialmente um poço sem fundo” de vírus para se descobrir, diz Artem Babaian, um virologista computacional da Universidade de Toronto, no Canadá. Alguns desses vírus podem causar doenças em pessoas, o que significa que, caracterizá-los, pode ajudar a explicar doenças misteriosas, diz ele.
Estudos anteriores usaram aprendizado de máquina para encontrar novos vírus em dados de sequenciamento. O estudo mais recente, publicado na Cell esta semana, leva esse trabalho um passo adiante, e o usa para analisar estruturas proteicas previstas.
O modelo de IA incorpora uma ferramenta de predição de proteínas, chamada ESMFold, que foi desenvolvida por pesquisadores da Meta (antigamente Facebook, sediada em Menlo Park, Califórnia). Um sistema de IA semelhante, AlphaFold, foi desenvolvido por pesquisadores do Google DeepMind em Londres, que ganharam o Prêmio Nobel de Química esta semana.
Vírus perdidos
Em 2022, Babaian e seus colegas, pesquisaram 5,7 milhões de amostras genômicas arquivadas em bancos de dados disponíveis publicamente, e identificaram quase 132.000 novos vírus de RNA. Outros grupos lideraram esforços semelhantes.
Mas os vírus de RNA evoluem rapidamente, então os métodos existentes para identificar vírus de RNA em dados de sequência genômica, provavelmente perdem muitos. Um método comum é procurar uma seção do genoma que codifica uma proteína-chave usada na replicação de RNA, chamada RNA polimerase dependente de RNA (RdRp). Mas se a sequência que codifica essa proteína em um vírus for muito diferente de qualquer sequência conhecida, os pesquisadores não a reconhecerão.
Shi Mang, um biólogo evolucionista da Universidade Sun Yat-sen em Shenzhen, China, e um coautor do estudo Cell, e seus colegas, foram procurar vírus não reconhecidos anteriormente em amostras genômicas disponíveis publicamente.
Eles desenvolveram um modelo, chamado LucaProt, usando a arquitetura de “transformador” que sustenta o ChatGPT, e o alimentaram com dados de sequenciamento e predição de proteína ESMFold. Eles então treinaram seu modelo para reconhecer RdRps virais, e o usaram para encontrar sequências que codificavam essas enzimas, evidência de que essas sequências pertenciam a um vírus, na grande parcela de dados genômicos. Usando esse método, eles identificaram cerca de 160.000 vírus de RNA, incluindo alguns que eram excepcionalmente longos e encontrados em ambientes extremos, como fontes termais, lagos salgados e ar. Pouco menos da metade deles não havia sido descrita antes. Eles encontraram “pequenos bolsões de biodiversidade de vírus de RNA, que estão realmente distantes, nos confins do espaço evolutivo”, diz Babaian.
“É uma abordagem realmente promissora para expandir a virosfera”, diz Jackie Mahar, virologista evolucionista do CSIRO Australian Centre for Disease Preparedness em Geelong. Caracterizar vírus ajudará os pesquisadores a entenderem as origens dos micróbios, e como eles evoluíram em diferentes hospedeiros, diz ela.
E expandir o conjunto de vírus conhecidos, torna mais fácil encontrar mais vírus semelhantes, diz Babaian. “De repente, você pode ver coisas que não estava vendo antes.”
A equipe não conseguiu determinar os hospedeiros dos vírus que identificaram, o que deve ser investigado mais a fundo, diz Mahar. Os pesquisadores estão particularmente interessados em saber, se algum dos novos vírus infecta arqueias, um ramo inteiro da árvore da vida, para o qual nenhum vírus de RNA foi claramente demonstrado infectar.
Shi agora está desenvolvendo um modelo para prever os hospedeiros desses vírus de RNA recém-identificados. Ele espera que isso ajude os pesquisadores a entenderem os papéis que os vírus têm em seus nichos ambientais.
Referente ao artigo publicado em Nature
Este post já foi lido513 times!
You must be logged in to post a comment Login