Sandra Rodríguez-Perales (srodriguezp@cnio.es) y Raúl Torres-Ruiz (rtorresr@cnio.es)
Unidad de Citogenética Molecular
Centro Nacional Investigaciones Oncológicas (CNIO), Madrid 28029
Uno de los principales objetivos de la Genética es el estudio de las relaciones entre genotipo y fenotipo. Para ello, los estudios de genética inversa tratan de inferir la función de un determinado gen a través de la observación de los cambios fenotípicos inducidos en la célula tras la eliminación del propio gen o de su expresión. En este sentido, el campo de la genética inversa ha vivido una enorme revolución durante la última década, principalmente debido a dos motivos: i) el desarrollo de las nucleasas programables (enzimas entre las que se encuentran ZFN, TALEN y el sistema CRISPR) que permiten generar mutaciones de pérdida de función o reprimir la expresión de promotores en loci genómicos específicos; y ii) el desarrollo de tecnologías capaces de analizar la expresión génica de una sola célula.
i) El desarrollo de nucleasas programables derivadas del mecanismo de defensa inmunitario adaptativo procariota CRISPR (del inglés Clustered Regularly Interspaced Short Palindromic Repeats) ha revolucionado este y otros campos de la investigación en biomedicina. La endonucleasa Cas9 dirigida por un ARN guía (ARNg) de 20 nucleótidos, representa hasta la fecha el sistema más eficiente y ampliamente aplicado para la mutación dirigida de genes. La proteína Cas9 guiada por el ARNg puede incorporarse a prácticamente cualquier secuencia del genoma mediante el emparejamiento de bases ADN-ARN e inducir una rotura de doble cadena (DSB del inglés Double Strand Break) en el ADN. El único requisito es la presencia de una secuencia de 3 pares de bases, llamada PAM (del inglés Protospacer adjacent motif) en el extremo 3′ de la secuencia diana (por ejemplo, NGG para el caso de la Cas9 derivada de Streptococcus pyogenes). Posteriormente, el DSB se repara principalmente por un mecanismo celular propenso a generar errores pudiendo inducir deleciones y/o inserciones de bases (indels). Este sistema se ha modificado para poder ser utilizado en distintas aplicaciones, una de las cuales es conocida como CRISPR de interferencia (CRISPRi). En CRISPRi, se utiliza una proteína Cas9 catalíticamente inactiva denominada dCas9 (del inglés dead Cas9) que carece de actividad endonucleasa para regular la expresión de genes de una manera guiada por ARN. CRISPRi puede reprimir la transcripción al bloquear el inicio o la elongación de la transcripción, desde las regiones promotoras. Esto se logra diseñando uno o varios RNAg complementario/s al promotor o a las secuencias exónicas iniciales del gen a inhibir.
ii) La variación y heterogeneidad de célula a célula son características fundamentales e intrínsecas de las células implicadas en muchos fenómenos biológicos, incluido el desarrollo de órganos y la carcinogénesis. Esta heterogeneidad ha sido a menudo ignorada en los estudios ómicos (estudios de un gran número de moléculas implicadas en el funcionamiento de un organismo). La secuenciación de ARN de una sola célula (scRNA-seq del inglés single-cell RNA sequencing) se ha desarrollado enormemente debido a la mejora de tecnologías que permiten el aislamiento de cantidades masivas de células individuales. Previamente, la heterogeneidad celular y las bajas cantidades de material biológico disponible plantearon dificultades significativas para su implementación.
Hasta hace poco, la unión de estas tecnologías permitía obtener información relevante en células individuales de un máximo de unos pocos cientos de genes o fenotipos de interés preseleccionados. Sin embargo, la revista Cell ha publicado en su número de julio un interesante trabajo sobre la optimización de una de estas aproximaciones, el Pertub-seq, permitiendo su aplicación para realizar cribados de todo el genoma (Cribado basado en CRISPR con lecturas de secuenciado de ARN de célula única; doi:10.1016/j.cell.2022.05.013). El Pertub-seq, también conocido como CRISPR-seq o CROP-seq, combina la inactivación de genes individuales mediada por CRISPRi, con la secuenciación de ARN de células individuales con el objetivo de evaluar los fenotipos asociados a cada perturbación genética. El protocolo de Pertub-seq utiliza la tecnología CRISPRi para reprimir la expresión de genes específicos y usa unos marcadores o códigos de barras para la identificación y agrupación de las células según la perturbación que portan. El método Perturb-seq original, introducía el código identificador en una unidad transcripcional distinta al ARNg complicando el análisis y limitando su escalado a nivel de cribado genómico. Con el nuevo protocolo publicado en Cell, se ha conseguido superar esta limitación utilizando secuencias códigos de barras embebidos en la propia secuencia del ARNg permitiendo su captura directa. Esta modificación, realizada en colaboración con científicos de 10x Genomics, simplifica y agiliza el cribado de células individuales.
Los autores han validado el funcionamiento del nuevo protocolo Perturb-seq estudiando perturbaciones de todos los genes expresados en dos líneas celulares (K562 y RPE1), y analizando más de 2.5 millones de células (una media de más de 100 células por perturbación genética). En lugar de hacer una preselección de conjuntos de genes o fenotipos, en el trabajo se han analizado los resultados de «todos los genes expresados» eliminando así un posible sesgo asociado a la preselección y probando la alta precisión con que pueden hacer coincidir los fenotipos con las funciones de los genes. Estos análisis han permitido asignar con alta precisión una función a genes que previamente estaban mal o parcialmente caracterizados. Por ejemplo, se ha podido identificar que CCDC86, ZFN236, y SPATA5L1 son reguladores de la biogénesis del ribosoma, función no descrita previamente. Por otro lado, el análisis de los datos obtenidos ha facilitado la creación de un mapa de programas de expresión génica que permite vincular las perturbaciones genéticas con distintas funciones celulares, como la diferenciación celular o el crecimiento del linaje celular. El estudio publicado en Cell también ha permitido identificar genes implicados en la segregación cromosómica como los principales impulsores de la heterogeneidad intercelular. También han analizado cómo evoluciona el ciclo celular de células con un cariotipo anómalo y han identificado los genes implicados en la inestabilidad cromosómica mediante una clasificación de las perturbaciones genéticas en función de la gravedad de las anomalías asociadas al cariotipo. Por último, han podido confirmar que la respuesta de genes mitocondriales al estrés es dependiente de alteraciones específicas de genes mitocondriales del genoma nuclear. En resumen, esta tecnología aporta nuevas herramientas para el desarrollo de estudios sistemáticos y multidimensionales que permitan explorar la relación genotipo-fenotipo, añadiendo conocimiento en la relación entre genes y funciones celulares.