Recodificando el código genético. Un pequeño paso para una bacteria, pero un gran salto para la biología

Un nuevo avance científico ha saltado recientemente a los titulares de la prensa, que anuncian a bombo y platillo cosas como que se ha creado el primer organismo vivo del mundo con un ADN completamente sintético. Un logro meritorio de un equipo anglosajón del Medical Research Council Laboratory of Molecular Biology (Cambridge, UK). No obstante, la prensa en estos casos tiende a exagerar, malinterpretar o directamente contar las cosas atropelladamente soltando datos mezclados sin comprenderlos que más que informar, confunden al público. Sobre estos problemas de la comunicación de la ciencia por la prensa hablé en esta entrada. Ahora bien, ¿qué hay de cierto en lo que nos cuentan los periódicos? ¿Qué es realmente lo que han hecho esos investigadores y en qué consiste este hito científico? En esta entrada os lo explico en detalle, y si queréis una versión resumida, podéis encontrarla también en este enlace a un hilo que escribí en Twitter.

Todo este revuelo ha surgido a raíz de la publicación el pasado 15 de mayo de un artículo científico por Fredens et al. (2019), en la prestigiosa revista Nature (en adelante, siempre que hable de «el artículo» sin más indicaciones, me referiré a este). El título traducido al español de ese artículo sería «síntesis total de Escherichia coli con un genoma recodificado», y en él los autores explican cómo han tomado una cepa de la bacteria E. coli y han alterado su genoma completo, con una novedad muy importante: no solo han introducido meras mutaciones como en otros trabajos de ingeniería genética, sino que han alterado el código genético, que es como el diccionario que permite traducir los genes para construir las proteínas. Antes de seguir explicándolo, haré un breve repaso a lo que es el código genético y cómo funciona, especialmente para quienes no lo estudiasen o lo tengan algo olvidado, pero haré hincapié en algunos aspectos que son fundamentales para entender el artículo de Fredens et al.

El código genético

Como bien sabréis, la información para generar todos los compuestos de nuestro cuerpo y poner en marcha los procesos de nuestro funcionamiento está almacenada en el ADN de nuestras células, que se compone de bases nitrogenadas, unas moléculas que en la mayoría de los seres vivos se dividen en cuatro tipos (aunque algunos seres vivos tienen alguna más), que son: adenina (A), timina (T), guanina (G) y citosina (C). Cuando se tiene que expresar un gen, el fragmento del ADN que es el alelo de un gen es «leído» por unas enzimas, que fabrican una hebra de ARN mensajero (ARNm) que es como el negativo de una fotografía (una copia donde se cambia cada base nitrogenada por otra a la que se enlaza químicamente con más facilidad, igual que en el negativo de la fotografía las luces y sombras se intercambian respetando la distribución de la imagen). Estos procesos de lectura y copia del ADN los expliqué en más detalle en esta otra entrada. El ARN contiene las mismas bases, solo que en lugar de timina tiene otra llamada uracilo (U), y sus bases se componen de ribosas (mientras que el ADN tiene desoxirribosas, que son como las ribosas pero con un átomo menos de oxígeno). Cuando el ADN se transcribe a ARN, a cada A del ADN se le asigna una U en el ARN, a las T se les asigna una A, a las G una C, y las C una G. De ese modo, aunque cambia la secuencia, el orden se mantiene y así la información codificada es la misma, en otro formato. Esto a su vez se traduce de las bases del ARNm a aminoácidos que conforman las proteínas, leyendo las bases del ARN de tres en tres (lo que se llaman codones). A continuación os muestro una imagen del código genético:

Código genético
Código genético (fuente: https://www.innovabiologia.com/biodiversidad/diversidad-animal/el-codigo-genetico/).

Las hebras del ARNm son leídas por otras enzimas, que a cada codón le asignan un aminoácido, que son moléculas que sirven como los «ladrillos» con los que se construyen las proteínas. Como hay 4 posibles bases en cada posición del ARN, y estas se leen de tres en tres, tenemos un total de 64 posibles combinaciones de codones (4x4x4), que son las que refleja la tabla. El ARNm es leído en un sentido concreto, por lo que en cada codón hay una base (letra) que es la primera, otra que es la segunda, y otra que es la tercera, y este orden importa. Como decía, por cada triplete o codón la enzima que lo lee añade un aminoácido a una cadena de aminoácidos (la futura proteína), pero el código genético está degenerado, lo que significa que aunque hay 64 combinaciones, no hay 64 aminoácidos, sino que solo hay 20 (en la mayoría de las especies, pero de nuevo, como pasa siempre en biología, hay excepciones y algunas especies añaden algunos aminoácidos más). A propósito de esto último, aunque el código genético se dice «universal» porque lo compartimos todos los seres vivos casi idéntico, hay algunas variantes, es decir algunos seres vivos usan códigos genéticos que son muy parecidos a este pero con unas ligeras diferencias. Pero lo más importante es que el código genético no es ambiguo, es decir, para cada codón nunca hay posibilidad de confusión sobre qué aminoácido corresponde, porque ningún codón codifica para más de un aminoácido, aunque al ser degenerado cada aminoácido puede haber sido codificado por diferentes variantes de codones (entre una y seis variantes), y a esos codones diferentes que codifican para el mismo aminoácido los llamamos «codones sinónimos«. Quedaos con esto porque es importante para lo que explicaré luego sobre el artículo de Nature. Ejemplos de codones sinónimos son GAA y GAG, que ambos codifican para la glutamina (Glu).

Un último detalle que será relevante: aunque hay 64 codones, no todos codifican para aminoácidos. Si os fijáis en la tabla, hay tres (en rojo) a cuyo lado solo pone STOP, ya que esos son los que indican cuándo debe terminar la adición de aminoácidos para contruir la proteína. Además hay uno (en verde) que codifica para la metionina (Met), que además es el punto en el que comienzan todas las proteínas.

Sobre la degeneración del código genético

Como he comentado en el apartado anterior, el código genético se considera degenerado por esa redundancia en la codificación de aminoácidos, que hace algunos como la serina (Ser) lleguen a estar codificados hasta por 6 codones. Esto puede parecer un desperdicio, ¿verdad? Al fin y al cabo, si cada aminoácido estuviese codificado por un único codón, habría más codones disponibles para que la naturaleza le asignase más aminoácidos aparte de los 20 que usa mayoritariamente, y así habría más opciones de crear proteínas más diversas, pudiendo obtener más propiedades para ganar ventajas en la competición evolutiva que es la vida. Por supuesto, la construcción de estos mecanismos fue resultado del azar bioquímico y de lo que resultó aceptable y exitoso evolutivamente, así que no es de extrañar que pueda haber «fallos». Sin embargo, esta redundancia también tiene sus ventajas, como por ejemplo que nos previene de que algunas mutaciones alteren la expresión de los genes al resultar neutras; podéis encontrar más detalles sobre ello en esta entrada, que además es la base de una de las teorías de la evolución más importantes del siglo XX, el neutralismo de Kimura.

Un apunte interesante al respecto es que la sustitución de un codón por otro codón sinónimo es prácticamente neutra… pero no del todo, no siempre. Hay estudios que muestran pequeñas diferencias en el resultado final de la proteína, como efectos en la velocidad y precisión del proceso (Robinson, 2014), o cambios durante el plegamiento que afectan a la estructura final. De hecho según discute Robinson (2014) la selección natural podría actuar incluso sobre los codones sinónimos, haciendo que alguno de ellos resulte más adecuado a pesar de codificar para el mismo aminoácido.

La recodificación del código genético

Como comentan en su artículo Fredens et al. (2019), ya se había discutido en marcos hipotéticos sobre la posibilidad de alterar el código genético para reducir esa redundancia y tratar de aumentar las opciones de traducción, es decir, liberar codones sinónimos para convertirlos en codones con una nueva codificación única. Aunque de todas las posibles variantes teóricas del código genético, estos autores explican que hay discusiones en trabajos previos sobre que no todas son viables. Pero en teoría algunas sí pueden serlo.

Y esto es justo de lo que va su trabajo, que se han puesto a llevar a la práctica. Su objetivo, aunque complejo de realizar, como concepto es sencillo pero potente: liberar tres codones de su actual traducción en el código genético, para que así se les puedan asignar nuevos aminoácidos, aumentando los materiales disponibles para fabricar nuevas proteínas usando células. Esto abre todo un mundo de posibilidades para poder fabricar nuevos biopolímeros. Y sus aplicaciones son inmensas, desde la industria hasta la biomedicina. Tanto que no sería de extrañar que, si todo les sale bien (porque aún no está del todo acabado), les nominasen para algún premio importante. Si hubiese un Premio Nobel de la biología lo podrían ganar, aunque quizá también puedan aspirar al Premio Nobel en Fisiología o Medicina.

Pero bueno, vamos al lío. Si queréis saber lo que han hecho y cómo, os lo cuento más detalladamente a continuación. Intentaré resumirlo y no entrar en detalles muy profundos de genética molecular, pero contaré los detalles básicos para que a grandes rasgos todo el mundo pueda hacerse una idea de los pasos que han seguido para lograr eso. Digamos que os lo voy a presentar en tres sencillos pasos, como si fuese un manual de IKEA para montar tu propio organismo sintético en casa (si tu casa es un laboratorio de biología celular de última generación, vamos, lo habitual).

Paso 1: forzar la mutación para cambiar codones

El objetivo fundamental es reemplazar en una cepa de la bacteria E. coli tres de los codones, aquellos que quieren «liberar» para otros usos, por otros codones que son sinónimos de esos tres. En concreto, han elegido dos de los 6 codones sinónimos de la serina (Ser), TCG y TCA en el ADN de la bacteria, que en el ARMm del código genético son los codones AGU y AGC, y además uno de los tres codones «STOP» de terminación que no codifican para ningún aminoácido, el codón TAG, que en el ARNm es el UAG. Esos tres codones los plantearon reemplazar sistemáticamente por sus sinónimos AGC, AGT y TAA, respectivamente, como se muestra en la siguiente figura. A esta técnica plantean denominarla como compresión de codones sinónimos (en inglés synonymous codon compression).

mutación de codones sinónimos
Compresión de codones sinónimos (Fredens et al., 2019). A la izquierda, en gris, se representan los codones sinónimos del código genético original para la serina y los codones de terminación. En el medio se muestran con flechas rojas las mutaciones que los investigadores indujeron en E. coli para reemplazar tres codones por sinónimos equivalentes. A la derecha, en las cajas rosas, se muestran los codones sinónimos de serina y de terminación que quedan en el nuevo código genético recodificado.

Paso 2: aplicar la compresión de codones sinónimos a todo el genoma de E. coli

Lo que hemos visto en el paso anterior tuvieron que aplicarlo a todo el genoma de la bacteria E. coli, puesto que la idea es que todos los genes que tenía la cepa original de esa bacteria sigan pudiendo expresarse codificando para exactamente las mismas proteínas y funciones, solo que para ello no se usa ninguno de los tres codones reemplazados. Así es como si la bacteria siguiese siendo la misma, pudiendo comportarse igual sin perder ninguna función para que no pierda viabilidad, pero utilizando menos codones del código genético. Para hacer esto, tuvieron que diseñar un genoma en el que habían reemplazado un total de 18.218 codones (de los tres tipos mencionados) por sus respectivos codones sinónimos. Pero no es tan fácil como decirlo, no lo hicieron de golpe. Tuvieron que hacerlo por partes en diferentes células de la bacteria, y luego irlas juntando como un puzle. ¿Cómo? Pues dividieron el genoma de la bacteria en 8 fragmentos que nombraron con letras de la A a la H, y cada uno con aproximadamente medio millón de pares de bases (0’5 Mb). A cada sección en una célula diferente aplicaron las mutaciones que expliqué antes, y luego fueron metiendo los fragmentos mutados de unas células en otras, para irlos juntando hasta tenerlos todos unidos en una única célula. En la siguiente figura se muestra un esquema del proceso.

Ensamblaje de fragmentos de genoma sintético
Ensamblaje de fragmentos de genoma sintético (Fredens et al., 2019). Las letras mayúsculas (A-H) indican los fragmentos sintéticos (en rosa) que posee el genoma de una célula mutante, y los fragmentos en gris son los que aún conservan su genoma original. Las flechas indican donaciones de fragmentos de ADN de unas células a otras, que se nombran como donante (d) del fragmento sintético, y receptora (r). El resultado final es una célula de E. coli con todo su genoma recodificado, a la que se ha nombrado como Syn61.

Tras ir alterando cada fragmento en diferentes células, y luego extraerlo de ellas y usarlo como donación de ADN de unas células a otras, las células receptoras (r en la figura anterior) acaban juntando los fragmentos y reemplazando el genoma original por el nuevo genoma sintético, que básicamente es similar al original pero sin utilizar ninguno de los tres codones reemplazados. Y dado que toda la información de su genoma pasa de 64 codones a estar expresada en el nuevo código genético sintético por 61 codones, a este nuevo organismo se lo ha etiquetado con el código Syn61.

Los autores comentan en su artículo que este proceso provocó la aparición accidental de 8 mutaciones no programadas, aunque ninguna de ellas afectó a la recodificación programada. También señalan que este efecto colateral es órdenes de magnitud menor que el presentado en trabajos previos, donde la tasa de mutaciones no programadas era superior.

Paso 3: reutilizar los codones liberados para codificar en ellos nuevos aminoácidos

El siguiente paso será completar el proceso asignado nuevos aminoácidos a los tres codones que han quedado disponibles en el nuevo código genético recodificado. Ya sea asignando un aminoácido a cada uno, o dos generando un nuevo par de codones sinónimos, o un único aminoácido asignado a esos tres. Para ello habría que lograr que las enzimas encargadas de la traducción, cuando lean cualquiera de esos codones, cojan el nuevo aminoácido que deberá tener disponible la bacteria y lo añadan a la cadena de aminoácidos de una proteína. O que la bacteria use otras enzimas capaces de realizar esa tarea, ya que sería un fracaso si después de todo el trabajo anterior, los codones reemplazados vuelven a ser recodificados a los mismos aminoácidos.

Lo que tendrán que hacer es añadir nuevos genes a esa bacteria, diseñados por los científicos para codificar la información para nuevas proteínas (que se pueden diseñar usando por ejemplos modelos informáticos de propiedades bioquímicas, estructurales, etc.). Meterán genes que serán secuencias en las que se combinen los 61 codones que aún usa Syn61 con los tres codones eliminados, que adquirirán una nueva codificación. Así podremos usar esas células para producir esos nuevos materiales o compuestos que diseñemos en el laboratorio y logremos insertar en Syn61.

En el artículo publicado en Nature los autores dan algunos avances de análisis que han realizado, comparando la cepa de E. coli original de su estudio con su nueva bacteria sintética Syn61. Básicamente tienen una información genética muy similar, pero ya se observan algunas diferencias, como que las bacterias de la cepa sintética Syn61 son ligeramente más grandes. ¿Recordáis que al principio comentaba que cambiar un codón sinónimo por otro podía generar algunas pequeñas diferencias? Habrá que investigar todos los cambios producidos por esta recodificación. Pero uno de los análisis más prometedores que nos muestran Fredens et al. son los estudios de respuesta a la incorporación de un nuevo aminoácido (CYPK)* diferente a los 20 habituales o canónicos, que pretenden que esté codificado por el codón TCG que habían liberado de su anterior codificación de serina. Al exponer a diferentes concentraciones del aminoácido CYPK a las cepas «original» (que es una cepa concreta etiquetada como MDS42) y sintética (Syn61), observaron que la cepa original disminuía su crecimiento a mayores concentraciones, ya que este resultaba tóxico, mientras que la cepa Syn61 lo asimilaba sin problemas, como se puede ver más abajo en la gráfica.

*Nota: el nuevo aminoácido (CYPK) con el que experimentaron tiene por nombre químico completo el siguiente: Nε-(((2-methylcycloprop-2-en-1-yl) methoxy) carbonyl)-l-lysine. Por otro lado, utilizaron también una enzima que tomaron de una arquea anaerobia cuyo nombre científico es Methanosarcina mazei, y el nombre de la enzima utilizada es pyrrolysyl-tRNA synthetase (PylRS).

Respuesta comparativa entre cepas al aminoácido no canónico CYPK
Respuesta en el crecimiento a diferentes concentraciones del aminoácido no canónico CYPK en presencia de la enzima PylRS, comparando dos cepas de Escherichia coli, la que se usó como cepa original de partida del experimento (MDS42), y la cepa sintética (Syn61).

La noticia en la prensa

Ahora que ya sabéis qué es lo que hicieron esos investigadores, podréis notar algunas imprecisiones con las que lo cuenta la prensa. En algunos titulares hablan de que tiene un ADN totalmente sintético, o un código genético totalmente sintético. Dicho así parece que le han reemplazado la molécula de ADN por algo totalmente nuevo, o que su código genético es totalmente diferente al original. Pero la nueva cepa creada, aunque asombrosa, no está tan alejada de lo que ya era antes. El ADN sigue siendo la misma molécula con las mismas 4 bases que tenía, solo han alterado su secuencia haciendo que determinadas secuencias (los tres codones elegidos) fuesen reemplazadas por otros codones sinónimos. Y el código genético es lo mismo que ya había solo que le faltan tres codones (que ahora pueden ser reincoporados para aumentar ese código genético hasta un máximo de 64 de nuevo, con nuevos aminoácidos). Sería como si en un libro reemplazamos tres palabras por otras tres que sean sinónimos (eliminando todo uso de las tres primeras con su definición original), de manera que la historia que cuenta sigue siendo la misma, solo que ahora podemos volver a meter esas tres palabras suprimidas a las que cambiaremos su definición, para crear con ellas nuevas frases dotadas de un significado que antes no era posible con esas palabras.

Esto, aunque lo llamemos sintético porque ha sido forzado en el laboratorio, es algo que teóricamente podría haber sucedido en la naturaleza por la acumulación de sucesivas mutaciones. Posible, aunque extremadamente improbable. Como he comentado en otras entradas (como esta sobre transgénicos), lo que hace la ingeniería genética no es crear cosas totalmente artificiales, que algunos incluso piensan que son antinaturales, sino que simplemente (aunque mediante procesos muy complicados) hace que la probabilidad casi nula de algo que podría suceder en la naturaleza pase a tener en el laboratorio una probabilidad cercana al máximo de 1. Como ha sido el caso del estudio publicado en Nature.

También he visto en algún artículo un baile de cifras que puede confundir al lector, como uno que vi hace unos días en el que decían que la bacteria sintética pasaba de 61 a 59 codones y así tenía 3 libres. Obviamente esa resta da 2 y no cuadra. Ahí han mezclado dos cosas diferentes. Si recordáis el cuadro del código genético (o vais a la primera imagen de esta entrada), en el código genético canónico hay en total 64 codones, de los cuales 3 (‘STOP’) no codifican para aminoácidos sino para detener la traducción, por lo que los codones que sí codifican para aminoácidos son 61. En el estudio de Fredens et al. reemplazaron del genoma de una bacteria dos codones de serina y uno de parada, por lo que su código genético pasó de usar 64 codones a 61 (para los mismos genes que ya tenía la bacteria), de los cuales se redujo de 3 de parada a 2, y de 61 de aminoácidos a 59. Espero que con esto estén claras esas cifras.

Conclusiones

Tal como se había teorizado, este estudio experimental aporta una evidencia de la posibilidad de recodificar el código genético, y ha sido creada una cepa (Syn61) con el genoma rediseñado («sintético») que ha permitido liberar tres codones para codificar en ellos nuevos aminoácidos.

Esto supone un gran avance en las investigaciones para generar nuevos compuestos (con infinidad de aplicaciones útiles) usando bacterias (y en el futuro probablemente también otros organismos) que los sinteticen. El trabajo que realizaron estos investigadores es enorme, pero también falta aún bastante para terminar el proceso. Pasarán años hasta que esas bacterias de cepa sintética lleguen a producir las proteínas que diseñemos y queramos obtener, que estos productos pasen los adecuados ensayos de efectividad y seguridad, y que podamos ver cómo esto llega a aplicarse para los propósitos que tiene. Pero ya solo el hecho de alterar el código genético en laboratorio es un inmenso salto científico para la biología desde que se descubrió la genética, pese a que parezca un pequeño paso que una bacteria cambie de usar un aminoácido a otro para algunos codones.

Lo que sí puede generar ya este avance es todo un nuevo argumentario para la ciencia ficción. Pues aunque estemos modificando el código genético en bacterias, esto podría aplicarse a otros seres vivos (lo cual es mucho más complejo, y en algunos casos cuestión de debate bioético). Pero podemos imaginar perfectamente qué pasaría si nosotros mismos alterásemos nuestro código genético. Hasta ahora en la ciencia ficción se jugaba por ejemplo con la idea de reemplazar partes de nuestro cuerpo con estructuras biomecánicas, pero ahora hay una base científica sólida para que la ficción escriba nuevas historias, en las que nuestro propio cuerpo con el código genético modificado cree nuevas estructuras hasta ahora impensables. Pero por ahora eso queda más en la ciencia ficción que en la realidad.

Los investigadores del estudio, así como otros biólogos y biotecnólogos de otros equipos, tienen aún mucho trabajo por delante para conseguir controlar que bacterias sintéticas como Syn61 produzcan las proteínas que queramos (dentro de unas limitaciones químicas). Fredens et al. terminan su artículo comentando que seguirán trabajando y publicarán nuevos estudios con futuros avances en la reasignación de codones para la síntesis de biopolímeros no canónicos. Esperamos con ansia sus futuros artículos y les deseamos suerte en su ambiciosa labor. Y si todo marcha según lo previsto, quizá algún día sean laureados con un prestigioso Premio Nobel.

Referencias

Fredens J., Wang K., de la Torre D., Funke L.F.H., Robertson W.E., Christova Y., Chia T., Schmied W.H., Dunkelmann D.L., Beránek V., Uttamapinant C., Llamazares A.G., Elliott T.S., Chin J.W. 2019. Total synthesis of Escherichia coli with a recoded genome. Nature 569: 514-518.

Robinson R. 2014. Which codon synonym is best? It may depend on what’s on the menu. Plos Biology 12(12): e1002014.

2 comentarios sobre “Recodificando el código genético. Un pequeño paso para una bacteria, pero un gran salto para la biología

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s