Guía de Trabajos Prácticos Cátedra BIOLOGIA MOLECULAR Facultad de Ciencias Naturales e IML U.N.T. -2015-
JTPs: Dra. Virginia Albarracín Dr.Sergio Cuozzo Dra. Marta Polti
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Programa de Trabajos Prácticos
Trabajo Práctico N 1. Reacción en Cadena de la Polimerasa. Definición e importancia. Usos y aplicaciones. Optimización. Tipos de PCR. Electroforesis. Fundamentos. Trabajo Práctico N 2. Vectores de clonado: Plásmidos. Características: Estructura, clasificación (criterios), funciones codificadas (fenotipos), número de copias. Grupos de incompatibilidad. Electroforesis de plásmidos. Trabajo Práctico N 3. Bioinformática. Concepto e Importancia. Bases de datos en Internet: NCBI, EMBL. Software (DNAman, MEGA 4, Treeview) y Programas on line para análisis de secuencias: Workbench Biology, Eztaxon Server, Ribosome DataBase Project, NCBI. Algoritmos de comparación: BLAST. Construcción de Árboles Filogenéticos. Trabajo Práctico N° 4. Taxonomía molecular. Marcadores moleculares y técnicas más comúnmente usadas. Identificación de microorganismos mediante ARDRA. Digestión in silico con enzimas de restricción. Tipos de enzimas. Mapas de Restricción. Trabajo Práctico N° 5. Secuenciación y Genómica. Análisis de genomas con plataforma RAST. Cantidad y tipo de genes. División en subsistemas. Anotación de genes con programa ARTEMIS.
-1-
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Trabajo Práctico N1 REACCIÓN EN CADENA DE LA POLIMERASA (PCR)
1- Objetivos • Que el alumno comprenda el fundamento teórico que permitió el desarrollo de la técnica de PCR. • Que el alumno comprenda la importancia de la técnica en el desarrollo de la tecnología del ADN recombinante. • Que el alumno conozca las aplicaciones y usos de la técnica. • Que el alumno sea capaz de diseñar y efectuar reacciones de PCR en el laboratorio. • Que el alumno pueda interpretar los resultados obtenidos en relación al objetivo del experimento planteado.
2- Introducción Definición e importancia. La reacción en cadena de la polimerasa (PCR) fue desarrollada por el grupo de Kary Mullis de Cetus-Perkin- Elmer en 1985. El primer experimento de Mullis y colaboradores, publicado en Science en 1985 fue planeado para desarrollar un método de diagnóstico que no insumiera más de 24 hs para la detección de la hemoglobinopatia de eritrocitos falciformes ("sickle cellanemia"). En esta anemia la cadena de la globina está mutada a nivel de la segunda base del séptimo codón de lo que resulta un cambio de glutámico (cadena PA normal) por valina (cadena s patológica). A nivel del gen esto hace desaparecer un sitio Dde pero no afecta a otro sitio Hinf contiguo. En el experimento amplificaron un fragmento de 110 pb portador o no de la mutación. Luego de la amplificación el producto desnaturalizado monocatenario se hibridizó con un oligonucleótido homólogo de 40 bp en cuyo extremo 5' están dos hemisitios de Hinf y Dde. El fragmento fue marcado con 32P en dicho extremo. El híbrido es entonces tratado primero con Dde a 56"C que de cortar, genera un producto de 8 nucleótidos. El segundo tratamiento es con Hinf que no actúa sobre e! producto de Dde pero si corta generando un fragmento de 3 nucleótidos si el sitio Dde no existe. En los últimos años, la PCR se ha convertido en una revolucionaria tecnología que facilita los estudios moleculares en el laboratorio y que abre nuevas perspectivas a la investigación y al diagnóstico médico. Esta nueva tecnología se basa en la ampliación de secuencias específicas del ADN y se conoce como reacción en cadena de la polimerasa o PCR (polymerase chain reaction).
-2-
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
La revolución que la PCR ha originado en el campo de la investigación genética y molecular es comparable a la producida por el descubrimiento de las enzimas de restricción o de los polimorfismos del ADN. Ventajas y usos. - Se dispone, en forma rápida y eficaz, de cantidades suficientes de una determinada secuencia de DNA para su posterior estudio molecular. - Diagnóstico de patologías genéticas o adquiridas, - Investigación sobre los defectos moleculares todavía no definidos. - Aplicación a la medicina forense y legal. - Detección de patógenos responsables de enfermedades infecciosas. Fundamentos La PCR permite, mediante la utilización de una ADN polimerasa, la amplificación de regiones específicas de ADN de simple cadena, la que actúa como molde para la síntesis de una nueva cadena complementaria. Estos moldes de ADN se obtienen cuando se calienta el mismo a una temperatura cercana a un punto de ebullición (desnaturalización), produciéndose la separación de las cadenas de ADN. Para la iniciación de la síntesis de la cadena complementaria al molde se requiere además de la presencia de cebadores o primers, que son secuencias cortas de nucleótidos sintéticos (oligonucléotidos) o primers, hibridan de forma específica con las dos hebras complementarias de ADN. Los cebadores se diseñan de tal manera que hibriden en los extremos opuestos de cada hebra de la región de interés, así las nuevas cadenas de ADN sintetizadas que comienzan en cada primer se extiende hacia la posición del primer que se encuentra en la hebra opuesta. De esta forma se generan en cada cadena de ADN nuevamente sintetizada nuevos sitios de unión a los primers. La mezcla de racción se calienta nuevamente para separar la cadena original de la nueva, las cuales quedan disponibles para nuevos ciclos de hibridación del primer, síntesis de ADN, separación de las cadenas, y así sucesivamente. Es decir que básicamente, la amplificación de la secuencia de interés se consigue al realizar una serie de ciclos repetitivos que consisten en: Desnaturalización del ADN molde. Hibridación de los primers con el molde. Síntesis del ADN complementario mediante la acción de la enzima denominada ADN polimerasa, termoestable. El resultado de una reacción de PCR es que al final de n ciclos, la reacción contiene un máximo teórico de 2n moléculas de DNA de doble cadena que son copias de la secuencia de DNA comprendida entre los primers específicos. Si se realizan 20-30 ciclos del proceso de PCR señalado anteriormente, se pueden obtener varios millones de copias de la secuencia de interés, flanqueada por los primers utilizados en la amplificación. Tema 4. Componentes de la reacción de PCR.
-3-
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
La reacción típica de PCR consta de: Muestra de ADN que contiene la secuencia a amplificar. Enzima ADN polimerasa. Secuencias cebadoras o primers. Desoxinucleótidos trifosfatos (dNTPs) Mg Cl2 Buffer de reacción. Enhancers. Aceite mineral. Muestra de ADN o templado. La muestra de ADN puede consistir en 100 ng de ADN genómico (aproximadamente 100.000 copias del ADN molde a amplificar); o ADN obtenido de una única célula, es decir solo una a dos copias del ADN (aproximadamente 5 pg de ADN). ADN polimerasa. Existen varios tipos de enzimas ADN polimerasa. En un principio se utilizó ADN polimerasa procedente de E. coli. Sin embargo, la actividad de esta enzima desciende considerablemente por encima de los 37º C, y la exposición a las altas temperaturas de desnaturalización, necesarias para separar las dos cadenas de ADN inactiva la enzima tras cada ciclo de amplificación. Por tal razón, en la reacción de PCR se utilizan ADN polimerasas termoestables; éstas se han aislado a partir de microorganismos que viven a temperaturas elevadas. La ADN polimerasa del microorganismo Thermus aquaticus ( Taq ADN polimerasa) permite la síntesis del ADN por encima de los 70º C, resistiendo temperaturas de hasta 94º C. Otras enzimas termoestables son las Tfl ADN polimerasa obtenida del Thermus flavus, la Pfu ADN polimerasa de Pyrococcus furiosus, VENT (nombre comercial de enzima de Thermococcus litoralis), DeepVENT (nombre comercial de enzima de Pyrococcus sp. GB-D), estas tres últimas presentan mayor termoestabilidad que la Taq polimerasa, presentando además una actividad exonucleasa 3 a 5 que le permite corregir los nucleótidos incorporados en forma errónea; es decir que los fragmentos de PCR generados con esta enzima tendrán menos errores de incorporación que los generados con la Taq polimerasa. La Tth polimerasa de Thermus termophilus, posee además actividad de RT en presencia de Mn2+. Cebadores. Los primers o cebadores son secuencias cortas de ADN de 20 a 30 bases que se obtienen por síntesis; la secuencia de los mismos se diseña de acuerdo al fragmento de ADN que se desea amplificar. Se debe tener una concentración de 0.2-1.0 M c/u, en muchísimo exceso molar respecto del templado (relación primer/target: inicial: 108 y final: 10 aproximadamente. En el diseño de los primers es necesario tener en cuenta algunas consideraciones: Deben ser específicos, especialmente en el extremo 3´. Las bases que lo componen deben tener una distribución homogénea a lo largo de la secuencia, evitando regiones ricas en polipurinas, polipirimidinas u otras secuencias poco
-4-
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
comunes. Se debe tratar en lo posible que el contenido de CG sea similar al del fragmento a amplificar. Diseñar "primers" con el Tm más alto posible, 55 a 80 C y similares entre los primers. Los primers no deben estar distanciados por mas de 3 kbp. Se debería evitar la presencia de secuencias que permitan la formación de estructuras secundarias, particularmente en el extremo 3 del primer . Es muy conveniente controlar que no existan regiones de complementariedad entre los primers (uno con otro) evitando que el par de cebadores posean extremos 3 solapados, ya que podrían dar lugar a un artefacto de amplificación llamado dímero de primers. Estos dímeros aparecerán como producto de la reacción de PCR especialmente cuando se hacen muchos ciclos de amplificación sobre una muestra que tiene pocas copias iniciales del material a amplificar. Un dímero de este tipo es un fragmento de ADN cuya longitud es muy próxima a la suma de los dos primer y su formación ocurriría cuando un primer es “extendido” por la polimerasa sobre el otro primer. La concatenación resultante es un molde extremadamente eficiente que puede , si es que ocurre en un ciclo temprano, fácilmente volverse el producto predominante de la reacción. Existen programas de computación que facilitan el diseño de los primers.
dNTPs. Son necesarios para la formación del nuevo ADN amplificado. 0.2 mM c/u (0,8 mM en total), corresponden a aproximadamente a 1016 moléculas de dNTPs. Cuando se amplifican productos largos se aumenta también la concentración de dNTPs. También se puede reemplazar un dNTP por algún nucleótido modificado. Ej: ddNTP, bases modificadas, adición de biotina, fluorocromos, etc. Mg2+. Afecta la unión del primer, el Tm del templado, la especificidad del producto (que los primers se unan únicamente a la secuencia de interés), la actividad de la enzima y su fidelidad. Junto con la temperatura es uno de los parámetros a manipular. Usualmente se ensayan concentraciones, entre 0.5 y 5.0 mM. Buffer de reacción. 50 mM KCl y 10 mM Tris-HCl (pH 8.3). Enhancers. En ciertas circunstancias el agregado de sustancias como DMSO (1-10%), PEG-6000 o glicerol (5-15%), detergente no iónicos, formamida {1-10%), BSA (10-100 g/ml) pueden mejorar mucho la especificidad y e! rendimiento. Aceite mineral: para evitar la evaporación de la mezcla de reacción, 2 gotas
-5-
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Diseño de una reacción de PCR. En una reacción de PCR se busca optimizar tres elementos fundamentales: Especificidad, Rendimiento y Fidelidad. La especificidad se refiere a la capacidad de obtener un producto de PCR único y deseado. La fidelidad busca por su parte que el producto de amplificación sea tan fiel a la secuencia original como sea posible, es decir, que se minimicen los errores en la adición de bases durante la replicación. Y el rendimiento implica la obtención de una gran cantidad de producto final después de toda la reacción. Debido a la amplia variedad de aplicaciones en las que se está utilizando la PCR, no existen condiciones estándares que garanticen el éxito en todas la situaciones. Sin embargo, algunos parámetros pueden ser tenidos en cuenta como referencia para el diseño de una reacción de PCR. Una reacción de PCR se realiza habitualmente en un volumen de 25 a 50l, en un aparato automático programado (ciclador térmico) para conseguir las temperaturas y los ciclos deseados. Un ciclo típico consiste en realizar la desnaturalización a 94º C durante 20 seg., la hibridación de los primers con el ADN molde a 55º C durante 20 seg., y la síntesis a 72º C durante 30 seg. Los aparatos existentes en el mercado permiten llegar a las temperaturas deseadas a una velocidad de entre 0,3 y 1º C por segundo, por lo que un ciclo dura menos de 5 min., y el total del proceso de amplificación puede ser de menos de 3 horas de duración. En la mezcla de reacción, la concentración del ión Mg2+ puede tener un profundo efecto sobre la especificidad y el rendimiento en una amplificación. Generalmente una concentración de 1,5 mM de MgCl2 es óptima cuando se trabaja con concentraciones de 200 M de cada desoxinucleótido trifosfato (dNTP) pero en algunas circunstancias pueden ser requeridas diferentes cantidades de Mg2+. En general, el exceso de Mg2+ producirá una acumulación de productos de amplificación no específicos, y una cantidad insuficiente del mismo reducirá el rendimiento en la amplificación del fragmento deseado. Los desoxinucleótidos trifosfato (dATP, dCTP, dTTP y dGTP) se utilizan normalmente en concentraciones equimolares y comprendidas entre 50 a 200 mM cada uno de ellos. Concentraciones más elevadas pueden dar lugar a incorporaciones erróneas por la ADN polimerasa (es decir, disminuye la fidelidad de la copia); a las concentraciones mencionadas hay suficiente cantidad de precursor para sintetizar aproximadamente 6,5 y 25 mg de ADN respectivamente. A concentraciones menores disminuye el rendimiento de la reacción, es decir, la cantidad de producto amplificado que obtengo. La Taq polimerasa se utiliza en una concentración de 2,5 unidades por 100 l; al incrimentar la cantidad de enzima pueden aumentar la producción de productos no específicos de PCR, reduciendo así el rendimiento del fragmento de ADN deseado. La cantidad de cebador utilizada en una amplificación dependerá de varios factores, pero en general las concentraciones de los mismos están comprendidas entre 0,05 a 0,5 l; de cada uno de los oligonucleótidos. El tiempo de incubación a 72º C (extensión) varía de acuerdo a la longitud de la secuencia a ser amplificada. La temperatura de hibridación o annealing depende de la longitud de los cebadores y de su contenido de CG. -6-
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Si los primers tienen una complementariedad perfecta con el templado se usa 55 C para (C+G) < 50% o 60 C para (C+G) > 50%. Si no la tienen por ignorarse detalles de las secuencia del primer, hay que hacer pruebas variando la temperatura entre 35 y 65 C, hasta la obtención de un único producto con la longitud deseada. Este último caso es el de la mezcla de oligonucleótidos “degenerados” donde la referencia que se tiene del templado es sobre la secuencia de aminoácidos de la proteína y no de la secuencia de bases del gen o mRNA. En otros casos se introducen a propósito en los primers zonas sin homología; por ejemplo cuando se trata de introducir una mutación o bien un sitio de restricción. Cuando esto ocurre, la zona no homóloga debe estar en el lado 5´ del primer; caso contrario puede no haber extensión. Como vemos, son varios los parámetros a tener en cuenta en una reacción de PCR y muchas veces puede ocurrir que una región particular del ADN presente dificultad en ser amplificada por esta técnica. Este es el caso de aquellas regiones de ADN ricas en CG o aquellas que forman estructuras secundarias; en estos casos se puede incluir en la mezcla de reacción un aditivo que incremente el rendimiento y la especificidad. Los aditivos más usados son dimetilsulfóxido (DMSO), la N,N,N-trimetilglicina (betaína) y la formamida, también se utilizan el glicerol, detergentes no iónicos, polietilenglicol, albúmina sérica bovina.
Condiciones que favorecen una mayor especificidad
Tipos de PCR. 1. Reacción de PCR a partir de ARN (RT-PCR). Esta técnica es una variante de la PCR que permite determinar la presencia de un transcripto, estimar los niveles de expresión del mismo y clonar productos de ADNc.
-7-
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
El material de partida es ARN, pero como la PCR utiliza una ADN polimerasa, es necesario hacer previamente una copia del ARN a ADNc; esto se consigue haciendo en una primera etapa una transcripción reversa del ARN total o el ARNm a ADNc con una transcriptasa reversa; el ADNc obtenido es el sustrato en la reacción de PCR usando cebadores específicos. 2. PCR anidada o Nested PCR. Es un método para incrementar la sensibilidad y la especificidad de la amplificación. Luego de 20 ciclos de amplificación, se toma un 10% de la mezcla que se somete a una nueva amplificación por 20 ciclos pero ahora en presencia de otro par de primers que se ubican por dentro de la secuencia a amplificar respecto de los primers iniciales. 3. PCR anclada o Anchored PCR. Se la utiliza cuando solamente se tiene información para el diseño de un solo primer. 4. PCR con “random primers”. Está basado en la utilización de “primers” con secuencias seleccionadas al azar. Se usa para la detección de polimorfismos genéticos en ausencia de información sobre secuencias de bases. El esquema de fragmentos amplificados con esta técnica es trnsmitido mendelianamente de padres a hijos y sirve para caracterizar especies de indviduos y eventualmente para construir mapas genéticos. El método se denomina “Random Amplified Polymorphic DNA” y se realiza con primers de 10 nucleótidos y la renaturalización se debe efectuar a 36C.
5. RNA display. El método fue descripto por el grupo de Pardee (1991). Se basa en la utilización de primers con secuencias seleccionadas al azar para detectar mRNAs específicos de un estadío celular mediante RT- PCR. La renaturalización se debe efectuar a 40C. Un ejemplo de los primers que se utilizan es:
-8-
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
6. Real Time PCR. Es una metodologia que permite medir en tiempo real la formacion de un producto de PCR. Utiliza un fluorometro adosado a un equipo convencional de PCR y tubos de calidad optica. Se basa en el uso de un oligonucleotido que contiene un fluorocromo y un quencher. La proximidad de estos dos elementos bloquea la fluorscencia. Cuando estos dos elementos se separan en el transcurso de la amplificacion, aumenta la emision de fluorescencia. Las desventajas que presenta incluyen la necesidad de una optimizacion perfecta, no se puede asegurar la especificidad de la reaccion, complica el uso de controles internos, y elevado costo.
Cuando el fluorocromo se aleje o separe del quencher, se observara fluorescencia.
Comparacion con electroforesis
Comparacion entre distintas concentraciones
7. RACE: rapid amplification of cDNA ends; Amplificación rápida de extremos de cDNA. La RACE –PCR es un método muy utilizado para obtener las secuencias completas de cDNA (Frohman et al., 1988). RACE-PCR es una modificación anclada de la RT-PCR. Está basada en la amplificación de la secuencia comprendida entre una sola región
-9-
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
previamente caracterizada en el mRNA (cDNA) y una secuencia de anclaje apareada en el extremo 5‟ o 3‟. Se diseña un cebador a partir de una secuencia interna conocida y el segundo cebador tiene la secuencia de anclaje. Un paso previo a la RACE-PCR implica la introducción de una secuencia específica en o el extremo 3‟ o 5‟, por lo que efectivamente es una forma de mutagenesis A- 3‟ RACE-PCR utiliza un primer antisense que empieza con una secuencia específica 5‟, generalmente de más de 15 nucleótidos, que se incorpora en el transcripto de cDNA en el paso donde interviene la transcriptasa reversa. Un primer sense interno se utiliza para generar un segunda cadena corta que termina en una secuencia complementaria a la secuencia original de anclaje. Después, la PCR se inicia utilizando el primer sense interno y el primer de anclaje. B- 5‟ RACE-PCR. Aquí un primer antisense interno se utiliza para preparar la síntesis del templado de una cadena parcial de cDNA. Una cola de poly(dA) se añade al extremo 3‟del cDNA usando una transferasa terminal. La síntesis de la segunda cadena se prepara utilizando un primer sense con una secuencia de extensión específica (el ancla). Esta cadena se utiliza como templado para un paso adicional de la síntesis que utiliza el primer interno para producir una copia complementaria de la sucesión de anclaje. La PCR, entonces, se puede realizar utilizando los primers interno y de anclaje
- 10 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
8. PCR mutagénica La PCR también puede ser utilizada para introducir mutaciones en sitios específicos. Mutagénesis 5‟: (A) Los primers son modificados en el extremo 5‟, por lo que se pueden introducir, por ejemplo, secuencias marcadas, secuencias que contengan un sitio de restricción o un promotor que dirija la expresión. Mutagénesis específica de sitio: (B) En este caso, la mutación ocurre en una zona localizada en el centro del amplicón. Se llevan a cabo dos reacciones de PCR, A y B, que amplifican segmentos superpuestos que contienen la mutación introducida a propósito, al modificar los primers internos de la secuencia original. Luego los dos productos son combinados mediante otra PCR. Mutagénesis por unión incorrecta: En este caso el primer es solo parcialmente complementario a la secuencia original.
Aplicaciones de la PCR.
- 11 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
La PCR ha simplificado y magnificado las posibilidades diagnósticas del ADN en medicina. La nueva tecnología permite el diagnóstico preciso de la patología hereditaria, que incluye tanto los procesos en los que el defecto molecular es conocido en detalle, como aquellos para los que sólo ha sido posible la localización cromosómica del defecto en cuestión. En enfermedades genéticas adquiridas, como el cáncer y los procesos autoinmunes, la PCR permite detectar con precisión los defectos moleculares que han sido definidos, y facilita la exploración de su patología básica. El estudio de la hipervariabilidad en el genoma supone la posibilidad de su empleo en los estudios de susceptibilidad a ciertas enfermedades y la aplicación a la medicina forense y legal. En este campo, el poder discriminativo de la nueva tecnología es altamente superior al obtenido con la metodología clásica. La detección de patógenos infecciosos y la identificación de variabilidad genética asociada a enfermedad se ha visto también revolucionada con la utilización de la tecnología del ADN recombinante. La PCR en el campo de las enfermedades monogénicas tiene dos aplicaciones principales: El análisis indirecto de los procesos hereditarios mediante el estudio de polimorfismos asociados a los genes responsables de los distintos procesos. La detección directa de mutaciones, mediante hibridación, digestión con enzimas de restricción, secuenciación directa del ADN o simple visualización de fragmentos. Además de la posibilidad de análisis de procesos genéticos, cáncer y susceptibilidad a enfermedades, la nueva tecnología permite el análisis rápido de patógenos infecciosos. El análisis de la presencia de estos patógenos y de mutaciones en oncogenes en material médico de archivo, como bloques de tejidos de parafina, fijados en formol, permite importantes trabajos retrospectiv os. Detección de la presencia de HIV en plasma La técnica del PCR permite no solo determinar la presencia del virus en sangre sino también la carga viral. Puesto que la PCR solo puede amplificar ADN, el ARN del HIV-1 debe ser transcripto a ADNc mediante una transcriptasa reversa (RT-PCR). El ARN del HIV-1 se extrae del plasma usando agentes caotrópicos como el tiocianato de guanidina, que inactiva a las RNAsas , luego se precipita con isopropanol y se solubiliza el pellet en agua y se coloca en un tubo de micro centrífuga junto a los otros componentes de la reacción, para amplificar una secuencia de 142-bases del gen gag. Los primeros utilizados poseen 25 a 30 bases de longitud, hibridan por fuera de las regiones de la secuencia del gen gag a amplificar. En la mezcla de reacción se coloca además cantidades conocidas de un estándar interno que es una molécula de ARN sintético idéntico al ARN viral a amplificar con la diferencia que posee una delección (ARN competidor); la presencia de este estándar permite la cuantificación del virus en la muestra problema. Luego que los ciclos de PCR han terminado, los productos de amplificación se separan por electroforesis en un gel teñido con bromuro de etidio. Se determina la intensidad de la banda de 142 pares de bases del ARN del HIV-1 y la intensidad de la banda del producto de amplificación del estándar interno (que tiene una talla menor). La relación de intensidades
- 12 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
de ambos fragmento permite realizar un cálculo del número de copias del ARN del HIV-1 en la muestra original. Detección de genes de microorganismos en alimentos Las aplicaciones de la técnica de PCR en el control de alimentos son numerosas. Se pueden utilizar para identificar especies cárnicas y especies de pescado de interés alimenticio, detectar la presencia de agentes patógenos en los alimentos (Salmonella spp., Listeria monocytogenes, Escherichia coli O157:H7) o detectar la presencia o ausencia de organismos genéticamente modificados (OGM) en los alimentos. Para ello se amplifican por PCR marcadores moleculares específicos y se detecta su presencia en un gel de agarosa. Aplicación de la biología molecular en la identificación de individuos Desde 1990, se empezó a utilizar la técnica de PCR para la identificación molecular forense. Este sistema posibilitó la obtención de información genética útil a partir de muestras provenientes de cadáveres antiguos, de tejidos descompuestos, de restos epiteliales de colillas de cigarrillos o bulbo piloso, etc. básicamente, se identifican secuencias de DNA hipervariables. Los patrones generados por este sistema presentan dos bandas (alelos) en un determinado individuo, cada una de ellas aportada por cada uno de sus progenitores: Condición de inclusión: el individuo comparte una banda con su padre y otra con su madre. Condición de exclusión: el individuo no comparte ninguna banda con su padre o su madre. Si nos encontramos ante una condición de exclusión, podemos afirmar que los supuestos progenitores y el individuo testeado no tienen ninguna relación. Si nos encontramos ante una condición de exclusión, no podemos confirmar con el análisis de un solo sistema que por ejemplo el padre alegado es el padre biológico; por eso debemos utilizar más de un sistema para alcanzar niveles de certeza compatibles con la paternidad. Existe cierto numero de regiones no codificantes de el gen de la mioglobina humana las cuales exhiben un alto grado de variabilidad entre individuos. Estas secuencias presentan un comportamiento de herencia “de padres a hijos” (herencia mendeliana) y se localizan en diferentes regiones del genoma. Estas secuencia se pueden utilizar como sondas o marcadores sobre DNA, llamando a esta técnica DNA fingerprinting (huellas digitales genéticas HDG) o sondas capaces de generar tales patrones se denominan sondas multilocus (MLP). Este tipo de secuencias fueron reemplazadas por otro tipo de secuencias variables pero localizadas en posición determinada del genoma de tal manera que el patrón producido por estas, al ser usadas como sondas, sólo presentaba dos bandas (en la condición heterocigota) o una banda (en la condición homocigota). Estas sondas fueron denominadas unilocus y reciben actualmente la mayor atención por su posibilidad de estandarización y de generación de bancos de datos poblacionales intercomparables. El análisis molecular de los fragmentos variables con sondas de locus múltiple (MLP) o con sondas de locus específico (SLP) permitieron demostrar que tal variación depende del
- 13 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
número de veces que se encuentran presentes ciertos segmentos de ADN, los que constituyen unidades de repetición. Tal propiedad valió para que se las denominará Repeticiones en Tándem de Número Variable (VNTR). Visualización de ADN ELECTROFORESIS FUNDAMENTOS El método electroforético aprovecha la propiedad de las partículas cargadas de migrar en un campo eléctrico, en donde la velocidad de migración depende de la carga de dichas partículas. Este método se puede usar tanto para proteínas como para ácidos nucleicos. Las proteínas poseen carga como resultado de la presencia de aminoácidos básicos (arginina y lisina) y ácidos (glutámico y aspártico) pero también poseen cargas adicionales debido a las modificaciones postraduccionales mediante glicosilación, sulfatación y fosforilación. En el caso del ADN, éste se carga negativamente cuando se encuentra en un buffer alcalino, debido a sus extremos fosfatos y de esta manera puede migrar al ánodo en un campo eléctrico. Otros factores influyen en la migración y la separación del ADN, además de la carga: tamaño del ADN, concentración de agarosa, concentración de ADN e intensidad del campo eléctrico. Los fragmentos del ADN lineal, por ejemplo, migran a través de la matriz del gel a una velocidad inversamente proporcional al log10 de sus pesos moleculares. Esta relación puede ser usada para estimar el tamaño de los fragmentos de ADN. FORMA DE LLEVAR A CABO UNA ELECTROFORESIS Entre los soportes más comunes están: papel, acetato de celulosa, agarosa y poliacrilamida. Estos soportes afectan la movilidad de las moléculas cargadas de manera diferente, ya que pueden absorber moléculas al medio de soporte (tales como los grupos hidroxilos del papel de celulosa) o reducir el movimiento mediante un tamiz de poros moleculares como en el caso del PAGE. La migración de partículas cargadas en un gel, presenta un alto coeficiente de rozamiento. Este tipo de medio no sólo previene la convección y minimiza la difusión sino que participa activamente en la separación de las moléculas haciendo intervenir en forma importante el criterio de dimensión ya que ejercen un efecto de filtración molecular. Este efecto de tamiz es función de la dimensión de los poros del gel, lo que depende de la concentración del gel. Cualquier matriz que el operador elija es importante que sea eléctricamente neutra ya que la presencia de grupos cargados en dicho soporte produce un fenómeno de electroósmosis que disminuye el poder resolutivo de esta técnica. Los soportes más comunes para la electroforesis en gel son los de agarosa y poliacrilamida. Los primeros dan un tamaño de poros más grande y su utilización permite la separación de grandes moléculas mientras que con geles de poliacrilamida se logran poros de pequeño tamaño, haciendo posible la separación de pequeñas macromoléculas.
- 14 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
ELECTROFORESIS EN GELES DE AGAROSA Es un método estándar usado para analizar moléculas de ADN de más de 200 pares de base (pb). La electroforesis en gel de agarosa fue desarrollada primariamente en plataformas horizontales. Los geles horizontales se preparan colocando la agarosa fundida en un molde, cerca del extremo se coloca un peine para formar los pocillos. Una vez que la agarosa ha solidificado, el peine es removido. El método más común para la electroforesis del ADN es el método submarino en el cual el buffer cubre el gel. Se utilizan buffers neutros o alcalinos. Ej: TAE. Éste contiene EDTA que es un agente quelante de cationes divalentes, que son requeridos por las DNasas y así se previene la degradación de la muestra de gel. La agarosa actúa como tamiz molecular, por lo tanto la conformación del ADN afecta su migración y separación durante la electroforesis. El ADN posee tres conformaciones normales: superenrrollado, relajado (circular abierto) y lineal. Generalmente el ADN superenrrollado corre más rápido que el ADN lineal, y éste corre más rápido que el ADN relajado. Cuando el análisis del ADN es cuantitativo, es muy importante que las bandas puedan resolverse y verse claramente. La resolución depende de muchos factores: tamaño y forma del pocillo, tamaño de los fragmentos de ADN, concentración de agarosa y voltaje usado. La intensidad del campo también determina la velocidad de migración del ADN. Un gradiente de altos voltajes conduce a una pobre resolución debido a que los fragmentos tienden a atravesar el gel como una masa compacta. El uso de voltajes bajos puede producir la difusión del ADN de la banda, reduciendo así la resolución. PROTOCOLO CORRIDA ELECTROFORÉTICA EN GEL DE AGAROSA.
Visualizar el ADN extraído corriendo 5 l de muestra en posillos dentro de en un gel de agarosa 0.8% en una cuba de electroforesis usando como buffer de electroforesis TAE 1X y como marcador de peso molecular, 1 Kb. Debe tenerse en cuenta siempre que el volumen de las muestras no debe sobrepasar el volumen de los pocillos del gel. Antes de sembrar la muestra se le agrega un volumen determinado de colorante (1 µl) de frente (azul de bromofenol) para visualizar la corrida. La electroforesis se lleva a cabo a 10 V cm -1 durante 1 h a temperatura ambiente; los geles luego se tiñen con solución de bromuro de etidio y se observan bajo luz UV. Reactivos necesarios. 1. 1X TAE buffer ( 0.04 M Tris-acetate, 0.001 M EDTA, pH 8.0) 2. 0,8 % agarosa en 1X TAE buffer. 3. Solución de bromuro de etidio: 1 µg ml-1 in 1X TAE buffer. 4. Marcador de peso molecular: 1Kb. 5. Buffer de corrida. Preparación del gel de agarosa. 1- Preparar la cuba de electroforesis con el peine correspondiente. - 15 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
2345-
Realizar el calculo necesario para preparar un gel de agarosa 0,8 %(25 ml). Pesar la agarosa. Diluir con TAE 1x hasta 25 ml y calentar hasta disolución. Dejar enfriar 10 minutos y verter solución de agarosa. Dejar solidificar y cubrir el gel con TAE 1x.
Esquema ilustrando el resultado de una corrida electroforética.
ELECTROFORESIS EN GELES DE POLIACRILAMIDA COMPOSICIÓN QUÍMICA. La matriz está compuesta de acrilamida copolimerizada con N, N· - metilenbis acrilamida. La polimerización ocurre cuando el persulfato de amonio se disuelve en agua, formándose radicales libres. Cuando estos radicales libres se ponen en contacto con la acrilamida, ésta se polimeriza en largas cadenas de poliacrilamida, que gelificarán debido a la presencia de la bisacrilamida que forma enlaces cruzados entre las cadenas. El TEMED, una amina cuaternaria N N N tetrametilen diamina actúa como catalizador, debido a su capacidad de existir en la forma de radical libre. Debido a que el oxigeno inhibe la polimerización, la mezcla se somete a vacío o se purga con gas inerte. El tamaño del poro de la acrilamida polimerizada depende de la cantidad de acrilamida usada por unidad de volumen en el medio de reacción, y el grado de entrecruzamiento. La relación acrilamida/bis acrilamida es también crítica para el tamaño de poro. Al aumentar la concentración de acrilamida disminuye el tamaño del poro. Para ajustar aún más el tamaño de poro puede variarse la concentración de bisacrilamida. Pudo establecerse que con un 5% de bisacrilamida con respecto a la cantidad total de acrilamida-bisacrilamida se logra el poro más fino. Por abajo o por arriba de ese porcentaje el tamaño del poro aumenta. Los geles pueden ser hechos en placas planas o en tubos cilíndricos. En ambos casos en el borde superior, el gel forma un menisco que posteriormente distorsiona el esquema de las bandas, para evitarlo se coloca una fina capa de agua antes de que polimerice.
- 16 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
SISTEMAS DE ELECTROFORESIS EN GELES DE POLIACRILAMIDA - Sistema continuo: La concentración del gel , el pH y la fuerza iónica quedan fijos . Se utiliza el mismo buffer en el gel y en las cubas. Utiliza un tipo de gel llamado gel de separación (o de resolución) y además un gel concentrador (o espaciador). - Sistema discontinuo: En este sistema los parámetros anteriores varían pero la resolución es superior. SISTEMAS DESNATURALIZANTES Y NO DESNATURALIZANTES Tanto en los sistemas continuos y discontinuos pueden seleccionarse a su vez un sistema que permita mantener las muestras en su estado nativo, o sea no desnaturalizante mediante el uso de tampones adecuados que no contengan detergentes, con pH y concentración predeterminada y reduciendo el calor al máximo. Por lo contrario cuando la resolución de las muestras proteicas es difícil de llevar a cabo, se incluye en el gel un agente desnaturalizante, siendo el más comúnmente utilizado el detergente dodecil sulfato de sodio (SDS) en concentraciones entre 1 y 2%. En este sistema disociador se logra la disociación de los agregados de macromoléculas en las subunidades polipeptídicas. Existen otros agentes disociantes como urea, ácido acético, ac. Acético más fenol, detergentes no iónicos, o cambios de pH. Con el SDS, la mezcla proteica se desnaturaliza calentando al 100º C durante 1 a 2 min en presencia de un exceso de SDS y beta mercaptoetanol (un agente reductor). La presencia de SDS en todo el sistema incluyendo la muestra negativiza las proteínas, las que migrarán hacia el ánodo de acuerdo solamente a su peso molecular. PROTOCOLO DE UNA CORRIDA ELECTROFORÉTICA DE GELES DE POLIACRILAMIDA
Reactivos y soluciones 1. 10X TBE buffer ( 0.04 M Tris-borato, 0.001 M EDTA, pH 8.0) 2. 40% acrilamida: bis {19:1) y TEMED o:Acryl-a-Mix Solution (6%) 3. 0.5 % ácido acético en 95% de etanol. 4. Azul de bromofenol: 1mg/ml en H20 bidestilada. 5. Solución de persulfato de amonio: persulfato de amonio 10% en H20 bidestilada. 6. TEMED Procedimiento - Se preparan los soportes planos. - Se preparan las soluciones del gel separador. Se cargan los soportes con la solución de acrilamida-bisacrilamida. - Se agrega agua en el borde superior, se deja gelificar. - Se preparan las soluciones del gel concentrador. Se agrega sobre el primer gel, previo secado del agua. Se deja gelificar. - Se preparan las muestras para la corrida, diluyendo en cantidad suficiente del buffer de preparación de muestras, se calienta a baño maría a 100º C durante un minuto y medio.
- 17 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
-
Se arma el aparato de electroforesis, se coloca el buffer de corrida en las cubas respectivas. Se siembran 25l de cada muestra. Se corre en el gel de concentración a 17 mA durante aproximadamente ½ hora y a 25 mA en el gel de resolución.
TEÑIDO CON PLATA Este protocolo describe el uso del DNA Silver Staining System de Promega. Un sistema contiene suficiente reactivo para teñir 10 medidas de gel e incluye: , . 500 µl de silano en pasta . 20µl de nitrato de plata (10 x 2g) . 60 ml de formaldehído, 37 % (20 x 3ml) . 10 ml de tiosulfato de sodio, 10 mg/ml (10 x 1 mi) . 600 g de carbonato de sodio (10 x 60 g) Reactivos no provistos: . Solución fix/stop, . Solución de manchado . Solución reveladora Procedimiento 1. Después de la electroforesis, vaciar la cámara de buffer y afloje con cuidado los sujetadores del gel. Retire los platos de vidrio del aparato. 2. Ubique el gel (platos de vidrio) en una superficie plana. Remueva el peine y los espaciadores del costado. Use una cuña de plástico para separar dcon cuidado los dos platos de vidrio. El gel debería estar fuertemente adherido al plato de vidrio corto. 3. Ubique el gel (adherido al plato corto) en una bandeja de plástico poco profunda (tina de lavado NALGENE®). NOTA. EL USO DE Silver Múltiple Holder permite simultáneamente el teñido de plata de dos o más geles usando aproximadamente la misma cantidad de tiempo uy reactivos. Si dos geles son teñidos, ubique el lado expuesto del gel de ambos platos hacia arriba mientras está la solución. Para el teñido de plato: Paso Solución Tiempo a. solución fix/stop 20 minutos b. agua desionizada 2 minutos c. repita paso b dos veces 2 x 2 minutos d. solución de teñido 30 minutos e. agua desionizada 10 segundos f. solución reveladora (4-10ºC) hasta 5 minutos
- 18 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
g. solución fix/stop 5 minutos b. agua desionizada 2 minutos 4. Posicione el gel verticalmente y deje secar durante toda la noche.
ELECTROFORESIS DE CAMPO PULSADO La electroforesis de campo pulsado se basa en la reorientación periódica del campo eléctrico que permite la separación de moléculas de ADN del orden de las 2 megabases (Mb). Las moléculas de ADN de mayor tamaño se resuelven porque son selectivamente retardadas en el campo pulsado. Las alternancias en la polaridad de los electrodos producen cambios en la dirección de migración; la velocidad de reorientación de las moléculas de ADN varía en función del tamaño. Una explicación de ésto es que una molécula de ADN de elevado peso molecular utiliza una porción considerable de cada ciclo reorientándose con respecto al campo. Existen diferentes tipos de electroforesis de campo pulsado: FIG, RGE, TAFE y CHEF. Actualmente el más empleado es el CHEF (Contour-clamped homogeneous electric field) emplea un arreglo geométrico de los electrodos para producir un campo que es reorientado electrónicamente. Múltiples electrodos dispuestos alrededor de un círculo están sujetos a potenciales iguales en un campo uniforme. El grado de uniformidad del campo aumenta con el número de electrodos, en consecuencia los geles pueden correrse libres de cualquier distorsión significativa. El primer equipo de CHEF fue construido con los electrodos dispuestos en un cuadrado de tal manera que el campo estaba reorientado por 90º. Aunque la migración de las moléculas de ADN fue uniforme a lo largo del gel, la resolución fue pobre. Posteriormente se ensayó un diseño en donde los electrodos estaban dispuestos en forma hexagonal, originando un ángulo de reorientación de 120º, lo cual produjo una excelente resolución en moléculas de ADN por arriba de las 10 Mb.
- 19 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
3- Actividades prácticas A- Búsqueda del gen pcoA en cepas de actinomycetes mediante PCR Los genes pcoA y pcoR forman parte del operon pco (plamid-borne copper resistance) presente en el plasmido pRJ1004 detectado en una cepa de E. coli resistente a cobre. A su vez, dichos genes fueron detectados mediante PCR en aislamientos de suelo lo cual sugiere la posible transferencia de los genes pcoA y pcoR en cepas de actinomycetes tolerantes a cobre. Materiales: o o o o o o o o
Buffer STR DNA polimerasa Primers: pcoA1- pcoA2 ADN Agua bidestilada estéril Micropipetas – Tips – Tubos de PCR – Termociclador. Agarosa – Cuba de electroforesis – Marcador de PM 1kb Bromuro de etidio - Analizador de imagenes
Metodología 1. Preparar la mezcla de reaccion (volumen final 25 ul) Buffer STR 10X Primers F (pcoA1) R (pcoA2) DNA polimerasa ADN H2O bd esteril
2,5 ul 0,2 ul 0,2 ul 0,2 ul 1 ul 20,9 ul
2. Realizar la PCR usando las siguientes condiciones 95ºC 95ºC 57ºC 72ºC 72ºC 4ºC
5‟ 90‟‟ 90‟‟ 2‟ 7‟ inf
35 ciclos
3. Visualizar los productos de PCR en gel de agarosa al 0,8%. Usar el marcador de peso molecular 1kb (Promega). 4. Una muestra de los resultados que se consiguen aparece en la gráfica siguiente:
- 20 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
1
2
3 4
5
6
7
8
9
10
Primera banda: Amplificación de 300pb esperada Segunda banda: Dímero de cebadores Calle 1: marcador de 1 kpb ("ladder") Calle 2: control positivo Calle 3: control negativo Calles 4 a 10: resultado de la PCR de distintas colonias
- 21 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Trabajo Práctico N2 VECTORES DE CLONADO
1- Objetivos • Que el alumno comprenda la importancia del uso de los vectores de clonado para la tecnología del ADN recombinante. • Que el alumno conozca las aplicaciones y usos de los vectores de clonado. • Que el alumno adquiera destrezas conducentes a la manipulación de vectores de clonado en el laboratorio. • Que el alumno pueda interpretar los resultados obtenidos en relación al objetivo del experimento planteado.
2- Introducción TECNOLOGIA DEL ADN RECOMBINANTE La tecnología del ADN recombinante constituye una suma de técnicas siendo las más importantes: La rotura específica del ADN mediante nucleasas de restricción, que facilita el aislamiento y la manipulación de los genes individuales. La secuenciación rápida de todos los nucleótidos de un fragmento purificado de ADN, que posibilita determinar los límites de un gen y la secuencia de aminoácidos que codifica. La hibridación de los ácidos nucleicos que hace posible localizar secuencias determinadas de ADN o ARN, utilizando la capacidad que tienen estas moléculas de unirse a secuencias complementarias de otros ácidos nucleicos. La clonación del ADN, mediante la cual se puede conseguir que un fragmento de ADN se integre en un elemento génico autorreplicante (vectores de clonado y expresión) que habita en una bacteria, de tal manera que una molécula simple de ADN puede ser producida generando muchos miles de millones de copias idénticas. La ingeniería genética mediante la cual se pueden alterar secuencias de ADN produciendo versiones modificadas de los genes, los cuales se pueden insertar a células u organismos.
VECTORES DE CLONADO Un Vector es un agente que lleva un fragmento de ADN foráneo a una célula huésped. Si se lo utiliza con el fin de reproducir el fragmento de ADN, se llama vector de clonado. Si
- 22 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
se usa para expresar un gen de interés, se llama vector de expresión. Los vectores comúnmente utilizados son plásmidos, fago Lambda, cósmidos y cromosoma artificial de levadura (YAC).
Un típico vector de clonado. Contiene un sitio de policlonado( polilinker), un gen de resistencia a Ampicilina (ampr) como marcador y un origen de replicación (ORI). Modelo de clonado. Utilizando un plásmido se inserta y liga un fragmento con un gen de interés. Capacidad de almacenaje: hasta 25 Kb.
Los plásmidos se utilizan en ingeniería genética como vectores de clonado por la facilidad con la que se manipulan. Un vector plasmídico se fabrica a partir de plásmidos naturales cuyos segmentos innecesarios son eliminados, agregándose en cambio secuencias esenciales. Para clonar una muestra de la ADN, se debe utilizar la misma enzima de restricción para cortar el vector y la muestra de ADN. Por lo tanto, un vector contiene generalmente una secuencia (polylinker) que pueda reconocer varias enzimas de restricción para poder utilizar el vector para clonar diversos fragmentos de ADN.
PLÁSMIDOS. DEFINICIÓN. REPLICACIÓN. TAMAÑO Y NÚMERO.
- 23 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Son moléculas de ADN extracromosómico circular o lineal, independientes del ADN cromosómico. Están presentes normalmente en bacterias, y más raramente en organismos eucariotas. Tienen capacidad de replicación autónoma, es decir, constituyen replicones propios. Todos los plásmidos bacterianos estudiados son de ADN de cadena doble. La inmensa mayoría son circulares cerrados covalentemente (C.C.C.) y superenrollados aunque en Borrelia y algunos actinomycetes existen plásmidos lineares. Algunos plásmidos poseen, además, la capacidad de integrarse reversiblemente en el cromosoma bacteriano: en esta situación se replican junto con el cromosoma (bajo el control de éste), y reciben el nombre de episomas. En cuanto al tamaño, existe una amplia gama: desde plásmidos muy pequeños (de unas 2 kb) hasta plásmidos muy grandes (ciertos plásmidos de Pseudomonas tienen 500 kb). Incluso existen “megaplásmidos” en ciertos Rhizobium que llegan a tener 1600 kb.
Cada tipo de plásmido tiene un número medio de copias por célula característico. Por regla general, los grandes plásmidos tienen una o dos copias por célula (plásmidos con control estricto de la replicación), mientras que los pequeños suelen estar presentes como varias copias (>10), denominándose plásmidos de control relajado. En función de que los plásmidos sean o no transmisibles de una bacteria a otra por medio de contactos intercelulares, se pueden distinguir:
- 24 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015
plásmidos conjugativos (autotransmisibles), que son aquellos que se transfieren entre cepas por medio de fenómenos de conjugación. Algunos de estos plásmidos no sólo se transfieren entre cepas de la misma especie, sino que son capaces de hacerlo entre especies y géneros muy diversos, recibiendo el muy apropiado nombre de plásmidos promiscuos o de amplio espectro de hospedadores, permitiendo transferencia horizontal de información genética entre grupos bacterianos filogenéticamente alejados. plásmidos no conjugativos, carentes de esta propiedad de conjugación. Dentro de esta categoría existe un subgrupo, el de los plásmidos movilizables: son aquellos no autotransmisibles que pueden ser transferidos por la acción de un plásmido conjugativo coexistente en la misma bacteria.
Los plásmidos no suelen ser indispensables para la viabilidad de la bacteria, y muchos de ellos se pierden en ausencia de una presión selectiva. Una bacteria puede ser “curada” de su(s) plásmido(s), cuando desaparecen de forma espontánea o por una serie de tratamientos experimentales (incubando las bacterias a temperaturas cercanas a la máxima o por agentes químicos como el naranja de acridina, que se insertan entre las bases del ADN). La razón de esta curación de los plásmidos es que esos tratamientos interfieren con su replicación sin afectar a la replicación del cromosoma. Esto hace que en sucesivas divisiones de una bacteria, el plásmido se vaya “diluyendo” en la población resultante. FENOTIPOS Y FUNCIONES DETERMINADOS POR PLÁSMIDOS Los plásmidos no suelen determinar productos esenciales para el crecimiento (por eso son dispensables), pero en la naturaleza parece que resultan favorecidas las bacterias con algún plásmido, quizá porque acarrean ventajas selectivas en determinados ambientes o en determinadas condiciones. Existe una variedad de fenotipos y funciones determinados por plásmidos:
Resistencia a antibióticos (plásmidos R; los estudiaremos en la sección de Genética). Resistencia a metales pesados (por ejemplo, resistencia a mercurio). Plásmidos de virulencia: producción de toxinas, factores de penetración en tejidos, adherencia a tejidos del hospedador, etc., en ciertas bacterias patógenas. Producción de bacteriocinas (proteínas tóxicas producidas por bacterias que matan a otras de la misma especie). Producción de sideróforos (quelatos para secuestrar iones Fe3+). Utilización de determinados azúcares. Utilización de hidrocarburos, incluyendo algunos cíclicos recalcitrantes (degradación de tolueno, xileno, alcanfor, etc.) en Pseudomonas. Inducción de tumores en plantas (plásmido Ti de Agrobacterium tumefaciens). Interacciones simbióticas y fijación de nitrógeno en ciertos Rhizobium.
- 25 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Hay plásmidos que, aunque se pueden evidenciar por métodos físicos (p. ej., electroforesis), no se ha podido demostrar que determinen ningún rasgo fenotípico: tales plásmidos se califican como crípticos, constituyendo un ejemplo de “ADN egoísta” (sólo se mantienen por su capacidad de replicación, sin necesidad de aportar ventaja selectiva clara a la bacteria que los alberga). REPLICACIÓN Los plásmidos son replicones, es decir, unidades de replicación autónoma, pero no codifican toda la maquinaria para su propia replicación. La mayoría de los plásmidos sólo codifican unas pocas proteínas para este fin, y aprovechan la maquinaria de replicación de la bacteria huésped (ADN polimerasas, ligasas, primasas, etc), que actúa sobre unas secuencias del plásmido denominadas secuencias oriV, donde tiene lugar el inicio de esa replicación. Cada tipo de plásmido se replica por uno de dos principales tipos de mecanismos:
Modelo de replicación en (theta): comienza por la separación de las dos cadenas en el sitio oriV, creando una estructura que se parece a la letra griega (theta). En algunos plásmidos, la replicación es unidireccional (sólo hay una horquilla de replicación , que avanza a lo largo de la molécula, hasta que vuelve al sitio oriV, en el que las dos moléculas hijas se separan). Otros plásmidos se replican en por un modelo bidireccional (dos horquillas de replicación de sentidos opuestos, que se encuentran cerca de la mitad de la molécula). La replicación en es frecuente en plásmidos de bacterias Gram-negativas.
Modelo de replicación en σ (sigma), o modelo del círculo rodante: una de las dos cadenas es rota a nivel de oriV, de modo que el extremo 3‟ suministra el cebador para la replicación de la “cadena adelantada”. La cadena desplazada (cadena “menos”) funciona como cadena retrasada (“lagging”) y debe ser replicada a partir de sitios de cebado especiales. Este tipo de replicación es frecuente en plásmidos de bacterias Gram-positivas.
NÚMERO DE COPIAS Y SU REGULACIÓN La regulación del número medio de copias de cada plásmido en cada bacteria es una propiedad característica dependiente de cómo se controla el inicio de replicación, siendo diferentes los mecanismos en los plásmidos de alto número de copias (con control relajado) y en los plásmidos de bajo número de copias (de control estricto). En general, los plásmidos de control relajado tienen mecanismos que inhiben el inicio de replicación sólo cuando el número de copias ha llegado a un cierto nivel. En cambio, los plásmidos de control estricto tienen mecanismos que logran que sólo se repliquen una vez o un pequeño número de veces en cada ciclo celular. - 26 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
REPARTO DE LAS COPIAS A LAS CÉLULAS HIJAS Muchos plásmidos poseen sistemas de reparto (= partición), que tienden a asegurar que una vez que el plásmido ha sido replicado, cada una de las células hijas va a recibir al menos una copia. A falta de un tal sistema, y si el reparto fuera aleatorio, de vez en cuando, las propias fluctuaciones de la segregación aleatoria harían que parte de la progenie no recibiera una copia, con lo que quedaría curada de ese plásmido. El reparto de las copias a las células hijas se suele deber a las llamadas funciones par, que están cerca de los genes rep y de la zona ori. Se trata de cortas secuencias de ADN que de alguna manera aún no aclarada, debe unirse a alguna zona de la membrana de la bacteria que se duplica durante la división celular, de modo que cada copia, unida a una de esas zonas, se segrega a una célula hija. INCOMPATIBILIDAD ENTRE PLÁSMIDOS Y GRUPOS DE INCOMPATIBILIDAD Cada plásmido, dentro de la amplia diversidad de los que se conocen, se suele clasificar según el grupo de incompatibilidad al que pertenece (los grupos de incompatibilidad se suelen denominar con las siglas Inc seguidas de una letra mayúscula (por ejemplo IncP, IncFII, etc.). Se dice que dos plásmidos son incompatibles cuando no pueden coexistir establemente en la misma bacteria en ausencia de una presión selectiva permanente. Grupo de incompatibilidad es el conjunto de plásmidos incompatibles entre sí. La incompatibilidad depende del hecho de que los distintos miembros de un mismo grupo poseen el mismo tipo de sistema de control del número de copias y de reparto de dichas copias a las células hijas. En cada célula con dos plásmidos distintos del mismo grupo de incompatibilidad, el número total de copias nA+nB = N (determinado por el sistema de control) no varía, pero por fluctuaciones aleatorias en el reparto, algunas células heredan más copias de uno de los plásmidos que del otro, y tras varias generaciones aparecen células carentes de uno o del otro plásmido (nA = 0 y nB = N, o viceversa).
BACTERIÓFAGOS Los bacteriófagos (fago lambda) constituyen otra forma de transporte de secuencias de interés de un organismo a otro. En este caso, el gen es ligado con el ADN viral que luego se empaqueta y por el mecanismo de transducción, se introduce a una célula huésped. La ventaja principal del fago λ es su alta eficacia de transformación, cerca de 1000 veces más eficiente que el vector plasmídico. Las extremidades del ADN del fago lambda se conocen como sitios cos, cada uno simple cadena de 12 nucleótidos de largo. Debido a que sus secuencias son complementarias entre sí, las secuencias terminales del DNA del fago pueden aparearse, formando concatámeros. Los dos extremos del DNA del fago pueden también ligarse, formando una ADN circular. Capacidad de almacenaje: hasta 25 Kb.
- 27 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
CÓSMIDOS Los cósmidos surgen de una combinación de vectores plasmídicos con fragmentos de ADN derivados del genoma del fago lambda que poseen un borde cohesivo (extremos cos). Estos extremos permiten que el ADN se circularice y asemeje un plásmido con capacidad de empaquetar fragmentos largos de ADN en el interior de un fago (hasta 45 kb). Otra ventaja lo constituye su alta eficiencia de transformación.
- 28 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Clonación usando cósmidos. (a) Además de Ampr, de ORI, y de polylinker como en el vector plasmídico, el cósmido también contiene un sitio cos. (b) Después de que los cósmidos son cortados con enzimas de restricción, se ligan con los fragmentos de ADN. Los pasos subsecuentes de ensamblaje y transformación son iguales que en la clonación con fagos λ. YACs Los cromosomas artificiales de levadura (YAC) son vectores capaces de llevar largos fragmentos de DNA (hasta 2 Mb) pero su eficiencia de transformación es muy baja.
- 29 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Una vez ligado el ADN de interés con el vector se transforman células de levadura para obtener un gran número de copias. Secuencias esenciales en YAC o Centrómeros (CEN), telómeros (TEL) y secuencias de replicación autónomas (ARS) para proliferación in la célula huésped. o ampr para amplificación selectiva y marcadores tales como TRP1 y URA3 para identificar células conteniendo vectores YAC. o Sitios de reconocimiento de enzimas de restricción (por ej: EcoRI y BamHI) MARCADORES Los vectores de clonado deben llevar otros genes denominados marcadores, que sirven para identificar las células que contienen el vector de clonación. Se suelen utilizar como marcadores:
Genes de resistencia a antibióticos. Sirven para identificar bacterias que contienen el vector de clonación, porque estas bacterias serán resistentes al antibiótico del gen marcador. Genes de luminiscencia (GFP, EGFP).. En este caso, la célula que contenga el gen que se quiere clonar, tendrá la propiedad de emitir luz, ya que el marcador que se le incorpora determina que se exprese esa característica. Este sistema se emplea cuando la célula hospedadora es una célula eucariota. Gen lacZ (operón β glucosidasa). El gen lacZ’ presente en el plásmido contiene un sitio de policlonado. En ausencia de inserto, la bacteria en medio con el inductor IPTG y del sustrato X-gal, produce -galactosidasa, que convierte el sustrato X-gal a una sustancia azul, por lo que las colonias aparecen de este color. Si hay un inserto interrumpiendo el gen lacZ’, la bacteria no produce -galactosidasa, y las colonias aparecen blancas.
- 30 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
3- Actividades prácticas EXTRACCIÓN DE ADN PLASMIDICO SOLUCIONES PARA AISLAMIENTO Y PURIFICACIÓN DE ADN PLASMÍDICO. 1. Pellet obtenido a partir de 1 ml de medio de cultivo de E. coli overnight. 2. Solución I: glucosa 50 mM; Tris HCl 25 mM pH 8; EDTA 10 mM pH 8,0. 3. Solución II: SDS 1%; NaOH 0,2 N. 4. Solución III: Acetato de potasio, 5 M; ácido acético, pH 4,8 5. Fenol-cloroformo- alcohol isoamílico (25:24:1). 6. Cloroformo- alcohol isoamílico 24:1 (v/v). 7. Isopropanol. 8. 70 % etanol. PROTOCOLO PARA AISLAMIENTO Y PURIFICACIÓN DE ADN PLASMÍDICO. Se inocula 10 ml de un medio LB con una cepa de E. coli de interés y se incuba a 37º C durante toda la noche. - Las células se recuperan por centrifugación. El precipitado celular se resuspende en 200 l de solución I fría. Se incuba 5 minutos en hielo.
- 31 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015Se agrega 400 l de solución II Se homogeneiza suavemente y se incuba 5 minutos en hielo. Esta solución produce lisis celular y desnaturaliza el ADN y las proteínas. Tiene el pH entre 12 y 12,5, en el cual el ADN cromosómico es selectivamente desnaturalizado, mientras que el ADN plasmídico covalentemente cerrado no es afectado. Las proteínas también son desnaturalizadas a este pH, reduciendo la posibilidad de degradación enzimática del ADN plasmídico. El SDS lisa las células y desnaturaliza las proteínas. Se agrega 300 l de solución III fría. Se mezcla por inversión varias veces y se incuba 5 minutos en hielo. En este paso la mezcla es neutralizada por adición de la solución de acetato de sodio con un pH 4,8. Al descender bruscamente el pH, el ADN cromosomal forma un complejo insoluble, que junto con el complejo formado por la proteína y el SDS es precipitado en un medio con alta concentración salina. Se centrífuga a temperatura ambiente durante 5 a 7 minutos y se recupera el sobrenadante en un nuevo tubo. Se agrega un volumen de fenol, se mezcla, se centrífuga y se recupera la porción superior. El fenol desnaturaliza las proteínas y remueve selectivamente el ADN desnaturalizado a partir de la solución acuosa. Se agrega un volumen de cloroformo: alcohol isoamílico para extraer el fenol, se mezcla, se centrífuga y se recupera la parte superior. Este paso se repite dos veces. Al sobrenadante se le agrega un volumen de isopropanol frío. Se mezcla invirtiendo varias veces y se incuba en freezer a –20º C durante 2 horas. Se centrífuga 15 minutos y se elimina el sobrenadante. Se agrega 500 l de etanol 70%. Se deja a temperatura ambiente por 15 minutos y se centrífuga 30 segundos. Se seca al vacío y se resuspende en 20l de TE ( Tris HCI 10 mM; EDTA 1 mM; pH 8,0 ) estéril. Se conserva en freezer a –20º C. Visualizar los plásmidos en gel de agarosa al 0,8%. Usar el marcador de peso molecular 1kb (Promega). Cuando se realizá la extracción los plásmidos pueden presentarse de tres formas (que coexisten o no): superenrollados (supercoiled), lineales (linear; con dos hebras cortadas)y circulares abiertos (open circular; con una hebra cortada). En la figura siguiente, se pueden observar los tres tipos de conformaciones que Ud. puede visualizar en el gel luego de la extracción y corrida de los plásmidos en el práctico:
- 32 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
- 33 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Trabajo Práctico N3 BIOINFORMÁTICA 1- Objetivos • Que el alumno comprenda los conceptos teóricos y prácticos que son área de estudio de la bioinformática. • Que el alumno comprenda la importancia de esta disciplina en la labor del biólogo contemporáneo. • Que el alumno conozca las aplicaciones de esta disciplina en las ciencias biológicas. • Que el alumno sea capaz de manejar bases de datos disponibles on line. • Que el alumno conozca y tenga un manejo básico de los distintos tipos de programas bioinformáticos disponibles on line.
2- Introducción La bioinformática es la aplicación de la tecnología de computadoras a la gestión y análisis de datos biológicos. Esta disciplina requiere el uso y/o el desarrollo de diferentes técnicas entre las que se incluyen informática, matemática aplicada, estadística, ciencias de la computación, inteligencia artificial, química y bioquímica. Es una disciplina muy utilizada actualmente para resolver problemas experimentales en las ciencias biológicas, y tiene utilidad para muchas especialidades desde la taxonomía, pasando por la fisiología hasta la biología molecular. Y es por ello que el biólogo contemporáneo debe conocer y trabajar con esta herramienta desde los primeros años de su formación universitaria. Hay tres sub-disciplinas importantes dentro de la bioinformática:
El desarrollo de nuevos algoritmos y estadísticas para evaluar relaciones entre miembros de colecciones grandes de datos. El análisis y la interpretación de varios tipos de datos, incluyendo secuencias de nucleótidos y de aminoácidos, dominios y estructuras de proteínas. El desarrollo y la puesta en práctica de herramientas que permitan el acceso y manejo eficiente de diversos tipos de información para correlacionarlos exactamente.
El uso de la bioinformática en el área de la Biología Molecular es importante porque:
La sencillez de los métodos de clonado y secuenciación del ADN ha generado una enorme cantidad de datos de secuencias de nucleótidos. Pese a que satisface - 34 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
las ambiciones de precisión química de muchos biólogos, esta información es inútil hasta que puedan deducirse las características significativas de las secuencias. Los posibles patrones son difíciles de determinar, y las secuencias que contienen muchos pares de bases resultan de un análisis difícil de realizar. Este crecimiento explosivo en la cantidad de información biológica hizo necesario el uso de computadoras y el desarrollo de nuevos programas para poder almacenar, clasificar y acceder a los datos almacenados. Es posible realizar el análisis de expresión de miles de genes en un solo experimento. Mientras que antes un científico investigaba la expresión de un gen en particular implicado en una determinada enfermedad actualmente puede estudiarse la expresión de varios genes simultáneamente. La utilización de la bioinformática permite realizar este tipo de análisis. Permite la recuperación u obtención de mayores números de datos. Facilita el proceso por el cual se desarrollan hipótesis con respecto a la función o estructura de un gen o una proteína de interés. Hace posible la identificación de secuencias similares en diversos organismos. Por ejemplo, el descubrimiento de nuevas relaciones filogenéticos y nuevos patrones evolutivos. Durante los últimos quince años, el desarrollo de herramientas eficientes para el almacenamiento y manejo de datos ha permitido un aumento sin precedente de información acerca de secuencias, de estructuras y de la literatura. La similitud de secuencias entre genes de enfermedades humanas y genes en organismos modelos tales como levaduras y E. coli, en los que los estudios genéticos son mas fáciles de realizar, permite la generación de hipótesis con respecto al posible papel de los genes humanos. En este caso, el gen asociado con un tipo de cáncer de colon hereditario resultó ser similar a los genes MSH2 de la levadura y E. coli, que se saben están involucrados en la reparación del ADN. El conocimiento de la función normal del gen es la base fundamental para comprender la base molecular de la enfermedad, y posiblemente desarrollar estrategias de tratamiento y/o prevención.
Las aplicaciones de las técnicas bioinformáticas son múltiples pero se pueden citar algunos ejemplos:
Comparación y alineamiento de secuencias de ADN y proteínas, para determinar homología y relaciones de parentesco entre especies (TaxonomíaSistemática). En base a las secuencias de genes presentes en las bases de datos se pueden hacer predicciones sobre la secuencia, estructura y propiedades de las proteínas codificadas por los mismos de genes (Biología Molecular). Análisis de genomas. Interacciones proteína-proteína teniendo en cuenta las animaciones 3D generadas a partir de las secuencias de aminoácidos presentes en las bases de datos.
- 35 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
En esta clase te presentaremos direcciones de utilidad en Internet para el análisis de secuencias y búsquedas de información y realizaremos algunas actividades prácticas de tal manera que puedas hacer uso de los recursos de algunas de estas páginas: PARA BÚSQUEDA DE SECUENCIAS HOMÓLOGAS
http://www.ncbi.nlm.nih.gov/BLAST/ http://seqtool.sdsc.edu/CGI/BW.cgi#! http://www.fasta.genome.ad.jp/ http://www.ebi.ac.uk/embl/ http://147.47.212.35:8080/index.jsp
PARA ALINEAMIENTOS MÚLTIPLES
http://www.ebi.ac.uk/Tools/msa/clustalw2/ http://www.toulouse.intra.fr/multalin.html http://dot.imagen.bcm.tmc.edu:9331/multi-align/multi-align.html
PARA COMPARACIÓN DE DOS SECUENCIAS
http://www.ncbi.nlm.nih.gov/gorf/bl2.html
DISEÑO DE PRIMERS PARA SER UTILIZADOS EN PCR Y/O RT-PCR
http://seqtool.sdsc.edu/CGI/BW.cgi#! http://www.genome.wi.mit.edu/cgi-bin/primers/primers3_www.cgi http://insilico.ehu.es/
TRADUCCIÓN ADN A PROTEÍNAS
http://expasy.cbr.nrc.ca/tools/dna.html http://www2.ebi.ac.uk/translate/
IDENTIFICACIÓN DE PAUTAS DE LECTURAS Y ANÁLISIS DE PROTEÍNAS
http://seqtool.sdsc.edu/CGI/BW.cgi#!
IDENTIFICACIÓN DE SECUENCIAS CONSENSO Y DOMINIO ESTRUCTURALES
http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi http://www.smart.embl.heidelberg.de/ http://www.expasy.ch/
- 36 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
3- Actividades prácticas 3.1.
Búsqueda y comparación de secuencias de ADN en bases de datos.
El ARN ribosómico (ARNr) 16S es la macromolécula más ampliamente utilizada en estudios de filogenia y taxonomía bacterianas. Su aplicación como cronómetro molecular fue propuesta por Carl Woese (Universidad de Illinois) a principios de la década de 1970. Woese introdujo el término dominio para sustituir al reino como categoría taxonómica de rango superior, y distribuyó a los organismos celulares en tres dominios: Bacteria, Archaea y Eukarya, el último de los cuales engloba a todos los seres eucariotas. Desde entonces, el análisis de los ARNr 16S se ha utilizado ampliamente para establecer las relaciones filogenéticas dentro del mundo procariota, causando un profundo impacto en nuestra visión de la evolución y, como consecuencia, en la clasificación e identificación bacteriana. En este primera actividad, vamos a buscar la secuencia de ADN que codifica para el ARNr 16S de una bacteria en la base de datos NCBI y la vamos a comparar utilizando el algoritmo BLAST con las secuencias cercanas para construir un árbol filogenético. El National Center for Biotechnology Information (NCBI) es parte de la Biblioteca Nacional de Medicina de Estados Unidos (National Library of Medicine), una rama de los Institutos Nacionales de Salud (National Institutes of Health o NIH). Está localizado en Bethesda, Maryland y fue fundado el 4 de noviembre de 1988 con la misión de ser una importante fuente de información de biología molecular. Almacena y actualiza la información referente a secuencias genómicas en GenBank, un índice de artículos científicos referentes a biomedicina, biotecnología, bioquímica, genética y genómica en PubMed, una recopilación de enfermedades genéticas humanas en OMIM, además de otros datos biotecnológicos de relevancia en diversas bases de datos. Todas las bases de datos del NCBI están disponibles en línea de manera gratuita, y son accesibles usando el buscador Entrez. El NCBI ofrece además algunas herramientas bioinformáticas para el análisis de secuencias de ADN, ARN y proteínas, siendo BLAST una de las más usadas. El BLAST (Basic Local Alignment Search Tool) es un programa informático de alineamiento de secuencias de tipo local, ya sea de ADN o de proteínas. El programa es capaz de comparar una secuencia problema (también denominada en la literatura secuencia query) contra una gran cantidad de secuencias que se encuentren en una base de datos. El algoritmo encuentra las secuencias de la base de datos que tienen mayor parecido a la secuencia problema. Es importante mencionar que BLAST usa un algoritmo heurístico por lo que no nos puede garantizar que ha encontrado la solución correcta. Sin embargo, BLAST es capaz de calcular la significación de sus resultados, por lo que nos provee de un parámetro para juzgar los resultados que se obtienen.
- 37 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Normalmente el BLAST es usado para encontrar probables genes homólogos. Por lo general, cuando una nueva secuencia es obtenida, se usa el BLAST para compararla con otras secuencias que han sido previamente caracterizadas, para así poder inferir su función. El BLAST es la herramienta más usada para la anotación y predicción funcional de genes o secuencias proteicas. Ingresa a http://www.ncbi.nlm.nih.gov Elige la opción “Nucleotide” y en el buscador ingresa “Amycolatopsis tucumanensis strain ABO 16S ribosomal RNA gene”.
Copia la secuencia y entra nuevamente a la página principal. Una vez allí, elige el link “Blast”
- 38 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Dentro de esa página, elige la opción “nucleotide blast” (compara nuestra secuencia de ADN con otras secuencias de ADN en la base de datos).
Pegar la secuencia en el casillero vacío y poner las opciones “others” y “highly similar sequences”, luego pinche en “blast” como se indica:
- 39 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Se obtendrá una nueva página con el alineamiento y las secuencias:
Selecciona 10 secuencias y clickea “get selected sequences”.
- 40 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Obtendrás un archivo con las secuencias en formato FASTA (este formato permite trabajar con las secuencias en todos los programas bioinformáticos). Guárdalo para la siguiente actividad.
Ejemplo de secuencia en formato FASTA: >gi|113957095|gb|DQ886938.1| Amycolatopsis tucumanensis strain ABO 16S ribosomal RNA gene, partial sequence AGAGTTTGATCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGA ACGCTGAAGCACCTTCGGGTGTGGATGAGTGGCGAACGGGTGAGTAACACGTGGGTAA CCTGCCCTGTACTTTGGGATAAGCCCTGGAAACGGGGTCTAATACCGAATATGACTCGC TAAGGCATCTTGGTGGGTGGAAAGTTTCGGCGGTACAGGATGGGCCCGCGGCCTATCA GCTTGTTGGTGGGGTAGTGGCCTACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGT GACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGG GAATATTGCACAATGGGCGGAAGCCTGATGCAGCGACGCCGCGTGAGGGATGACGGC CTTCGGGTTGTAAACCTCTTTCGCCAGGGACGAAGCGCAAGTGACGGTACCTGGAGAA GAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTGT CCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGCTTGTCGCGTCTGCTGTGAAAATC CGGGGCTTAACTCCGGACCTGCAGTGGATACGGGCAGGCTTGAGTTCGGTAGGGGAGA CTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGA AGGCGGGTCTCTGGGCCGATACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAG GATTAGATACCCTGGTAGTCCACGCTGTAAACGTTGGGCGCTAGGTGTGGGCGACTTCC ACGTTGTCCGTGCCGTAGCTAACGCATTAAGCGCCCCGCCTGGGGAGTACGGCCGCAA GGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGCGGAGCATGTGGATTA ATTCGATGCAACGCGAAGAACCTTACCTGGGCTTGACATGCACTGGAAACCGGCAGAG ATGTCGGCCCCCTTGTGGCCGGTGTGCAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCG
- 41 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
TGAGATGTTGGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCCTGTGTTGCCAGCGCG TAATGGCGGGGACTCGCGGGAGACTGCCGGGGTCAACTCGGAGGAAGGTGGGGATGA CGTCAAGTCATCATGCCCCTTATGTCCAGGGCTTCACACATGCTACAATGGCTGGTACA GAGGGCTGCGATACCGTGAGGTGGAGTGAATCCCTTAAAGCCGGTCTCAGTTCGGATC GCAGTCTGCAACTCGACTGCGTGAAGTCGGAGTCGCTAGTAATCGCAGATCAGCAACG CTGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACGTCATGAAAGTCGGT AACACCCGAAGCCCATGGCCCAACCCCGCTTGCGGGGAGGGAGTGGTCGAAGGTGGG ACTGGCGATTGGGACGAAGTCGTAACAAGGTAACCGTA
3.2.
Alineamiento múltiple de secuencias y construcción de arbol filogenético.
Un árbol filogenético es un árbol que muestra las relaciones evolutivas entre varias especies u otras entidades que se cree que tienen una ascendencia común. En biología se utilizan árboles parecidos a los genealógicos para representar cómo se encuentran emparentados los organismos vivos, se les conoce como árboles filogenéticos. A diferencia de los árboles genealógicos, en los que se utiliza información proporcionada por los familiares, para los árboles filogenéticos se usa información proveniente de fósiles, así como aquélla generada por la comparación estructural y molecular de los organismos. Tanto los árboles genealógicos como los filogenéticos tienen un tronco y ramas, pero en los últimos se muestran las relaciones entre taxas y no entre individuos. Los árboles filogenéticos se construyen tomando en cuenta la teoría de la evolución, que nos indica que todos los organismos son descendientes de un ancestro común. Así, todos los organismos, ya sean vivos o extintos, se encuentran emparentados en algún grado. Para la construcción de árboles se consideran un conjunto de taxas representadas por un conjunto de carácteres. Las taxas pueden ser distintos niveles jerárquicos: especies, familias, géneros, y se llaman generalmente Unidades Taxonómicas Operacionales (OTUs). Un carácter es cualquier característica bien definida de la OTU que permita dividir el conjunto de OTUs en grupos, según el valor que toma el carácter para cada OTU. Así un subconjunto de las OTUs formará un grupo respecto a dicho carácter si comparten una misma forma o valor de dicho carácter. En la filogenia clásica, los caracteres utilizados para la construcción de árboles son elementos del fenotipo, por ejemplo: tipo de anexos tegumentarios epidérmicos (escamas, plumas, pelos, etc.). En la filogenia molecular, los caracteres son las secuencias de nucléotidos del ADN o las secuencias de aminoácidos de una proteína. Para la construcción de un árbol filogenético se deben seguir los siguientes pasos: 1. Definir conjunto de secuencias a analizar (DNA, RNA o proteínas) provenientes de distintos organismos. 2. Alinear correctamente esas secuencias (Alineamiento múltiple). - 42 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Alineamiento múltiple. La premisa básica de un alineamiento múltiple es que para cada columna en el alineamiento cada residuo de cada secuencia es homólogo. Esto significa que ha evolucionado desde la misma posición en una secuencia ancestral común sin inserción ni deleción. Los alineamientos se realizan mediante agrupamiento y comparación de secuencias entre sí, proceso que se denomina clustering. Hace un tiempo, estos agrupamientos se realizaban manualmente, hoy en día se utilizan programas de computación. Por ejemplo, el Programa CLUSTALW permite el alineamiento global para un conjunto de secuencias. Las secuencias son alineadas de a pares y los pares con puntaje (score) más alto son luego agrupados con otras secuencias y los grupos (clusters) son armados de acuerdo a la similitud. 3. Aplicar métodos adecuados para la construcción de árboles filogenéticos. Para la creación de árboles en estudios filogenéticos existen básicamente dos categorías de métodos: Métodos basados en distancia o Método de agrupamiento de pares con la media aritmética no ponderada (UPGMA) o Método del vecino más cercano (NJ) o Método de Minima Evolución (ME). Métodos basados en la composición de las secuencias o Método de máxima parsimonia (MP) o Método de máxima probabilidad (ML) Cada uno de estos métodos tiene sus fortalezas y sus debilidades, pero es más ampliamente usado NJ, ya que ha probado ser bastante eficaz. Una vez construidos, los árboles pueden visualizarse como enraizados (tomando una de las OTUs como referencia o outgroup) o no enraizados. A su vez, los árboles pueden construirse como filogramas, cladogramas o dendrogramas. Cladograma: es el modelo básico y simplemente muestra la distancia al antecesor común en términos relativos. Las ramas son de igual longitud por lo cual no indican el tiempo evolutivo. Filograma: contiene información adicional dada por la longitud de las ramas. Los números asociados con cada rama corresponden a un atributo de las secuencias, tal como cantidad de cambio evolutivo. Es aditivo. Métricos.
- 43 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Dendrograma: tipo especial de árbol aditivo en el cual los extremos del árbol son equidistantes de la raíz y son proporcionales al tiempo de divergencia. Ultramétricos. 4. Evaluar estadísticamente el árbol filogenético obtenido. El test más simple para probar si el conjunto de datos “soportan” el árbol obtenido es el del bootstrap. Es un método estadístico que puede estimar las distribuciones por creación repetida y análisis de conjuntos de datos artificiales. Una forma de medir el error de muestreo es tomar muchas muestras de la población estudiada y compararlas. Bootstrap simula esto pero en lugar de muestrear de una población “remuestrea” los datos originando pseudorréplicas. Por ejemplo, un boostrap de 100 implica que el árbol se construyó 100 veces, para determinar si estadísticamente la constitución final del árbol fue la acertada.
Ahora procedemos a hacer el alineamiento múltiple para construir el árbol: Ingresa a http://www.ebi.ac.uk/Tools/msa/clustalw2/ Copia y pega las secuencias obtenidas en el ejercicio anterior, en el espacio de Step 1 como a continuación:
Luego presione el botón rojo en el step 4, esto iniciará el alineamiento múltiple:
- 44 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Se obtendrá el siguiente alineamiento, debes guardarlo en tu computadora utilizando la opción “Download Alignment File”.
Ahora debes ir a la opción Philogeny, y dentro de esa opción debes subir tu archivo de alineamiento que guardaste anteriormente, luego presiona el botón rojo “Submit”, lo cual te permitirá construir el árbol filogenético. Por default, utilizamos el método de NJ para construir el árbol.
- 45 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Obtendras el siguiente árbol, donde se pueden observar las relaciones de parentezco del organismo problema en relación a otros organismos que existen en la base de datos.
3.3.
Identificación de secuencia de proteínas en base de datos.
- 46 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Tomando una secuencia de proteínas, podemos llevarla a la base de datos para compararla e identificar la función de la misma. La secuencia de aminoácidos de la proteína X es la siguiente (el docente se la facilitará via electrónica en formato fasta): >Proteína X TAAYQIEGAYNEDGRGMSIWDTFAHTPGKVKNGDNGNVACDSYHRVEEDVQLLK DLGVKVYRFSISWPRVLPQGTGEVNRAGLDYYHRLVDELLANGIEPFCTLYHWDL PQALQDQGGWGSRITIDAFAEYAELMFKELGGKIKQWITFNEPWCMAFLSNYLGV HAPGNKDLQLAIDVSHHLLVAHGRAVTLFRELGISGEIGIAPNTSWAVPYRRTKED MEACLRVNGWSGDWYLDPIYFGEYPKFMLDWYENLGYKPPIVDGDMELIHQPIDF IGINYYTSSMNRYNPGEAGGMLSSEAISMGAPKTDIGWEIYAEGLYDLLRYTADKY GNPTLYITENGACYNDGLSLDGRIHDQRRIDYLAMHLIQASRAIEDGINLKGYMEW SLMDNFEWAEGYGMRFGLVHVDYDTLVRTPK Siendo tu un especialista en bioinformática, debes comparar y otorgar toda la información posible acerca de la secuencia más cercana (con mayor identidad) que encuentres por comparación en la base de datos (NCBI). Para ello completa los datos que se requieren a continuación:
LOCUS __________________________________________________ DEFINITION _____________________________________________ ACCESSION ______________________________________________ VERSION ________________________________________________ KEDWORDS _______________________________________________ SOURCE _________________________________________________ ORGANISM _____________________________________________ REFERENCE ______________________________________________ AUTHORS ______________________________________________
- 47 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
TITLE ________________________________________________ JOURNAL _______________________________________________
3.4.
Diseño de oligonucléotidos
Para la detección de un gen específico dentro de un genoma se pueden utilizar diversas estrategias (por ej.: hibridación, análisis de expresión, PCR, etc.). El empleo de la PCR implica varias etapas, y su complejidad depende de varios factores, entre ellos podemos considerar, por ejemplo si:
¿Es un gen ampliamente distribuído o es específico de un grupo de organismos en particular? ¿Se conoce la secuencia de ADN completa del gen o sólo se conoce la secuencia de la proteína codificada por ese gen? ¿Es un gen altamente conservado o varía considerablemente entre organismos relacionados?
En el TP Nº1 (PCR) se encuentran las consideraciones más importantes a tener en cuenta para el diseño de primers. En este práctico, aprenderemos a cómo diseñar los oligonucleótidos para realizar una reacción de PCR para detectar el gen de la enzima Superóxido Dismutasa de Niquel (SodN) en la cepa Streptomyces sp. BM.
1. Búsqueda en base de datos de secuencias de la SodN. a. Abrir un navegador de internet b. En la barra de direcciones pegar: http://www.ncbi.nlm.nih.gov/ c. En la pestaña All databases seleccionar Nucleotide (se conoce la secuencia del gen SodN) d. En la pestaña Search escribir Ni-containing superoxide dismutase. Presionar Search.
- 48 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
2. Seleccionar la 4º opción de la lista (para este caso es apropiado, porque sabemos que corresponde a la enzima que estamos buscando).
- 49 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
3. Buscar en la página SodN
- 50 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
4. Seleccionar gene
5. Copiar la secuencia resaltada y pegarla en un archivo de texto. >SodN Atgctttcccgcctgtttgcccccaaggtcacggtcagcgcccactgcgacctgccctgcggcgtgtacgaccctgcccagg cccgcatcgaggcggagtcggtgaaggccgtccaggagaagatggccggcaacgacgacccgcacttccagacgcgcg ccacggtcatcaaggagcagcgcgccgagctcgcgaagcaccacgtctccgtgctgtggagcgactacttcaagcccccg cacttcgagaagtacccggagctgcaccagctggtcaacgacaccctgaaggccctgtcggccgccaagggctcgaagga cccggcgaccggccagaaggccctggactacatcgcccagatcgacaagatcttctgggagaccaagaaggcctga
- 51 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
6. Seleccionar BLAST y pegar la secuencia. Correr el BLAST.
- 52 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
7. Seleccionar y copiar las secuencias de ADN de: a. Streptomyces avermitilis MA-4680 b. Streptomyces acidiscabies strain E13 c. Streptomyces flavogriseus ATCC 33331 d. Streptomyces peucetius ATCC 27952 >S. coelicolor A3(2) atgctttcccgcctgtttgcccccaaggtcacggtcagcgcccactgcgacctgccctgcggcgtgtacgaccctgcccagg cccgcatcgaggcggagtcggtgaaggccgtccaggagaagatggccggcaacgacgacccgcacttccagacgcgcg ccacggtcatcaaggagcagcgcgccgagctcgcgaagcaccacgtctccgtgctgtggagcgactacttcaagcccccg cacttcgagaagtacccggagctgcaccagctggtcaacgacaccctgaaggccctgtcggccgccaagggctcgaagga cccggcgaccggccagaaggccctggactacatcgcccagatcgacaagatcttctgggagaccaagaaggcctga >S. avermitilis MA-4680 atgctctcccgcctgtttgcccccaaggtcaaggtcagcgcgcactgcgacctgccctgcggtgtgtacgacccggcccagg cccgcatcgaggcggagtcggtgaaggccgtccaggaaaagatggccggcaacgacgacccgcacttccaggctcgcgc cacggtcatcaaggagcagcgcgccgagctcgccaagcaccacgtgtcggtgctctggagcgactacttcaagcccccgc acttcgagaagtacccggagctgcaccagctggtcaacgacaccctgaaggccctctcggccgccaaggcgtccacggac ccggccacgggccagaaggcgctggactacatcgcccagatcgacaagatcttctgggagaccaagaaggcctgactttcc cgcctgtttgcccccaaggtcaaggtcagcgcgcactgcgacctgccctgcggtgtgtacgacccggcccaggcccgcatc gaggcggagtcggtgaaggccgtgcaggacaagatggccgccaacgacgaccctcacttccaggctcgcgcgaccgtca tcaaggagcagcgcgccgagctcgccaagcaccacgtctcggtgctgtggagcgactacttcaagcctccgcacttcgaga agtacccggagctgcaccagctggtcaacgacgccctgaaggccctctcggccgccaaggcgtccaccgacccggcgac - 53 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
gggccagaaggcgctggactacatcgcccagatcgacaagatcttctgggagaccaagaaggcctga >S. acidiscabies E13 atgctctcccgcctgtttgcccccaaggtgaaggtcagcgcgcactgcgacctgccctgcggcgtgtacg acccggcccaggcccgcatcgaggcggagtcggtgaaggccgtccaggaaaagatggccggaaacgacga ccctcggttccagacgcgcgccgtcgtcatcaaggagcagcgcgccgagctcgccaagcaccacgtgtcg gtgctctggagcgactacttcacgcccccgcacttcgagaagtacccggagctgcaccagctggtcaacg acaccctgaaggccctctcggccgccaaggcgtccgccgacccggcgaccggccagaaggccctcgacta catcgcccagatcgacaagatcttctgggagaccaagcaggcttga >S. flavogriseus atgctttcccgcctgtttgcccccaaggtgaaggtcagcgcccactgcgacctgccctgcggcgtgtacgacccggcccagg cccgcatcgaggccgagtccgtcaaggccgtccaggagaagtaccaggccaatgaggacgcggacttccgcacccgcgc cgttctgatcaaggaacagcgtgccgagctcgcgaagcaccacgtctcggtgctctggagcgactacttcaagcccccgcac ttcgagaagtacccggagctgcaccagctggtcaacgacaccctgaaggcgctctccgcggccaagggctcgaacgaccc ggccacgggccagaaggctctggacctgatcgcccagatcgacacgatcttctgggagaccaagaaggcctga >S .peucetius ATCC27952 atgctctcccgcctgtttgcccccaaggtgaaggtcagcgcccactgcgacctgccttgcggtgtgtacgacccggcccagg cccgcatcgaggcggagtcggtcaaggccgtccaggagaagtaccaggccaacgaggacccgcacttccgcgcccgcg ccacggtcatcaaggagcagcgcgcggagctcgccaagcaccacgtctcggtgctgtggagcgactacttcaagcccccg cacttcgagaagtacccggagctgcaccagctcatcaacgacacgctcaaggcgctctcggccgccaagggctcgacgga cccggcgaccggccagaaggccctggactacatcgcccagatcgacaagatcttctgggagaccaagaaggcctga 8. Abrir el programa DNAMAN y cargar todas las secuencias. 9. Realizar el alineamiento de las 5 secuencias. Seleccionar el ícono alineamiento y luego presionar Channel y seleccionar las 5 secuencias.
- 54 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
10. Analizar el alineamiento. Ir a Output/Sequence File/ DNAMAN 2
- 55 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
11. Copiar la secuencia consenso y pegarla en el canal 6.
12. Ir a Primer/Design PCR Primers for DNA y seguir los pasos indicados en las pantallas siguientes:
- 56 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
- 57 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
- 58 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
13. Evaluar las características de los pares de primers generados por el programa. a. Copiar la secuencia del primer cebador, ir a Primer/Load primer/ From input y pegar la secuencia. b. Ir a Primer/Self complementary. Analizar. c. Ir a Primer/Two primer complentarity/Second primer from input y pegar el segundo primer. Analizar. d. Para este primer repetir el punto b e. Repetir para todos los pares de primers obtenidos. f. Seleccionar el par de primer más adecuado.
3.5.
PCR in silico.
Para saber si los oligos diseñados permiten amplificar la secuencia de interés, tienes que realizar una PCR in silico (virtual, utilizando herramientas bioinformáticas) utilizando el genoma disponible del organismo similar al modelo que tienes. Para ello, debes ingresar en http://insilico.ehu.es/PCR/
- 59 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015De la lista de genomas que se te despliega debes elegir “Streptomyces” y luego ingresas a una página donde debes pegar la secuencia de los primers que diseñaste anteriormente.
Luego de apretar el botón “Amplify” te aparecerá una nueva ventana, contesta las siguientes preguntas:
- 60 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
a- ¿Cuántas bandas se amplifican? b- ¿Qué tamaño tienen? c- Si haces un BLAST de esas secuencias, ¿a qué genes corresponden?
- 61 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Trabajo Práctico N4 SECUENCIACIÓN Y GENÓMICA
1- Objetivos • Que el alumno comprenda y maneje términos referentes a procesos de secuenciación y análisis de genomas. • Que el alumno comprenda la importancia de la era genómica en la revolución de las ciencias biológicas. • Que el alumno conozca las aplicaciones de esta disciplina en las ciencias biológicas. • Que el alumno sea capaz de analizar genomas mediante programas y bases de datos disponibles on line. • Que el alumno conozca y tenga un manejo básico de los programas bioinformáticos más usados, disponibles para anotaciones de genes. • 2- Introducción SECUENCIACIÓN La secuenciación del ADN es la técnica que permite determinar la secuencia, es decir, el orden de bases de nucleótidos en una determinada porción continua de ADN, pudiendo ser esta porción parte de un gen, un gen completo o incluso un genoma. La primera generación de técnicas para efectuar la secuenciación del ADN empezó en 1975 con la metodología de Sanger y Coulson, la “más y menos” (del inglés, “plus and minus”), la cual necesitaba clonar cada lectura inicial para producir un ADN de cadena simple. En 1977, Maxam y Gilbert publicaron la metodología de secuenciación de ADN mediante degradación química. Este método estaba basado en la modificación química y posterior rotura del ADN, y empezó a ser el método de secuenciación más utilizado porque permitía utilizar un ADN purificado sin necesidad de clonarlo. El mismo año Sanger publico el método de secuenciación de ADN por síntesis química o enzimática, que estableció un nuevo estándar para los próximos 30 años. El método de Sanger permitía leer 25 bases (b) y más tarde, 80 b, utilizando los terminadores dideoxi. El método fue optimizado con la utilización de dideoxinucleótidos fluorescentes en vez de productos tóxicos y radioisótopos, detección automatizada, mayor rendimiento y precisión, permitiendo leer 1.000 b. Estos avances representaron una revolución fascinante, porque permitieron descifrar inicialmente genes y eventualmente los genomas completos, aunque con un alto costo para el segundo caso. El método de Maxam y Gilbert para secuenciar ADN El método de Sanger para secuenciar ADN.
- 62 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
La segunda generación de plataformas de secuenciación de ADN (también llamada de siguiente generación; del inglés, “next-generation”) fue desarrollada hace sólo cinco años, aumentando la efectividad de la secuenciación del ADN algunos ordenes de magnitud. Así, permitió generar lecturas de gigabases en una sola corrida o experimento (del inglés, “run”). Cuatro plataformas de segunda generación han sido comercializadas por el momento: 1) El instrumento 454 (454 Life Sciences), está basado en emulsión, secuenciación por síntesis (SBS; del inglés, “sequencing-by-synthesis”) y pirosecuenciación. Este desarrollo fue publicado en 2005, comprado por Roche Diagnostics en 2007 y vendido como el “Genome Sequencer 20 System” y el “Genome Sequencer FLX System” (Roche Applied Sciences) . La tecnología 454 empezó leyendo 100 b, después de 16 meses podía leer 250 b, y ahora más de 400 b. 2) El protocolo de secuenciación de „polonias‟ multiplexadas (del inglés, “multiplex polony sequencing protocol”) es parecido al método mencionado anteriormente, pero es más barato porque usa instrumentos y reactivos estándar. Las bibliotecas genómicas obtenidas por la técnica de perdigonazos (del inglés, “shotgun genomic libraries”) son amplificadas en microesferas mediante PCR por emulsión. Después, son utilizadas como sustratos para hacer la secuenciación con las reacciones fluorescentes de ligación nonamérica sobre un portaobjetos de microscopio, generando millones de lecturas de 26 pares de bases (pb), de modo que cualquier laboratorio pueden desarrollar este método. 3) El “Genome Analyzer System” (Solexa) combina la química SBS con terminadores y tecnología de grupos (del inglés, “cluster”). La compañía fue adquirida por Illumina en 2007, produciendo el “Genome Analyzer Sequencing System” . Este tipo de tecnología genera diez veces más lecturas que la 454, pero con solamente 35 b o menos en longitud. 4) El “SOLiD System” (Applied Biosystems) usa una química basada en ligasa y fue producido en 2007 . La segunda generación de plataformas de secuenciación de ADN difiere de los métodos tradicionales de secuenciación en dos aspectos: a) En vez de hacer una secuenciación de clones de ADN de algunos individuos (p. ej., 96 secuenciaciones de sustratos en un secuenciador capilar Sanger), cientos de miles (sistema 454) o miles de millones (Solexa y SOLiD) de moléculas de ADN son secuenciadas en paralelo, usando volúmenes de reacción menores. b) Las secuencias obtenidas son generalmente mucho más cortas (25-50 nucleótidos para las tecnologías de „polonias‟, Solexa y SOLiD, aunque pueden alcanzar 200- 400 nucleótidos para el sistema 454) que las generados por secuenciación tradicional. No obstante, el costo de los nuevos instrumentos es mayor (aproximadamente, unos 500.000 dólares) que los que usan el método de Sanger (de 10.000 a 100.000 dólares), que también pueden realizarse con instrumentación manual más barata usando radioisótopos o fluoróforos. Métodos de Secuenciación de DNA y equipos de secuenciación masiva. Como ejemplo práctico de estos avances, la primera secuenciación del genoma humano ( Homo sapiens sapiens) ha requerido cientos de máquinas trabajando 24 horas al día, durante 13 años, con un costo de más de 300 millones de dólares. Más
- 63 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
tarde, el genoma diploide de una sola persona (J. Craig Venter) fue leído mediante secuenciación de genomas completos por perdigonazos (del inglés, “wholegenome shotgun sequencing”), necesitando 10 años y 70 millones de dólares, usando la tecnología optimizada de Sanger. Por su parte, el genoma de Watson fue secuenciado en sólo dos meses y un costo de un millón de dólares, usando la maquina “454 Life Sciences”. Otro ejemplo es la secuenciación del genoma del “ornitorrinco” ( Ornithorhynchus anatinus), revelando marcas únicas de su evolución, con genes que aparecen en reptiles, o aves y otros de mamíferos. Esta mezcla fascinante de características en el genoma del “ornitorrinco” proporciona pistas sobre el rol y la evolución de los genomas de los mamíferos. La tercera generación (también llamada “next-next-generation”) de la secuenciación de ADN ha sido producida en 2008, con químicas revolucionarias de una sola molécula: 1) El secuenciador HeliScope de molécula única (del inglés, “HeliScope Single Molecule Sequencer”), de Helicos BioSciences , fue anunciado este año. Ofrece lecturas muy precisas de 25 a 45 bases para miles de millones (millardos) de cadenas en un solo experimento (produciendo más que 2 Gb de datos de secuenciación por día), y hasta un millardo de bases por hora en el futuro Ello es debido al uso de la verdadera secuenciación de molécula única (del inglés, “true Single Molecule Sequencing” (tSMS), para leer hebras individuales de ADN. 2) “VisiGen Biotechnologies” no ha sido producido todavía, pero promete micromatrices masivamente paralelas (del inglés, “microarrays”) de nanomáquinas, con una tasa de secuenciación de un Mb/s/maquina (más de 86 Gb de secuencia de datos por día) , leyendo también moléculas simples. Estos avances permitirán reducir el precio de la secuenciación de uno a dos órdenes de magnitud, lo cual propiciará el desarrollo del “la genómica personal”: hacer la secuenciación de todo el genoma humano de cualquier persona en menos de un día, por 1.000 dólares o menos. Por otra parte, la tercera generación de métodos de secuenciación es tan poderosa que permite hacer estudios no solamente de genómica estructural, sino también de genómica funcional y consenso de secuencias, incluyendo : i) ChIP-Seq, que está basado en la inmunoprecipitación de cromatina (ChIP), para mapear in vivo las secuencias del ADN ocupadas por proteínas de unión al ADN; ii) Sec-ARNm (del inglés, “mRNA-Seq”), para estudiar la expresión de genes; y iii) Sec-Metil (del inglés, “Methyl-Seq”), para analizar los patrones de metilación. Estos procedimientos se pueden aplicar también al ADN antiguo, siempre que ADN, ADN-proteína o ARNm pueda ser aislado de tales muestras. GENÓMICA Un genoma es el conjunto de secuencias de ADN que caracterizan a un individuo. Por extensión a las secuencias de ADN características de una especie se les conoce igualmente como genoma. La secuenciación del genoma, es un proceso de laboratorio que determina la secuencia el
- 64 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
total del ADN del genoma de un organismo de una sola vez. Esto implica la secuenciación de todo el ADN cromosómico, así como el ADN contenido en la mitocondria y, en el caso de las plantas, en el cloroplasto del organismo. Casi cualquier muestra biológica, incluso una cantidad muy pequeña de ADN o de ADN antiguo, puede proporcionar el material genético necesario para la secuenciación del genoma completo. Las muestras podrán incluir la saliva, células epiteliales, médula ósea, el pelo (siempre y cuando el pelo contiene un folículo del pelo), semillas, hojas de plantas, o cualquier otra parte con células que contienen ADN. Debido a que la secuencia de datos que se produce puede ser muy grande (por ejemplo, hay aproximadamente seis mil millones de pares de bases en cada genoma diploide humano), los datos genómicos se almacenan electrónicamente y requieren una gran cantidad de potencia informática y capacidad de almacenamiento. Es por ello que la secuenciación del genoma completo habría sido casi imposible antes de la llegada de los microprocesadores, los ordenadores y la era de la información. A diferencia de la genética clásica que a partir de un fenotipo, generalmente por un mutante, busca el o los genes responsables de dicho fenotipo, la genómica tiene como objetivo predecir la función de los genes a partir de su secuencia o de sus interacciones con otros genes. Así, la genómica tiene un enfoque distinto para responder preguntas biológicas cuando se compara a otras ramas de la biología más tradicionales. Por lo tanto genómica es el conjunto de ciencias y técnicas dedicadas al estudio integral del funcionamiento, el contenido, la evolución y el origen de los genomas. Es una de las áreas más vanguardistas de la Biología. La genómica usa conocimientos derivados de distintas ciencias como son: biología molecular, bioquímica, informática, estadística, matemáticas, física, etc. Muchas veces, la genómica es usada como sinónimo de otras áreas de estudio relacionadas, como la proteómica y la transcriptómica, por ejemplo. Las ciencias genómicas han tenido un importante auge en los últimos años, sobre todo gracias a las tecnologías avanzadas de secuenciación de ADN, a los avances en bioinformática, y a las técnicas cada vez más sofisticadas para realizar análisis de genomas completos. El desarrollo de la genómica ha contribuido al avance de distintos campos de la ciencia como la medicina, la agricultura, etc; gracias al descubrimiento de secuencias de genes necesarias para la producción de proteínas de importancia médica y a la comparación de secuencias genómicas de distintos organismos. Por ejemplo en varios países como Estados Unidos, la Unión Europea y Japón se han realizado enormes proyectos para secuenciar el genoma de diversos organismos modelo. Probablemente el más conocido es el Proyecto Genoma Humano. En la actualidad se cuenta además con importantes servidores de acceso público, como el del NCBI (National Center for Biotechnology Information), que permiten que cualquier usuario con conexión a Internet acceda a la secuencia completa del genoma de decenas de organismos y a las secuencias de cientos de miles de genes de distintos organismos. De acuerdo a la página web http://www.genomenewsnetwork.org/resources/sequenced, hasta el presente se han secuenciado el genoma completo de 189 organismos. LA GENÓMICA EN EL FUTURO Los genomas que han sido secuenciados han sido muy útiles para la humanidad, pero es una mínima parte del total de genomas existentes. La secuenciación de estos genomas
- 65 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
aportará una información muy valiosa para el tratamiento de enfermedades, la agricultura y la biotecnología. Las secuencias genómicas completas de mamíferos ayudarán al entendimiento de la evolución y función del genoma humano. En el futuro, la información sobre la secuencia genómica completa podrá aplicarse en el tratamiento individual de pacientes, incluso en recién nacidos, dando lugar a una medicina más individualizada. El conocimiento de secuencias completas también tiene un aspecto negativo, ya que puede llevar a la discriminación de algunas personas identificadas como portadores de secuencias que determinen enfermedades, trastornos y rasgos físicos. PROGRAMAS BIOINFORMÁTICOS PARA ANOTACIÓN Y ANÁLISIS DE GENOMAS P lataforma RAST Es un servicio totalmente automatizado para la anotación de genomas. El servicio identifica la codificación de la proteína de genes, rRNA y tRNA, le asigna funciones, predice que los subsistemas están representados en el genoma, usa esta información para reconstruir la vía metabólica, y hace que sea fácil descargar toda la información. Además, de la anotación del genoma, se puede navegar en un entorno para apoyar el análisis comparativo de los genomas anotados que están presente en el entorno del sistema SEED. La anotación completa se produce normalmente dentro de las 12-24 horas, y la actual aplicación puede realizarla a un promedio de entre 50 a 100 genomas por día. Sin embargo, es importante tener en cuenta que la velocidad no es el tema central, sino los requisitos de ese sistema son, exactitud, integridad y la coherencia, en última instancia, serán los criterios utilizados para evaluar el éxito o fracaso de un servicio. Hasta la fecha, el servidor ha sido utilizado por más de 120 de los usuarios externos para anotar más de 350 genomas. Por otra parte los bancos de datos NMPDR y la SEED facilitan el acceso a todos los genomas público sin necesidad de tener una cuenta de usuario. Para acceder al RAST, en cambio, se debe abrir una cuenta gratuita de usuario para que el acceso a sus datos y puedan ser mantenido bajo control del interesado. Las herramientas disponibles en el RAST para comparar sus datos privados con nuevos genomas ya publicados son en su mayoría las mismas que las disponibles para el análisis de genomas público presentes en la plataforma NMPDR (www.nmpdr.org org). La plataforma RAST pretende lograr la precisión, consistencia, y la integridad en el uso de una creciente biblioteca de subsistemas que son manualmente controladas, y en las familias de proteínas en gran parte derivados de los subsistemas (FIGfams). S ubsistemas del RAST Un gen es asignado a una determinada categoría de genes, las cuales se denominan como subsistemas. Un subsistema es un conjunto abstracto de funciones orgánicas. Por ejemplo, la siguiente figura muestra un caso muy simple en el que un subsistema llamado "Utilización tricarbalilato" se compone de cuatro roles funcionales. El subsistema lo que hace es conectar los roles funcionales de genes específicos en los genomas, produciendo una hoja de cálculo en el subsistema, donde cada fila representa un genoma y cada columna corresponde a un papel funcional. El esfuerzo cooperativo del desarrollo de los subsistemas ha producido una disponibilidad
- 66 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
al público de un conjunto de subsistemas que ahora incluye más de 600. Estos subsistemas incluyen afirmaciones de la función de más de 500.000 genes codificadores de proteínas en más de 500 genomas de bacterias y arqueas (en relación con más de 6.200 roles funcionales). Si bien es cierto que la calidad de las afirmaciones varía sustancialmente, también es cierto que estos conjuntos estructurados de afirmaciones representan un recurso importante en la construcción de los sistemas de anotación automática. Programa ARTEMIS. rograma Artemis es una herramienta de visualización y anotación libre de genoma que permite la visualización de las características de la secuencia y los resultados del análisis en el contexto de la secuencia y su traducción de sus seis-marcos de lectura. Puede leer las entradas o secuencias de base de datos en EMBL y GENBANK, en FASTA o en un formato no procesado. Las características de la secuencia adicionales pueden ser en formato EMBL, GENBANK o GFF. ARTEMIS lee las características y secuencia desde el archivo y muestra las características en una traducción de la secuencia en sus seis-marcos de lectura. Dos vistas de la secuencia se exhiben y las dos pueden ser ampliadas al nivel de base, o disminuidas para mostrar la secuencia completa. También hay una lista de características en la parte inferior de la ventana. Además de esta pantalla básica, ARTEMIS puede trazar los resultados de los cálculos en la secuencia, o en cualquiera de las características de CDS (secuencias de ADN codificantes). Los marcos de la secuencia están atados a la visualización de la secuencia y ampliados o disminuidos al cambiar el nivel del enfoque. Para cada uno de los marcos, podrás ajustar el tamaño de la ventana para adaptarse al nivel del enfoque. Además de las capacidades de visualización de la secuencia descritas anteriormente, ARTEMIS puede mostrar los resultados de numerosos análisis de la secuencia; las predicciones CDS, BLASTN, BLASTX en-marco, tRNA y las búsquedas por motivo, etc. pueden ser todos vistos e incorporados en la anotación. ARTEMIS también ejecuta los análisis en los conjuntos de características CDS, tales como las búsquedas FASTA y BLASTP y permite que los resultados sean visualizados directamente desde el objeto seleccionado. La información adicional, así como la función en colores, las clasificaciones funcionales, etc. también se puede añadir a la anotación, y el archivo final escrito con todas estas características intactas y para uso interno, o con características no-EMBL puede ser guardadas o no. La característica de alejamiento de la imagen se puede utilizar para mirar los genes en el contexto de amplias cantidades de secuencias. 3- Actividades prácticas 3.1. Analizar los resultados de un genoma anotado y disponible mediante la Plataforma RAST. 1. Entrar a la página http://rast.nmpdr.org/ 2. Introducir Login: LACTOCINA y password:
- 67 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
IZ8jbAW 3. Seleccionar SeedViewer 4. Seleccionar el organismo del que se quiere analizar el genoma completo 5. Seleccionar Anopheles gambiae 6. En esta página, se abre una tabla que muestra cuantos contig (fragmentos vecinos derivados de una fuente de secuenciación simple) hay, el número de genes que se asignan para completar los subsistemas y las categorías de subsistemas representados en su genoma. Ahora, copia esos datos y realiza una tabla con esta información en un archivo word. 7. La página de la información del genoma muestra un gráfico circular de subsistemas completos identificados en el genoma. Se puede ampliar las categorías para ver las subcategorías y nombres de subsistema, junto con el número o las proteínas asignadas a cada uno. La tabla (haga clic en el botón verde "Características de los subsistemas") y ello ofrece un acceso similar, y usted puede seleccionar la categoría de los "carbohidratos", desde la parte superior de la columna. Desde la categoría carbohidratos, ya sea en el gráfico o tabla, puede hacer clic para abrir los subsistemas de la glucólisis y de la Gluconeogénesis. 8. Haciendo clic en cualquiera de los genes del genoma recién anotado se abre la página de “Información general de anotación”, por lo que se abre en una nueva ventana o pestaña. Copia y realiza un resumen de la información de los genes que seleccionaste. 3.2. Anotación de genes mediante Programa ARTEMIS. 1. Abre la secuencia FASTA (Ava1) que te facilita el docente, utilizando el comando File/Open. Observa que al abrir el archivo, aparecen tres ventanas, una inferior vacía y dos superiores que muestran la secuencia nucleotídica y las secuencias aminoacídicas correspondientes a las traducciones en los seis marcos de lectura posibles (tres marcos de lectura por hebra) (Figura 1). 2. Utilizando la opción Create/Mark ORF (open reading frames), se establecen los posibles ORFs, con un largo superior a 100 aminoácidos 3. El programa identifica diversas regiones de una secuencia, como unidades con un determinado significado, a las cuales se les pueden asignar nombres y anotar datos acerca de ellas. Estas regiones se denominan “features” (características o marcas), y pueden ser ORFs, exones, etc. 4. Analiza los features (en este caso ORFs) obtenidos utilizando BLAST. Los features aparecen indicados en la ventana inferior como CDS. Debes seleccionar cada uno de los CDS y presionando el botón derecho del mouse sobre el feature, y utilizando la opción View/Amino Acids of selection as FASTA (también se puede seleccionar la secuencia nucleotidíca View/Bases of selection as FASTA) podrás obtener la secuencia de cada CDS para su análisis. 5. Utilizando la información obtenida mediante BLAST, ahora puedes editar la información contenida en los features, haciendo click con el botón derecho, y seleccionando la opción Edit/Selected feature in editor. En la ventana que se abre se puede modificar el nombre del feature con la opción Key, y agregar información, colores, etc., con la opción Add Qualifiers. 6. Los features pueden estar separados de la secuencia en un archivo aparte
- 68 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015denominado “entry”. Abre la entry localizada en el archivo Ava1_entry y observa los features ahí contenidos (File/read an entry). Este archivo fue realizado por el investigador que depositó la secuencia en el GenBank. 7. Compara el tamaño de los ORFs obtenidos con los anotados en Ava1_entry. ¿Se encuentran diferencias? Si es así, explica por qué. Si es necesario, modifica el tamaño de los ORF de acuerdo a los datos obtenidos mediante BLAST. 8. Tu también puedes bajar el archivo con todas las anotaciones o features directamente del Genbank. Para esto utilice la opción File/Open from EBI y coloque el número de accessión (Acc. Number: DQ985395). Para obtener información adicional sobre los features anotados dirigete a View/view selected features. ¿Qué información posee el tercer CDS?. Incluye la información adicional en el panel de features (panel 5, Figura 1). Figura 1. Ventana principal de artemis. 1. Menú desplegable principal 2. “entry” activas. Las “entry” actúan como capas o layers en las que puedo realizar anotación. Puedo crear tantas como desee y se utilizan para organizar la información en unidades independientes. 3. Panel principal de visualización de las secuencias. Las líneas grises representan las hebra forward (superior) y reverse (inferior). Se representa también las secuencias aminoacídicas correspondientes a las traducciones en los seis marcos de lectura posibles (tres marcos de lectura por hebra). Las líneas negras verticales representan los codones stop. Las regiones coloreadas representan los distintos “features” que han sido anotados en la secuencia. 4. Este panel tiene la misma estructura que el panel principal de visualización pero ha sido aumentado para visualizar las secuencias nucleotídicas y aminoacídicas. 5. Este panel indica los distintos “features” que presenta la secuencia. 6. Barras para aumentar o disminuir los paneles 7. Barras para movilizarse en la secuencia 8. Barras para desplazar los “features”.
- 69 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Trabajo Práctico N °5 TAXONOMÍA MOLECULAR
1- Objetivos • Que el alumno conozca las técnicas moleculares que se utilizan en taxonomía molecular. • Que el alumno comprenda la importancia de las técnicas de biología molecular en el desarrollo de la taxonomía moderna. • Que el alumno conozca las enzimas de restricción y sus aplicaciones. • Que el alumno sea capaz de manejar bases de datos de marcadores moleculares disponibles on line. • Que el alumno sea capaz de utilizar programas bioinformáticos para realizar digestiones in silico.
2- Introducción TAXONOMÍA Y SISTEMÁTICA Los términos taxonomía y sistemática marcan en su significado matices diferenciales claros. La taxonomía estudia los principios de clasificación de los organismos según las semejanzas y diferencias de sus caracteres. La sistemática trata de los resultados que se obtienen al aplicar tales principios. Uno de los objetivos de la taxonomía es descubrir un orden en el aparente caos de diversidad de formas vivas. Así, el taxonomista intenta preparar un esquema conveniente de clasificación para los organismos. Las unidades sistemáticas de cualquier categoría se designan con el nombre de taxones o estirpes. De todas ellas la Especie es la categoría taxonómica más importante. Se reúnen en una especie todos los individuos particulares, incluyendo sus antepasados y descendientes (filogenia), que concuerdan entre sí en numerosos caracteres y en especial en todos los esenciales. Las especies que poseen una serie de caracteres comunes se agrupan en Géneros, éstos de forma análoga en Familias; las familias en Órdenes, éstos en Clases y las clases en Divisiones. Dentro de las especies suelen distinguirse Subespecies, Variedades, Líneas y Clones o Cepas. Estas últimas para designar la población de células genéticamente idénticas, procedentes de una sola. Todas ellas constituyen las diferentes categorías taxonómicas. Conviene distinguir también entre Taxonomía y Nomenclatura. Esta última trata, evidentemente, de la denominación o descripción detallada de cada especie de microorganismo. El nominar una especie es una práctica conveniente que expresa a modo de taquigrafía las propiedades colectivas de un organismo. - 70 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
El método usado actualmente para designar científicamente una especie microbiana es la de la nomenclatura binomial.
TAXONOMÍA MICROBIANA En la taxonomía microbiana existen varias formas de abordar los estudios. La primera de ellas es la taxonomía clásica; aplicada durante más de un siglo, su metodología consiste en determinar varios caracteres de diferentes microorganismos y, para usarlos después en la separación de grupos. Los primeros caracteres determinados suelen ser los morfológicos y estructurales; después los funcionales. La importancia del carácter morfológico se debe, por una parte, a la mayor facilidad en su determinación por técnicas microscópicas y, por otra, a su mayor estabilidad genética. Además de la morfología, suelen utilizarse numerosas pruebas de carácter estructural, fisiológico, reproductivo y ecológico.
Otra forma de abordar el procedimiento taxonómico es la taxonomía numérica, en la cual se da la misma importancia a todos los caracteres determinados; un ordenador analiza los datos determinados para un gran número de microorganismos reconociendo las diferencias y analogías entre ellos. Las primeras separaciones se hacen también atendiendo a caracteres morfológicos y estructurales, realizando a continuación un gran número de pruebas de naturaleza variada, anotando los resultados de las mismas con un signo positivo o negativo; los datos se recogen en tablas y son codificados; hay que calcular un coeficiente de confianza para las cepas en estudio; éste será mayor cuanto más semejante sean los microorganismos analizados. Los caracteres negativos comunes a las cepas no se toman en consideración a la hora de calcular dicho coeficiente, ya que la ausencia común de un carácter no implica necesariamente un parentesco. La taxonomía numérica, al analizar muchos caracteres, obtiene resultados poco equívocos y determina categorías taxonómicas estables; sin embargo, la correlación entre taxonomía clásica y numérica no es siempre muy satisfactoria. La tercera forma de abordar el estudio para la clasificación de microorganismos es la taxonomía molecular y genética, que parte de la idea de que cuanto más parecidos son dos organismos, mayores su semejanza genética, tratando de demostrar que las secuencias de bases del DNA de dos células son parecidas o exactamente iguales. Para estudios de este tipo pueden utilizarse varias alternativas: Estudio de la composición de bases del ADN Aunque no se conozcan las secuencias de bases púnicas y pirimídicas, sí pueden determinarse las proporciones de las mismas en el DNA total.
- 71 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Se ha calculado que si dos organismos difieren en el contenido de Guanina-Citosina en más del 10% tienen pocas secuencias de bases en común. Por tanto, no se considerarán estrechamente relacionadas, al no ser descendientes de un antepasado común. Sin embargo, puede ocurrir a veces que dos células con proporciones de bases idénticas no estén relacionadas, ya que en ácidos nucleicos de la misma composición de bases son posibles muchas secuencias diferentes.
Estudios de hibridación y homología de los ácidos nucleicos Cuando se calienta una preparación de DNA, las dos cadenas que lo forman se separan, siendo una complementaria de la otra. Cuando la mezcla se enfría lentamente, las dos cadenas complementarias se vuelven a asociar, formándose otra vez la doble hélice. Como la nueva asociación requiere que las secuencias de bases sean complementarias, la presencia de secuencias iguales de dos microorganismos diferentes puede detectarse midiendo el grado en que sus ácidos nucleicos son capaces de interaccionar específicamente. El grado de hibridación de los ácidos nucleicos es menor cuando los microorganismos no están estrechamente relacionados, aunque la composición conjunta de bases púnicas y pirimídicas sea la misma. Estudios de marcadores moleculares La aplicación de marcadores moleculares en la resolución de problemas genéticos es un campo en auge permanente que se ha desarrollado y acelerado en los últimos años gracias a la tecnología de PCR. Los marcadores moleculares permiten analizar y medir la diversidad de individuos, poblaciones y especies, evaluando directamente la variación genética que se produce a nivel de ADN. Los ácidos nucleicos y las proteínas, macromoléculas comunes a todos los seres vivos, cambian con el tiempo. Por ello, pueden considerarse como cronómetros moleculares o documentos de la historia evolutiva. Asumiendo que los cambios se producen al azar y que aumentan con el tiempo de manera lineal, las diferencias en la secuencia de los monómeros (nucleótidos o aminoácidos) que integran macromoléculas homólogas, presentes en dos formas de vida, reflejan la distancia evolutiva existente entre ellas. Esta idea, introducida por Zuckerkandl y Pauling, se ha venido utilizando durante décadas para establecer las relaciones filogenéticas entre los seres vivos, creando un marco apropiado para su clasificación e identificación. El ARN ribosómico (ARNr) 16S es la macromolécula más ampliamente utilizada en estudios de filogenia y taxonomía bacterianas. Su aplicación como cronómetro molecular fue propuesta por Carl Woese (Universidad de Illinois) a principios de la década de 1970. Los estudios de Woese originaron la división de los procariotas en dos grupos o reinos: Eubacteria y Archaeobacteria, cuya divergencia es tan profunda como la encontrada entre ellos y los eucariotas. Además, permitieron establecer las divisiones mayoritarias y subdivisiones dentro de ambos reinos.
- 72 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Posteriormente, Woese introdujo el término Dominio para sustituir al reino como categoría taxonómica de rango superior, y distribuyó a los organismos celulares en tres dominios : Bacteria, Archea y Eukarya, el último de los cuales engloba a todos los seres eucariotas. Desde entonces, el análisis de los ARNr 16S se ha utilizando ampliamente para establecer las relaciones filogenéticas dentro del mundo procariota, causando un profundo impacto en nuestra visión de la evolución y, como consecuencia, en la clasificación e identificación bacteriana. De hecho, las ediciones vigentes de los dos tratados fundamentales de bacteriología, Bergey‟s Manual of Systematic Bacteriology (http://www.springerny.com/bergeysoutline/main.htm) y The Prokaryotes (http://www.prokaryotes.com), basan su estructuración del mundo procariota en las relaciones filogenéticas establecidas con esta macromolécula. Los ARNr 16S pueden actualmente mediante amplificación por PCR y posterior secuenciación por método enzimático.
LOS RIBOSOMAS, LOS OPERONES RIBOSÓMICOS Y EL ARNR 16S Ribosomas Son orgánulos complejos, altamente especializados, que utilizan los organismos para el complicado proceso de síntesis de proteínas. El ribosoma bacteriano tiene un coeficiente de sedimentación de 70S (expresado en unidades Svedberg), y puede disociarse en dos subunidades, la subunidad grande (50S) y la subunidad pequeña (30S). Cada subunidad es un complejo ribonucleoproteico constituido por proteínas ribosómicas y moléculas de ARNr específicas. La subunidad 30S contiene el ARNr 16S y 21 proteínas diferentes (numeradas desde S1S21, donde S procede de small l), mientras que la subunidad 50S contiene los ARNr 5S y 23S junto con unas 34 proteínas (L1-L34; L: large). En bacterias, los genes que codifican los ARN ribosomales están organizados en operones (conjunto de genes que se transcriben a partir de la misma región promotora). Cada operón ribosómico incluye genes para los ARNr 23S (rrl), 16S (rrs) y 5S (rrf), separados por regiones espaciadoras o intergénicas (IG), y contiene además genes para uno o más ARN de transferencia (ARNt). El producto de la transcripción del operón a partir de dos promotores, P1 y P2, situados en la región anterior a rrs, será procesado por el enzima ARNasa III mediante cortes en sitios específicos que separan las tres clases de ARNr, el/los ARNt y las dos IG. ARNr 16S Es un polirribonucleótido de aproximadamente 1.500 nt, codificado por el gen rrs, también denominado ADN ribosomal 16S (ADNr 16S), a partir de cuya secuencia se puede obtener información filogenética y taxonómica. Como cualquier secuencia de nucleótidos de cadena sencilla, el ARNr 16S se pliega en una estructura secundaria, caracterizada por la presencia de segmentos de doble cadena, alternando con regiones de cadena sencilla. En eucariotas, el ARNr 18S es la macromolécula equivalente. Dado que los ARNr 16S y 18S proceden de las subunidades pequeñas de los ribosomas, el acrónimo ARNr SSU (del inglés, small subunit) se utiliza para ambos. Los ARNr SSU se encuentran altamente
- 73 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
conservados, presentando regiones comunes a todos los organismos, pero contienen además variaciones que se concentran en zonas específicas. El análisis de la secuencia de los ARNr 16S de distintos grupos filogenéticos reveló un hecho adicional de gran importancia práctica: la presencia de una o más secuencias características que se denominan oligonucleótidos firma. Se trata de secuencias específicas cortas que aparecen en todos (o en la mayor parte de) los miembros de un determinado grupo filogenético, y nunca (o sólo raramente) están presentes en otros grupos, incluidos los más próximos. Por ello, los oligonucleótidos firma pueden utilizarse para ubicar a cada bacteria dentro de su propio grupo. El número de copias del operón ribosómico por genoma bacteriano varía considerablemente, de 1 a 15, siendo relativamente constante a nivel de especie, género e incluso familia. Entre las copias de los ARNr 16S codificadas por un mismo genoma se ha detectado un cierto grado de heterogeneidad (denominada microheterogeneidad). Aunque existen cronómetros moleculares alternativos al ARNr 16S, hasta el momento ninguno ha conseguido desplazarlo. De hecho, esta macromolécula presenta una serie de características, en base a las cuales fue considerado por Woese como cronómetro molecular definitivo: 1. Se trata de una molécula muy antigua, presente en todas las bacterias actuales. Constituye, por tanto, una diana universal para la identificación. 2. Su estructura y función han permanecido constantes durante un tiempo muy prolongado, de modo que las alteraciones en la secuencia reflejan probablemente cambios aleatorios. 3. Los cambios ocurren de manera suficientemente lenta, como para aportar información acerca de todos los procariotas y, junto con las variaciones en los ARNr 18S, a lo largo de toda la escala evolutiva. Los ARNr SSU contienen, sin embargo, suficiente variabilidad para diferenciar no sólo los organismos más alejados, sino también los más próximos. 4. El tamaño relativamente largo de los ARNr 16S (1.500 nt) minimiza las fluctuaciones estadísticas. 5. La conservación en estructura secundaria puede servir de ayuda en las comparaciones, aportando una base para el alineamiento preciso. 6. Dado que resulta relativamente fácil secuenciar los ADNr 16S existen bases de datos amplias, en continuo crecimiento. Una vez determinada la secuencia de nucleótidos y establecidas las comparaciones, el grado de similitud entre las secuencias de los ADNr 16S de dos bacterias será lo que indique su relación evolutiva. Además, el análisis comparativo de secuencias permite construir árboles filogenéticos, que reflejan gráficamente la genealogía molecular de la bacteria, mostrando su posición evolutiva en el contexto de los organismos comparados. Hay que tener en cuenta, no obstante, que es la comparación de genomas completos, y no la comparación de los ADNr 16S, la que aporta una indicación exacta de las relaciones
- 74 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
evolutivas. En su ausencia, la especie bacteriana se define, en taxonomía, como el conjunto de cepas que comparten una similitud del 70% o más, en experimentos de reasociación ADN-ADN. Stackebrandt y Goebel demostraron que cepas con este nivel de relación presentan típicamente una identidad del 97% o más entre sus genes ARNr 16S. Así, cepas con menos del 97% de identidad en las secuencias de sus ADNr 16S es improbable que lleguen a estar relacionadas a nivel de especie. Sin embargo, existen cepas que comparten una similitud inferior al 50% en experimentos de reasociación, y son por tanto clasificadas en especies diferentes, pero presentan una identidad del 99-100% a nivel de ADNr 16S. Por ello, en taxonomía, actualmente se recomienda la identificación polifásica, que utiliza criterios fenotípicos junto con datos de secuenciación.
ENZIMAS DE RESTRICCIÓN Definición y origen Las enzimas de restricción son endonucleasas que reconocen una secuencia de ADN doble cadena de entre 4 y 8 pb. El sitio de reconocimiento se llama sitio de restricción, y la enzima rompe un enlace fosfodiester en cada hebra. Las secuencias de reconocimiento son repeticiones invertidas perfectamente simétricas conocidas como palíndromos. Las enzimas de restricción se encuentran en muchas especies de bacterias. Las bacterias desarrollaron las enzimas de restricción como una defensa frente a la infección por fagos (virus bacterianos). Se denominan de restricción porque estas enzimas restringen la invasión del ADN exógeno cortándolo en pedazos. En cambio, el ADN propio no es reconocido por sus enzimas de restricción, ya que puede protegerse del corte por metilación específica de la secuencia mediante una metiltransferasa (enzima que transfiere grupos metilo desde S-adenosilmetionina a bases específicas). Los sitios de reconocimiento de las metiltransferasas corresponden a los de las endonucleasas. Este sistema es análogo a un sistema inmune, y le permite distinguir a la bacteria entre su ADN y el ADN exógeno. Estás enzimas son aprovechadas para la tecnología del ADN recombinante. Se denomina ADN recombinante al que se ha formado al intercalar un segmento de ADN extraño en un ADN receptor por enzimas denominadas ligasas. Por ejemplo, la integración de un ADN vírico en un ADN celular. La tecnología del ADN recombinante permite el desarrollo de plantas y animales transgénicos así como microorganismos modificados genéticamente para producir fármacos u otros productos de utilidad para el hombre, entre los que se pueden citar: la
- 75 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
insulina humana, la hormona del crecimiento, interferones, la obtención de nuevas vacunas o la clonación de animales. Tipos de enzimas de restricción Las endonucleasas de restricción se clasifican en tres categorías: Tipo I: es una enzima formada por 3 subunidades que reconoce el sitio de ADN. Esta enzima metila y corta. La restricción no ocurre en el sitio de reconocimiento, sino que es al azar y en sitios distantes al de reconocimiento. Tipo II: dos enzimas diferentes realizan la restricción y la metilación. La restricción ocurre en el sitio de reconocimiento. Estas enzimas son las utilizadas en ingeniería genética debido a que permiten romper el ADN en sitios específicos. Tipo III: es similar al sistema tipo I, utilizan una enzima oligomérica que realiza todas las actividades enzimáticas, y rompen el ADN 25-27 pb, más allá del sitio de reconocimiento. Endonucleasas de restricción tipo II Se han identificado más de 2300 endonucleasas de restricción de tipo II. Se denominan isoesquizómeros a aquellas enzimas que han sido obtenidas de diferentes especies de bacterias, pero que reconocen la misma secuencia de ADN. Las enzimas tipo II, dependiendo de su especificidad, al romper el ADN provocan 2 tipos de cortes: A.Cortes pegajosos, dejando productos con extremos cohesivos (sticky) Ej: Eco RI y Pst I B.Cortes simétricos, dejando productos con extremos romos (blunt). Ej: Pvu II
En este esquema se ve el resultado de la actuación de la enzima de restricción que corta la molécula de ADN en forma escalonada, quedando bordes pegajosos (cohesivos) por donde puede unirse este ADN, con otro aunque sea de una especie diferente.
- 76 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
En este esquema se ve el resultado de la actuación de la enzima de restricción que corta la molécula de ADN justo en el centro de la secuencia, quedando bordes romos (blunt).
Aunque se utilizan ambas clases de fragmentos (con extremos romos y con extremos cohesivos), en ingeniería genética se prefieren aquellos con extremos cohesivos, puesto que permiten la unión espontánea del gen a clonar con el vector. Si las moléculas a utilizar presentan extremos romos, hay que conferirles extremos cohesivos, por ejemplo utilizando la enzima transferasa terminal. La nomenclatura utilizada para designar las enzimas de restricción es la siguiente: Eco RI
- 77 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
E = Escherichia, género co = coli, especie R = factor R, variedad I = orden de aparición En las siguientes tablas se pueden observar las enzimas más comúnmente usadas en biología molecular, nomenclatura, fuentes y sitios de corte.
- 78 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Isoesquizómeros y las familias de enzimas Los isoesquizómeros son enzimas que reconocen un mismo sitio, pero que no lo cortan en el mismo lugar, como Asp 718 y Kpn1. Las familias de enzimas comprenden enzimas que no reconocen necesariamente los mismos sitios, pero producen extremos adhesivos iguales. Hay familias por ejemplo que producen extremos adhesivos GATC ó CTAG. GATC: Sau3AI, BglI, BamHI, BclI et XhoII CTAG: MaeI, SpeI, NheI, AvrI et XhaI En la figura se muestra cómo Sau3AI y BamH1 producen los mismos extremos:
- 79 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
Mapa de restricción. Patrón de restricción. Un mapa de restricción es una secuencia lineal de los sitios de restricción contenidos en una secuencia de ADN. Un patrón de restricción es el patrón o perfil de ADN generado mediante electroforésis que se obtiene después de cortar con una enzima de restricción. Los fragmentos obtenidos después de la actuación de las distintas enzimas de restricción, se pueden separar por tamaños, es decir, según el número de pares de nucleótidos que llevan, mediante la técnica de electroforesis y así estudiar los distintos trozos. Según donde se hallen las secuencias de reconocimiento, un gen determinado puede estar fragmentado en varios trozos, o bien un trozo puede contener varios genes. Para obtener un patrón de restricción se podría emplear el siguiente procedimiento: 1. Utilizar muestras de ADN bicatenario con concentración de 0,1 µg/µL y longitud de 10.000 bp.
2. Poner 10 µl de ADN en los tubos de microcentrífuga, 7 µl de agua, 1 µl de enzima de restricción EcoRI (por ej.) y 2 µl del buffer 10X para enzimas de restricción EcoRI.
3. Mezclar y centrifugar. 4. Poner a baño María (37°C) durante 1 hora. - 80 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
5. Con la ayuda de una pipeta, pasar los hidrolizados a un pocillo de electroforesis en gel de agarosa En uno de los tubos adyacentes, depositar una muestra de ADN no hidrolizado y en otros dos, una mezcla de moléculas de ADN de tamaño conocido (marcadores), que servirán para calcular las tallas de los fragmentos obtenidos. 6. Realizar la electroforesis y revelar 7. Usar un transiluminador UV para visualizar las moléculas de ADN. El marcador de peso molecular permite analizar que la EcoRI cortó la molécula original de 10.000 bp en dos fragmentos, de 7.500 y 2.500 bp respectivamente.
Tamaño de los fragmentos de restricción Si los sitios de restrición fueran distribuidos al azar en la longitud de una molécula de ADN, una enzima que reconocería una secuencia de 4 nucleótidos, cortaría 1/256 nucleótidos (es decir, hallaría 1 sito de corte cada 256 nucleótidos), mientras que una enzima que reconocería 6 nucleótidos cortaría en promedio 1/4.096 nucleótidos.
- 81 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
La digestión por EcoRI (secuencia de reconocimiento de 6 nucleótidos) de una molécula de ADN bacteriano de 4 millones de pares de bases producirá alrededor 103 fragmentos diferentes, mientras que la digestión total de ADN de un mamífero va a producir alrededor de 106 fragmentos. Es por esto que la frecuencia de aparición de un sitio depende de su secuencia de nucleótidos. Por ejemplo, la enzima NotI que reconoce un sitio de 8 nucleótidos 5'GCØGGCCGC-3' realiza sólo 3 cortes en el ADN de mamíferos: produce fragmentos de talla media de 1 a 1,5 millones de pares de bases. Esta enzima se utiliza en los trabajos de cartografía física del ADN. RFLP: RESTRICTION FRAGMENT LENGTH POLYMORPHISM (RFLP): POLIMORFISMO DE LA LONGITUD DE LOS FRAGMENTOS DE RESTRICCIÓN: El análisis del patrón de restricción del ADN es una de las técnicas más utilizadas para la identificación y agrupación de bacterias. Esta técnica puede ser usada para separar especies pertenecientes al mismo género, o para distinguir cepas bacterianas que presenten gran similitud dentro de la misma especie o subespecie. Los fragmentos resultantes de la digestión del ADN total por la acción de las enzimas de restricción pueden ser separados por electroforesis generando un patrón de bandas, el cual es la huella dactilar de la cepa, ya que el número y localización de los sitios de restricción es específico para cada genoma. ARDRA: AMPLIFIED RIBOSOMAL DNA RESTRICTION ANALYSES: ANÁLISIS DE RESTRICCIÓN DEL ADN RIBOSOMAL AMPLIFICADO El análisis de restricción del ADN ribosomal amplificado es una técnica muy útil para la identificación y clasificación de bacterias, incluso a nivel de especie, además permite la clasificación de aislamientos y clones de manera simple, rápida y económica
1
2
3
4
5
6
7
8
1
2000 2000 1500 1500 1000 1000 750 750 500 500 250
250
- 82 -
2
3
4
5
6
7
8
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
A 1
2
3
B 4
5
6
7
8
2000 1500 1000 750 500 250
C (Extraído con permiso Albarracín, 2007-Tesis Doctoral) Patrones de restricción de los fragmentos de ADN que codifican para el ARNr 16S. A. Calles: 1. Marcador 1Kb (Promega). 2, 3 y 4. ADNr 16S del aislamiento AB0, digerido con Kpn I, Pst I y Sau3AI, respectivamente. 6, 7 y 8. ADNr 16S del aislamiento AB2C, digerido con Kpn I, Pst I y Sau3AI, respectivamente. B. Calles: 1. Marcador 1Kb (Promega). 3 y 5. ADNr 16S digerido con Sau3AI de los aislamientos AB2A y AB3, respectivamente. 7 y 8. ADNr 16S digerido con Kpn I de los aislamientos AB3 y AB5F, respectivamente. C. Calles: 1. Marcador 1Kb (Promega). ADNr 16S amplificado a partir de ADN del aislamiento AB0 y digerido con: 2. Sal I. 3. Sau3A
El poder resolutorio del ARDRA depende de la/s enzima/s utilizada/s. Primero se debe realizar una PCR para amplificar el ADNr 16s y luego se cortan los amplicones con enzimas de restricción. Los amplicones digeridos se separan por electroforesis. El método se basa en la variación en la posición de sitios de restricción entre las secuencias y en la determinación de la longitud de fragmentos de restricción. Los patrones obtenidos se pueden comparar con los ARDRA de bacterias conocidas, usando las secuencias de ADNr presentes en bases de datos, empleando la digestión in silico. La digestión in silico permite realizar una selección adecuada de las enzimas a utilizar. La digestión in silico involucra la utilización de programas de computación para simular la actividad de las enzimas de restricción sobre secuencias disponibles en bases de datos. Las secuencias de ADNr son importadas desde las bases a datos a la computadora y con ayuda de programas apropiados (por ej. DNAMAN) se simula la restricción y se analizan los fragmentos obtenidos. De esta manera se pueden seleccionar las enzimas más apropiadas para el análisis del género o especie en estudio.
- 83 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
3- Actividades prácticas Amplificación de genes de ADNr 16s in silico y posterior restricción con enzimas. Se realizará la digestión in silico del ADNr de 3 cepas pertenecientes al género Mycoplasma, para poder diferenciar las especies, teniendo en cuenta los ARDRA obtenidos a partir de especies conocidas. De acuerdo a Stakenborg y col. (2005), todas las especies de Mycoplasma pueden diferenciarse de acuerdo a los ARDRA obtenidos usando en forma secuencial las enzimas de restricción AluI, BfaI y HpyF10VI. 1) Secuencias de ADNr de 9 cepas de Mycoplasma de referencia en formato FASTA, que pueden ser diferenciadas usando la enzima AluI: >gi|3413492|emb|AJ002269.1| Mycoplasma hominis 16S rRNA, rrnB operon, strain 7488 TTTTTTATAAGAGTTTGATCCTGGCTCAGGATGAACGCTGGCTGTGTGCCTAAT ACATGCATGTCGAGCGAGGTTAGCAATAACCTAGCGGCGAATGGGTGAGTAAC ACGTGCTTAATCTACCTTTTAGATTGGAATACCCATTGGAAACAATGGCTAATG CTGGATACGCATGGAACCGCATGGTTCCGTTGTGAAAGGCGCTGTAAGGCGCC ACTAAAAGATGAGGGTGCGGAACATTAGTTAGTTGGTGAGGTAATGGCCCACC AAGACTATGATGTTTAGCCGGGTCGAGAGACTGAACGGCCACATTGGGACTGA GATACGGCCCAAACTCCTACGGGAGGCAGCAGTAGGGAATATTCCACAATGAG CGAAAGCTTGATGGAGCGACACAGCGTGCACGATGAAGGTCTTCGGATTGTAA AGTGCTGTTATAAGGGAAGAACATTTGCAATAGGAAATGATTGCAGACTGACG GTACCTTGTCAGAAAGCGATGGCTAACTATGTGCCAGCAGCCGCGGTAATACA TAGGTCGCAAGCGTTATCCGGAATTATTGGGCGTAAAGCGTTCGTAGGCTGTTT GTTAAGTCTGGAGTTAAATCCCGGGGCTCAACCCCGGCTCGCTTTGGATACTAG CAAACTAGAGTTAGATAGAGGTAAGCGGAATTCCATGTGAAGCGGTGAAATGC GTAGATATATGGAAGAACACCAAAGGCGAAGGCAGCTTACTGGGTCTATACTG ACGCTGAGGGACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGT CCACGCCGTAAACGATGATCATTAGTCGGTGGAGAATCACTGACGCAGCTAAC GCATTAAATGATCCGCCTGAGTAGTATGCTCGCAAGAGTGAAACTTAAAGGAA TTGACGGGGACCCGCACAAGCGGTGGAGCATGTGGTTTAATTTGAAGATACAC GGAAAACCTTACCCACTCTTGACATCCTTCGCAAAGCTATAGAGATATAGTGG AGGTTATCGGAGTGACAGATGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGAT GTTTGGTCAAGTCCTGCAACGAGCGCAACCCCTATCTTTAGTTACTAACATTAA GTTGAGGACTCTAGAGATACTGCCTGGGTAACTGGGAGGAAGGTGGGGATGAC GTCAAATCATCATGCCTCTTACGAGTGGGGCCACACACGTGCTACAATGGTCG GTACAAAGAGAAGCAATATGGCGACATGGAGCAAATCTCAAAAAGCCGATCTC AGTTCGGATTGGAGTCTGCAATTCGACTCCATGAAGTCGGAATCGCTAGTAATC GCAGATCAGCTATGCTGCGGTGAATACGTTCTCGGGTCTTGTACACACCGCCCG TCACACCATGGGAGCTGGTAATACCCAAAGTCGGTTTGCTAACCTCGGAGGCG ACCGCCTAAGGTAGGACTGGTGACTGGGGTGAAGTCGTAACAAGGTATCCCTA CGAGAACGTGGGGATGGATCACCTCC
- 84 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
>gi|6066195|gb|AF132740.1| Mycoplasma pneumoniae strain ATCC 15531 16S ribosomal RNA gene and 16S-23S rRNA intergenic spacer, complete sequence TTAACGCTGGCGGCATGCCTAATACATGCAAGTCGATCGAAAGTAGTAATACT TTAGAGGCGAACGGGTGAGTAACACGTATCCAATCTACCTTATAATGGGGGAT AACTAGTTGAAAGACTAGCTAATACCGCATAAGAACTTTGGTTCGCATGAATC AAAGTTGAAAGGACCTGCAAGGGTTCGTTATTTGATGAGGGTGCGCCATATCA GCTAGTTGGTGGGGTAACGGCCTACCAAGGCAATGACGTGTAGCTATGCTGAG AAGTAGAATAGCCACAATGGGACTGAGACACGGCCCATACTCCTACGGGAGGC AGCAGTAGGGAATTTTTCACAATGAGCGAAAGCTTGATGGAGCAATGCCGCGT GAACGATGAAGGTCTTTAAGATTGTAAAGTTCTTTTATTTGGGAAGAATGACTT TAGCAGGTAATGGCTAGAGTTTGACTGTACCATTTTGAATAAGTGACGACTAAC TATGTGCCAGCAGTCGCGGTAATACATAGGTCGCAAGCGTTATCCGGATTTATT GGGCGTAAAGCAAGCGCAGGCGGATTGAAAAGTCTGGTGTTAAAGGCAGCTGC TTAACAGTTGTATGCATTGGAAACTATTAATCTAGAGTGTGGTAGGGAGTTTTG GAATTTCATGTGGAGCGGTGAAATGCGTAGATATATGAAGGAACACCAGTGGC GAAGGCGAAAACTTAGGCCATTACTGACGCTTAGGCTTGAAAGTGTGGGGAGC AAATAGGATTAGATACCCTAGTAGTCCACACCGTAAACGATAGATACTAGCTG TCGGGGCGATCCCCTCGGTAGTGAAGTTAACACATTAAGTATCTCGCCTGGGTA GTACATTCGCAAGAATGAAACTCAAACGGAATTGACGGGGACCCGCACAAGTG GTGGAGCATGTTGCTTAATTCGACGGTACACGAAAAACCTTACCTAGACTTGAC ATCCTTGGCAAAGTTATGGAAACATAATGGAGGTTAACCGAGTGACAGGTGGT GCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAG CGCAACCCTTATCGTTAGTTACATTGTCTAGCGAGACTGCTAATGCAAATTGGA GGAAGGAAGGGATGACGTCAAATCATCATGCCCCTTATGTCTAGGGCTGCAAA CGTGCTACAATGGCCAATACAAACAGTCGCCAGCTTGTAAAAGTGAGCAAATC TGTAAAGTTGGTCTCAGTTCGGATTGAGGGCTGCAATTCGTCCTCATGAAGTCG GAATCACTAGTAATCGCGAATCAGCTATGTCGCGGTGAATACGTTCTCGGGTCT TGTACACACCGCCCGTCAAACTATGAAAGCTGGTAATATTTAAAAACGTGTTGC TAACCATTAGGAAGCGCATGTCAAGGATAGCACCGGTGATTGGAGTTAAGTCG TAACAAGGTACCCCTACGAGAACG >gi|12698861|gb|AF332744.1| Mycoplasma agalactiae strain 847.121 16S ribosomal RNA gene, partial sequence CTGGCTGTGTGCCTAATACATGCATGTCGAGCGATGATAGCAATATCATAGCG GCGAATGGGTGAGTAACACGTACTCAACGTACCTTTTAGATTGGGATAGCGGA TGGAAACATCCGATAATACCGAATACTTATTATTTTTGCATGAAAGTAATATAA AAGGAAGCGTTTGCTTCGCTAGAAGATCGGAGTGCGCAACATTAGCTAGTTGG TGAGGTAACGGCCCACCAAGGCGATGATGTTTAGCGGGGTTGAGAGATTGATC CGCCACACTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTAGG GAATATTCCACAATGGACGAAAGTCTGATGGAGCGACACAGCGTGCAGGATGA AGGCCCTATGGGTTGTAAACTGCTGTGGTTAGGGAAGAAAAAGTAGCGTAGGA AATGACGCTACCTTGACGGTACCTGATTAGAAAGCAACGGCTAACTATGTGCC AGCAGCCGCGGTAATACATAGGTTGCAAGCGTTATCCGAAATTATTGGGCGTA
- 85 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
AAGCGTCTGTAGGTTGTTTGTTAAGTCTGGCGTTAAATTTTGGGGCTCAACCCC AAAACGCGTTGGATACTGGCAGACTAGAGTTATGTAGAGGTTAGCGGAATTCC TTGTGAAGCGGTGAAATGCGTAGATATAAGGAAGAACATCAATATGGCGAAGG CAGCTAACTGGGCATACACTGACACTGAGAGACGAAAGCGTGGGGAGCAAAC AGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGATCATTAGTTGATGG GGAACTCATCGACGCAGCTAACGCATTAAATGATCCGCCTGAGTAGTACGTTC GCAAGAATAAAACTTAAAGGAATTGACGGGGATCCGCACAAGCGGTGGAGCA TGTGGTTTAATTTGAAGATACGCGTAGAACCTTACCCACTCTTGACATCTTCTG CAAAGCTATGGAGACATAGTGGAGGTTAACAGAATGACAGATGGTGCATGGTT GTCGTCAGCTCGTGTCGTGAGATGTTCGGTTAAGTCCTGCAACGAGCGCAACCC TTATCCTTAGTTACTACCATTTAGTTGAGCACTCTAAGGAGACTGCCCGAGTAA TCGGGAGGAAGGTGGGGACGACGTCAAATCATCATGCCTCTTACGAGTGGGGC TACACACGTGCTACAATGGACGGTACAAAGAGAAGCGAAGTGGTGACATGGA GCAAACCTCAAAAAACCGTTCTCAGTTCGGATTGAAGTCTGCAACTCGACTTCA TGAAGTCGGAATCGCTAGTAATCGTAGATCAGCTACGCTACGGTGAATACGTT CTCGGGTCTTGTACACACCGCCCGTCAAACCATGGGAGCTGGTAATGCCCGAA GTCGGTTTATTAAGAAACTGCCTAAGGCAGGACTGGTGACTGGGGTTAAGTCG TAACAAGGTATCCCTACGAGAAC >gi|175468|gb|M24289.1|MYCRRNAF M.fermentans ribosomal RNA small subunit NNTTTTTCGAGAGTTTGATCCTGGCTCAGGATGAACGCTGGCTGTGTGCCTAAT ACATGCATGTCGAGCGAAGGTAGCAATACCTTAGCGGCGAATGGGTGAGTAAC ACGTGCTCAACGTACCCTTCAGTTTGGCATAGCGACTGGAAACAGTCGATAATT TCAAATACTCGTAGTTTTCGCATGAAGATTACGGAAAAGAAGCNTTTCTTCGCT GGAGGAGCGGGGTGCGTAACATTAGCTAGTTGGTGAGGTAACGGCCCACNAAG GCGATAATGTTTNGCGGGGTTGAGAGACTGAACCGCCACACTGGGACTGAGAT ACGGCCNNGACTCCTACGGGAGGCNGCNGTAGGGAATNTTCCACNATGGGCGA AAGCCTGATGGAGCGACACAGCGTGAAGGATGAAGGTCCTATGGATTGTAAAC TTCTGTGGTAAGGGAAGAAAAGACAGAATAGGAAATGATTTTGTTTTGACGGT ACCTNATTNGAAAGCAACGGCTAACTATGTGCCAGCAGCCGCGGTAATACATA GGTTGCNAGCGTTATCCGGAATTNTTGGGCGTAAAGCGTCTGTAGGTTGTTTGT TAAGTCTGGCGTTAAATTTTGGGGCTCAACCCCAAAACGCGTTGGATACTGGCA GGCTAGAGTTGTGTNGAGGTTAGCGGAATTCCTTGTGAAGCGGTGAAATGCGT AGATATAAGGAAGAACACCAAGATGGCGAAGGCAGCTAACTGGACATATACT GACACTGAGAGACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAG TCCACGCCCTAAACGATGATCATTAGCTGATGGGGAACTCATCGGCGCAGCTA ACGCATTAAATGATCCGCCTGAGTAGTACGTTCGCAAGAATAAAACTTAAAGG AATTGACGGGGATCCGCACAAGCGGTGGAGCATGTGGTTTAATTTGAAGATAC GCGTAGAACCTTACCCACTCTTGACATCTTCTGCAAAGCTATGGAGACATAGTG GAGGTTAACAGAATGACAGATGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAG ATGTTTGGTTAAGTCCTGCAACGAGCGCAACCCTTATCCTTAGTTACTACCATT TAGTTGAGGACTCTAAGGAGACTGCCCGAGTAATCGGGAGGAAGGTGGGGATG ACGTCAAATCATCATGCCTCTTACGAGTGGGGCAACACACGTGCTACAATGGC CGGTACAAAGAGAAGCGAAGTGGTGACATGGAGCAAACCTCAAAAAACCGGT
- 86 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
CTCAGTTCGGATTGTAGTCTGCAACTCGACTACATGAAGTCGGAATCGCTAGTA ATCGTAGATCNCGTACGCTACGGTGAATACGTTCTCGGGTCTTGTACACACCGC CCGTCAAACCATGGGAGCTGGTAATGCCCGAAGTCGGTTTATNAACAAATCGC CTAAGGCAGGACTGGTGACTGGGG >gi|862689|gb|U26047.1|MCU26047 Mycoplasma capricolum capricolum E570 16S ribosomal RNA (rrnA) gene, partial sequence CTGGCGGCATGCCTAATACATGCAAGTCGAACGGGGGTGCTTGCACCTCAGTG GCGAACGGGTGAGTAACACGTATCTAACCTACCTTATAGCGGGGGATAACTTT TGGAAACGAAAGATAATACCGCATGTAGATCTTATTATCGCATGAGAAAAGAT CAAAAGAACCGTTTGGTTCACTATGAGATGGGGATGCGGCGTATTAGCTAGTA GGTGAGATAATAGCCCACCTAGGCGATGATACGTAGCCGAACTGAGAGGTTGA TCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTA GGGAATTTTTCACAATGGACGAAAGTCTGATGAAGCAATGCCGCGTGAGTGAT GACGGCCTTCGGGTTGTAAAGCTCTGTTGTAAGGGAAGAAAAAATAAAGTAGG AAATGACTTTATCTTGACAGTACCTTACCAGAAAGCCACGGCTAACTATGTGCC AGCAGCCGCGGTAATACATAGGTGGCAAGCGTTATCCGGATTTATTGGGCGTA TAGGGTGCGTAGGCGGTTTTGCAAGTTTGAGGTTAAAGTCCGGAGCTCAACTCC GGTTCGCCTTGAAAACTGTTTTACTAGAATGCAAGAGAGGTAAGCGGAATTCC ATGTGTAGCGGTGAAATGCGTAGATATATGGAAGAACACCTGTGGCGAAAGCG GCTTACTGGCTTGTTATTGACGCTGAGGCACGAAAGCGTGGGGAGCAAATAGG ATTAGATACCCTAGTAGTCCACGCCGTAAACGATGAGTACTAAGTGTTGGGGT AACTCAGCGCTGCAGCTAACGCATTAAGTACTCCGCCTGAGTAGTATGCTCGCA AGAGTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGTGGTGGAGCATGT GGTTTAATTCGAAGCAACACGAAGAACCTTACCAGGGCTTGACATCCAGTGCA AAGCTATAGAGATATAGTAGAGGTTAACATTGAGACAGGTGGTGCATGGTTGT CGTCAGTTCGTGCCGTGAGGTGTTGGGTTAAGTCCCGCAACGAACGCAACCCTT GTCGTTAGTTACTAACATTAAGTTGAGAACTCTAACGAGACTGCTAGTGTAAGC TAGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGTCCTGGGCTA CACACGTGCTACAATGGCTGGTACAAAGAGTTGCAATCCTGTGAAGGGGAGCT AATCTCAAAAAACCAGTCTCAGTTCGGATTGAAGTCTGCAACTCGACTTCATGA AGCCGGAATCACTAGTAATCGCGAATCAGCTATGTCGCGGTGAATACGTTCTC GGGTCTTGTACACACCGCCCGTCACACCATGAGAGTTGGTAATACCAGAAGTA GGTAGCTTAACCATTTGGAGAGCGCTTCCCAAGGTAGGACTAGCGATTGGGGT GAAGTCGTAACAAGGTATCCGTACGGGAAC >gi|4883887|gb|AF125586.1| Mycoplasma buccale strain CH20247(T) 16S ribosomal RNA gene, partial sequence CTGGCTGTGTGCCTAATACATGCATGTCGAGCGGAAGTAGCAATACTTTAGCG GCGAATGGGTGAGTAACACGTGCTTAATCTACCTTTTAGATTGGAATACCCAAT GGAAACATTGGTTAATGCCGGATACGCATAGAATCGCATGATTCTGTTGTGAA AGAAGCGTTTGCTTCACTAAGAGATGAGGGTGCGGAACATTAGCTTGTTGGTG AGGTAATGGCCCACCAAGGCTATGATGTTTAGCCGGGTCGAGAGACTGAACGG CCACATTGGGACTGAGATACGGCCCAAACTCCTACGGGAGGCAGCAGTAGGGA
- 87 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
ATATTCCACAATGAGCGAAAGCTTGATGGAGCGACACAGCGTGCATGATGACG GTCTTCGGATTGTAAAGTGCTGTTATAAGGGAAGAACACTTAGTTGAGGAAAT GCTTCTAAGCTGACGGTACCTTATTAGAAAGCGATGGCTAACTATGTGCCAGCA GCCGCGGTAATACATAGGTCGCAAGCGTTATCCGGAATTATTGGGCGTAAAGC GTTCGTAGGCTGTTTATTAAGTCTGAAGTCAAATCCCAGGGCTCAACCCTGGTT CGCTTTGGATACTGGTAAACTAGAGTTGGATAGAGGTAAGCGGAATTCCATGT GAAGCGGTGAAATGCGTAGATATATATGGAAGAACACCAAAGGCGAAGGCAG CTTACTGGGTCTATACTGACGCTGAGGGACGAAAGCGTGGGGAGCAAACAGGA TTAGATACCCTGGTAGTCCACGCCGTAAACGATGATCATTAGTCGGTGGAGAA TCACTGACGCAGCTAACGCATTAAATGATCCGCCTGAGTAGTATGCTCGCAAG AGTGAAACTTAAAGGAATTGACGGGGACCCGCACAAGCGGTGGAGCATGTGGT TTAATTTGAAGATACACGGAGAACCTTACCCACTCTTGACATCCTTCGCAATAC TATAGAGATATAGTGGAGGTTAACGGAGTGACAGATGGTGCATGGTTGTCGTC AGCTCGTGTCGTGAGATGTTTGGTCAAGTCCTGCAACGAGCGCAACCCCTATCT TTAGTTACTAACGAGTCATGTCGAGGACTCTAGAGATACTGCCTGGGTAACTGG GAGGAAGGTGGGGATGACGTCAAATCATCATGCCTCTTACGAGTGGGGCAACA CACGTGCTACAATGGTCGGTACAAAGAGAAGCAATATGGCGACATGGAGCAA ATCTCAAAAAGCCGATCTCAGTTCGGATTGAAGTCTGCAATTCGACTTCATGAA GTCGGAATCGCTAGTAATCGCAGATCAGCTATGCTGCGGTGAATACGTTCTCGG GTCTTGTACACACCGCCCGTCACACCATGGGAGCTGGTAATACCCAAAGTCGG TTTGCTAACCTCGGAGGCGACTGCCTAAGGTAGGACTGGTGACTGGGGTGAAG TCGTAACAAGGTATCCCTACGAGAAC >gi|18151396|dbj|AB069815.1| Mycoplasma lipophilum gene for 16S rRNA, partial sequence ATTTTGGGGCTCAACCCCAACTCGCGTTGGATACTGGCAAGCTAGAGTTATGTA GAGGTTAGCGGAATTCCATGTGAAGCGGTGAAATGCGTAGATATATGGAAGAA CACCAAGATGGCGAAGGCAGCTAACTGGACATACACTGACACTGAGAGACGA AAGCATGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCATGCCGTAAACGA TGATCATTAGTTGATGGGAGACTCATCGACGCAGCT >gi|7008158|gb|AF221111.1| Mycoplasma caviae isolate G122(T) 16S ribosomal RNA gene, partial sequence CTGGCTGTGTGCCTAATACATGCATGTCGAGCGAAGGTAGCAATACCTTAGCG GCGAATGGGTGAGTAACACGTGCTCAACGTACCCTTCAGTTTGGCATAGCGAC TGGAAACAGTCGATAATTCCAAATACTCGTAATTTTCGCATGAAGATTACGTAA AAGARGCGTTTGCTTCGCTGRAGGATCGGGGTGCGTAACATTAGCTAGTTGGTG AGGTAACGGCCCACCAAGGCGATGATGTTTAGCGGGGTTGAGAGACTGAACCG CCACACTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGA ATATTCCACAATGGGCGAAAGCCTGATGGAGCGACACAGCGTGAAGGATGAA GGTCCTATGGATTGTAAACTTCTGTGGTGAGGGAAGAAAAGACAGAATAGGAA ATGATTTTGTTTTGACGGTACCTTATTAGAAAGCAACGGCTAACTATGTGCCAG CAGCCGCGGTAATACATAGGTTGCAAGCGTTATCCGGAATTATTGGGCGTAAA GCGTCTGTAGGTTGTTTGTTAAGTCTGGCGTTAAATTTTGGGGCTCAACCCCAA
- 88 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
AACGCGTTGGATACTGGCAGACTAGAGTTGTGTAGAGGTTAGCGGAATTCCTT GTGAAGCGGTGAAATGCGTAGATATAAGGAAGAACACCAATATGGCGAAGGC AGCTAACTGGACATATACTGACACTGAGAGACGAAAGCGTGGGGAGCAAACA GGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGATCATTAGCTGATGGG GAACTCATCGGCGCAGCTAACGCATTAAATGATCCGCCTGAGTAGTACGTTCG CAAGAATAAAACTTAAAGGAATTGACGGGGATCCGCACAAGCGGTGGAGCAT GTGGTTTAATTTGAAGATACGCGTAGAACCTTACCCACTCTTGACATCTTCTGC AAAGCTATGGAGACATAGTGGAGGTTAACAGAATGACAGATGGTGCATGGTTG TCGTCAGCTCGTGTCGTGAGATGTTCGGTTAAGTCCTGCAACGAGCGCAACCCT TATCCTTAGTTACTACCATTTAGTTGAGGACTCTAAGGAGACTGCCCGAGTAAT CGGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCTCTTACGAGTGGGGCA ACACACGTGCTACAATGGCCGGTACAAAGAGAAGCGAAGTGGTGACATGGAG CAAACCTCAAAAAACCGGTCTCAGTTCGGATTGTAGTCTGCAACTCGACTACAT GAAGTCGGAATCGCTAGTAATCGTAGATCAGCTACGCTACGGTGAATACGTTC TCGGGTCTTGTACACACCGCCCGTCAAACCATGGGAGCTGGTAATGCCCGAAG TCGGTTTATAAACAAACTGCCTAAGGCAGGACTGGTGACTGGGGTTAAGTCGT AACAAGGTATCCCTACGAGAAC >gi|3294488|gb|U67946.1|MYU67946 Mycoplasma yeatsii strain GIH 16S ribosomal RNA (rrn) gene, partial sequence CTGGCGGCATGCCTAATACATGCAAGTCGAACGGGGGTGCTTGCACCCCAGTG GCGAACGGGTGAGTAACACGTATCTAACCTACCTCATAGCGGGGGATAACTTT TGGAAACGAAAGATAATACCGCATGTGAATCTTATTATCGCATGAGAAAAGAT TGAAAGGACCGTTTGGTTCACTATGAGATGGGGATGCGGCGTATTAGCTAGTA GGTGAKGTAATGGCTCACCTAGGCGATGATACGTAGCCGAACTGAGAGGTTGA TCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTA GGGAATTTTTCACAATGGACGAAAGTCTGATGAAGCAATGCCGCGTGAGTGAT GACGGCCTTCGGGTTGTAAAGCTCTGTTGTAAGGGAAGAAAAAATAGAGTAGG AAATGCCTCTATATTGACGGTACCTTACCAGAAAGCCACGGCTAACTATGTGCC AGCAGCCGCGGTAATACATAGGTGGCAAGCGTTATCCGGATTTATTGGGCGTA TAGGGTGCGTAGGCGGTTTTGCAAGTTTGAGGTTAAAGCCCGGAGCTCAACTC CGGTTCGCCTTGAAAACTGCATTACTAGAATGCAAGAGAGGTAAGCGGAATTC CATGTGTAGCGGTGAAATGCGTAGATATATGGAAGAACACCTGTGGCGAAAGC GGCTTACTGGCTTGTTATTGACGCTGAGGCACGAAAGCGTGGGGAGCAAATAG GATTAGATACCCTAGTAGTCCACGCCGTAAACGATGAGTACTAGGTGTTGGGG TCATCTCAGCGCCGCAGCTAACGCATTAAGTACTCCGCCTGAGTAGTATGCTCG CAAGAGTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGTGGTGGAGCAT GTGGTTTAATTCGAAGCAACACGAAGAACCTTACCAGGGCTTGACATCCAGTG CAAAGCTATAGAGATATAGTGGAGGTTAACATTGAGACAGGTGGTGCATGGTT GTCGTCAGTTCGTGCCGTGAGGTGTTGGGTTAAGTCCCGCAACGAACGCAACC CTTGTCGTTAGTTACTAACATTAAGTTGAGGACTCTAACGAGACTGCTAGTGTA AGCTAGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGTCCTGGG CTACACACGTGCTACAATGGCTGGTACAAAGAGTCGCAATCTCGCGAGGGGGA GCTAATCTCAAAAAGCCAGTCTCAGTTCGGATTGAAGTCTGCAACTCGACTTCA
- 89 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
TGAAGCCGGAATCACTAGTAATCGCGAATCAGCTATGTCGCGGTGAATACGTT CTCGGGTCTTGTACACACCGCCCGTCACACCACGAGAGTTGGTAATACCAGAA GTGGGTAGCTTAACCGCAAGGAGAGCGCCTCCCAAGGTAGGACTGGCGATTGG GGTGAAGTCGTAACAAGGTATCCGTACGGGAAC >gi|409968|gb|U02968.1|U02968 Mycoplasma bovis 16S ribosomal RNA (rrnA) gene, complete sequence CAATTTTTCGAGAGTTTGATCCTGGCTCAGGATGAACGCTGGCTGTGTGCCTAA TACATGCATGTCGAGCGATGATAGCAATATCATAGCGGCGAATGGGTGAGTAA CACGTACTCAACGTACCTTTTAGATTGGGATAGCGGATGGAAACATCCGATAA TACCGAATACTTATTATTTTTGCATGAAAGTAATATAAAAGGAAGCGTTTGCTT CGCTAAAAGATCGGAGTGCGCAACATTAGCTAGTTGGTGAGGTAACGGCCCAC CAAGGCGATGATGTTTAGCGGGGTTGAGAGATTGATCCGCCACACTGGGACTG AGATACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATATTCCACAATGG ACGAAAGTCTGATGGAGCGACACAGCGTGCAGGATGAAGGCCCTATGGGTTGT AAACTGCTGTGGTTAGGGAAGAAAAAGTAGCATAGGAAATGATGCTACCTTGA CGGTACCTGATTAGAAAGCAACGGCTAACTATGTGCCAGCAGCCGCGGTAATA CATAGGTTGCAAGCGTTATCCGAAATTATTGGGCGTAAAGCGTCTGTAGGTTGT TTGTTAAGTCTGGCGTTAAATTTTGGGGCTCAACCCCAAAACGCGTTGGATACT GGCAGACTAGAGTTATGTAGAGGTTAGCGGAATTCCTTGTGAAGCGGTGAAAT GCGTAGATATAAGGAAGAACATCAATATGGCGAAGGCAGCTAACTGGGCATAC ACTGACACTGAGAGACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGG TAGTCCACGCCCTAAACGATGATCATTAGTTGATGGGGAACTCATCGACGCAG CTAACGCATTAAATGATCCGCCTGAGTAGTACGTTCGCAAGAATAAAACTTAA AGGAATTGACGGGGATCCGCACAAGCGGTGGAGCATGTGGTTTAATTTGAAGA TACGCGTAGAACCTTACCCACTCTTGACATCTTCTGCAAAGCTATAGAGACATA GTGGAGGTTAACAGAATGACAGATGGTGCATGGTTGTCGTCAGCTCGTGTCGT GAGATGTTCGGTTAAGTCCTGCAACGAGCGCAACCCTTATCCTTAGTTACTACC ATTTAGTTGAGCACTCTAAGGAGACTGCCCGAGTAATCGGGAGGAAGGTGGGG ACGACGTCAAATCATCATGCCTCTTACGAGTGGGGCTACACACGTGCTACAAT GGACGGTACAAAGAGAAGCGAAGTGGTGACATGGAGCAAACCTCAAAAAACC GTTCTCAGTTCGGATTGAAGTCTGCAACTCGACTTCATGAAGTCGGAATCGCTA GTAATCGTAGATCAGCTACGCTACGGTGAATACGTTCTCGGGTCTTGTACACAC CGCCCGTCAAACCATGGGAGCTGGTAATGCCCGAAGTCGGTTTATAAAGAAAC TGCCTAAGGCAGGACTGGTGACTGGGGTTAAGTCGTAACAAGGTATCCCTACG AGAACGTGGGGATGGATTACCTCCTTTCT 2) Secuencias de ADNr de 3 cepas de Mycoplasma en formato FASTA: >Secuencia 1 CTGGCTGTGTGGCTAATACATGCATGTCGAGCGAAGGTAGCAATACCTTAGCG GCGAATGGGTGAGTAACACGTGCTCAACGTACCCTTCAGTTTGGCATAGCGAC TGGAAACAGTCGATAATTCCAAATACTCGTAATTTTCGCATGAAGATTACGTAA AAGAGGCGTTTGCTTCGCTGRAGGATCGGGGTGCGTAACATTAGCTAGTTGGT
- 90 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
GAGGTAACGGCCCACCAAGGCGATGATGTTTAGCGGGGTTGAGAGACTGAACG GCCACACTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGG AATATTCCACAATGGGCGAAAGCCTGATGGAGCGACACAGCGTGAAGGATGA AGGTCCTATGGATTGTAAACTTCTGTGGTGAGGGAAGAAAAGACAGAATAGGA AATGATTTTGTTTTGACGGTACCTTATTAGAAAGCAACGGCTAACTATGTGCCA GCAGCCGCGGTAATACATAGGTTGCAAGCGTTATCCGGAATTATTGGGCGTAA AGCGTCTGTAGGTTGTTTGTTAAGTCTGGCGTTAAATTTTGGGGCTCAACCCCA AAACGCGTTGGATACTGGCAGACTAGAGTTGTGTAGAGGTTAGCGGAATTCCT TGTGAAGCGGTGAAATGCGTAGATATAAGGAAGAACACCAATATGGCGAAGG CAGCTAACTGGACATATACTGACACTGAGAGACGAAAGCGTGGGGAGCAAAC AGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGATCATTAGCTGATGG GGAACTCATCGGCGCAGCTAACGCATTAAATGATCCGCCTGAGTAGTACGTTC GCAAGAATAAAACTTAAAGGAATTGACGGGGATCCGCACAAGCGGTGGAGCA TGTGGTTTAATTTGAAGATACGCGTAGAACCTTACCCACTCTTGACATCTTCTG CAAAGCTATGGAGACATAGTGGAGGTTAACAGAATGACAGATGGTGCATGGTT GTCGTCAGCTCGTGTCGTGAGATGTTCGGTTAAGTCCTGCAACGAGCGCAACCC TTATCCTTAGTTACTACCATTTAGTTGAGGACTCTAAGGAGACTGCCCGAGTAA TCGGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCTCTTACGAGTGGGGC AACACACGTGCTACAATGGCCGGTACAAAGAGAAGCGAAGTGGTGACATGGA GCAAACCTCAAAAAACCGGTCTCAGTTCGGATTGTAGTCTGCAACTCGACTAC ATGAAGTCGGAATCGCTAGTAATCGTAGATCAGCTACGCTACGGTGAATACGT TCTCGGGTCTTGTACACACCGCCCGTCAAACCATGGGAGCTGGTAATGCCCGA AGTCGGTTTATAAACAAACTGCCTAAGGCAGGACTGGTGACTGGGGTTAAGTC GTAACAAGGTATCCCTACGAGAAG >Secuencia 2 CTGGCTGTGTGCCTAATACATGCATGTCGAGCGATGATAGCAATATCATAGCG GCGAATGGGTGAGTAACACGTACTCAACGTACCTTTTAGATTGGGATAGCGGA TGGAAACATCCGATAATACCGAATACTTATTATTTTTGCATGAAAGTAATATAA AAGGAAGCGCTTGCTTCGCTAGAAGATCGGAGTGCGCAACATTAGCTAGTTGG TGAGGTAACGGCCCACCAAGGCGATGATGTTTAGCGGGGTTGAGAGATTGATC CGCCACACTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTAGG GAATATTCCACAATGGACGAAAGTCTGATGGAGCGACACAGCGTGCAGGATGA ATGCCCTATGGGTTGTAAACTGCTGTGGTTAGGGAAGAAAAAGTAGCGTAGGA AATGACGCTACCTTGACGGTACCTGATTAGAAAGCAACGGCTAACTATGTGCC AGCAGCCGCGGTAATACATAGGTTGCAAGCGTTATGCGAAATTATTGGGCGTA AAGCGTCTGTAGGTTGTTTGTTAAGTCTGGCGTTAAATTTTGGGGCTCAACCCC AAAACGCGTTGGATACTGGCAGACTAGAGTTATGTAGAGGTTAGCGGAATTCC TTGTGAAGCGGTGAAATGCGTAGATATAAGGAAGAACATCAATATGGCGAAGG CAGCTAACTGGGCATACACTGACACTGAGAGACGAAAGCGTGGGGAGCAAAC AGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGATCATTAGTTGATGG GGAACTCATCGAGGCAGCTAACGCATTAAATGATCCGCCTGAGTAGTACGTTC GCAAGAATAAAACTTAAAGGAATTGACGGGGATCCGCACAAGCGGTGGAGCA TGTGGTTTAATTTGAAGATACGCGTAGAACCTTACCCACTCTTGACATCTTCTG
- 91 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
CAAAGCTATGGAGACATAGTGGAGGTTAACAGAATGACAGATGGTGCATGGTT GTCGTCAGCTCGTGTCGTGAGACGTTCGGTTAAGTCCTGCAACGAGCGCAACCC TTATCCTTAGTTACTACCATTTAGTTGAGCACTCTAAGGAGACTGCCCGAGTAA TCGGGAGGAAGGTGGGGACGACGTCAAATCATCATGCCTCTTACGAGTGGGGC TACACACGTGCTACAATGGACGGTACAAAGAGAAGCGAAGTGGTGACATGGA GCAAACCTCAAGAAACCGTTCTCAGTTCGGATTGAAGTCTGCAACTCGACTTCA TGAAGTCGGAATCGCTAGTAATCGTAGATCAGCTACGCTACGGTGAATACGTT CTCGGGTCTTGTACACACCGCCCGTCAAACCATGGGAGCTGGTAATGCCCGAA GTCGGTTTATTAAGAAACTGCCTAAGGCAGGACTGGTGACTGGGGTTAAGTCG TAACAAGGTATCCCTACGAGAAC >Secuencia 3 CTGGCGGCATGCCTAATACATGCAAGTCGAACGGGGGTGCTTGCACCTCAGTG GCGAACGGGTGAGTAACACGTATCTAACCTACCTTATAGCGGGGGATAACTTT TGGAAACGAAAGATAATACCGCATGTAGATCTTATTATCGCATGAGAAAAGAT CAAAAGAACCGTTTGGTTCACTATGAGATGGGGATGCGGCGTATTAGCTAGTA GGTGAGATAATAGCCCACCTAGGCGATGATACGTAGCCGAACTGAGAGGTTGA TCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTA GGGAATTTTTCACAATGGACGAAAGTCTGATGAAGCAATGCCGCGTGAGTGAT GACGGCCTTCGGGTTGTAAAGCTCTGTTGTAAGGGAAGAAAAAATAAAGTAGG AAATGACTTTATCTTGACAGTACCTTACCAGAAAGCCACGGCTAACTATGTGCC AGCAGCCGCGGTAATACATAGGTGGCAAGCGTTATCCGGATTTATTGGGCGTA TAGGGTGCGTAGGCGGTTTTGCAAGTTTGAGGTTAAAGTCCGGAGCTCAACTCC GGTTCGCCTTGAAAACTGTTTTACTAGAATGCAAGAGAGGTAAGCGGAATTCC ATGTGTAGCGGTGAAATGCGTAGATATATGGAAGAACACCTGTGGCGAAAGCG GCTTACTGGCTTGTTATTGACGCTGAGGCACGAAAGCGTGGGGAGCAAATAGG ATTAGATACCCTAGTAGTCCACGCCGTAAACGATGAGTACTAAGTGTTGGGGT AACTCAGCGCTGCAGCTAACGCATTAAGTACTCCGCCTGAGTAGTATGCTCGCA AGAGTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGTGGTGGAGCATGT GGTTTAATTCGAAGCAACACGAAGAACCTTACCAGGGCTTGACATCCAGTGCA AAGCTATAGAGATATAGTAGAGGTTAACATTGAGACAGGTGGTGCATGGTTGT CGTCAGTTCGTGCCGTGAGGTGTTGGGTTAAGTCCCGCAACGAACGCAACCCTT GTCGTTAGTTACTAACATTAAGTTGAGAACTCTAACGAGACTGCTAGTGTAAGC TAGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGTCCTGGGCTA CACACGTGCTACAATGGCTGGTACAAAGAGTTGCAATCCTGTGAAGGGGAGCT AATCTCAAAAAACCAGTCTCAGTTCGGATTGAAGTCTGCAACTCGACTTCATGA AGCCGGAATCACTAGTAATCGCGAATCAGCTATGTCGCGGTGAATACGTTCTC GGGTCTTGTACACACCGCCCGTCACACCATGAGAGTTGGTAATACCAGAAGTA GGTAGCTTAACCATTTGGAGAGCGCTTCCCAAGGTAGGACTAGCGATTGGGGT GAAGTCGTAACAAGGTATCCGTACGGGAAC 3) Con ayuda del programa DNAMAN, realizar la digestión in silico de las 13 secuencias: 1. Al abrir el programa se verá la siguiente pantalla:
- 92 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
2. Agregar las secuencias: seleccionar el canal y pegar la secuencia en la parte inferior
3. Abrir Sequence/Current channel/Analysis definition. En Name reemplazar Unknown por el nombre de la cepa 4. Cargar las 13 cepas, una en cada canal
- 93 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
5. Para realizar el corte con la enzima AluI, ir a Restriction/Restriction Analysis y seleccionar Restriction pattern in graphic window (presenta un esquema con el patrón de restricción en gel de agarosa) y All DNA in sequence channe (realiza el corte para todas secuencias agregadas). Seleccionar Siguiente
- 94 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
6. Seleccionar
Cutter: All (número de pares de bases que reconoce la enzima) End: All (tipo de corte que realiza) De la lista de la izquierda seleccionar (con doble clic) la enzima AluI Seleccionar siguiente
7. Comparar el perfil de restricción obtenido para las secuencias desconocidas con el perfil de las cepas de referencia y determinar a qué especies pertenecen la Secuencia 1, la Secuencia 2 y la Secuencia 3.
- 95 -
Cátedra Biología Molecular Facultad de Ciencias Naturales e IML -2015-
- 96 -