Bioinformática, evaluación curso
Loading…
Loading…
Ejercicios de RNAseq. Vamos a utilizar R y Bioconductor. El ejercicio de hoy consiste en tratar de llevar a cabo el análisis de RNAseq descrito a continuación: http://www.bioconductor.org/help/workflows/rnaseqGene/ Traten de trabajar con los ejemplos incluidos en los paquetes. Si descargan los fastq y hacen los alineamientos desde cero pueden tardar mucho tiempo. Tengan cuidado de…
Leer más
Lee el siguiente primer: http://www.cbcb.umd.edu/research/assembly_primer Explica: ¿Qué es la cobertura de secuenciación? ¿Qué utilidad tiene la ecuación Lander-Waterman? ¿Porqué se originan errores de ensamblado en regiones repetitivas? ¿Qué es un contig? ¿Qué es un scaffold? ¿Qué diferencia hay entre un ensamblador de tipo Greedy y un Overlap-layout-consensus? ¿Qué es un camino Hamiltoniano? ¿Qué es un…
Leer más
Vamos a practicar los conceptos de filogenia. Los datos a utilizar los pueden descargar de la siguiente dirección: http://132.247.90.91/bioinfo/filogenia/ Después de descargarlos podemos comenzar con un clásico de los análisis filogenéticos: Phylip. Pueden revisar este manual que hizo nuestro amigo el Dr. Pablo Vinuesa: http://www.ccg.unam.mx/~vinuesa/Cursos2RMBF/PDFs/C1/Tutorial_Pablo_Vinuesa_uso_paqute_Phylip.pdf Hagan los pasos hasta conseguir un arbol de NJ…
Leer más
Anotación. El objetivo de la práctica del día de hoy será generar la anotación de las predicciones de genes de los ejercicios anteriores (Glimmer), si no puedes usar el archivo ffn concatenado de cromosoma + plásmidos, con la base de datos del COG (Cluster of Orthologous Groups). Además de usar lo ya aprendido con cd-hit,…
Leer más
Mis estimados: Para la siguiente sesión hay que leer el capítulo «Reconstrucción de la historia de cambio de los caracteres». En este capítulo, el Dr. León Martínez Castilla logra recapitular varios conceptos que hemos estado revisando en clase. El libro completo lo pueden descargar del sitio del inecc o conseguir una edición impresa:…
Leer más
Predicción de genes codificantes Ejercicio 1. Lee el artículo de Glimmer: https://ccb.jhu.edu/papers/glimmer2.pdf 2. Entra al directorio /usr/share/glimmer3/scripts g3-from-scratch.csh get-motif-counts.awk not-acgt.awk g3-from-training.csh glim-diff.awk upstream-coords.awk g3-iterated.csh match-list-col.awk Describe que es lo que está haciendo cada uno de los scripts *.csh en el directorio. 3. Busca, que es un modelo interpolado de Markov 4. Selecciona un archivo fna…
Leer más
Alineamientos múltiples de secuencias. 1. Descarga el siguiente archivo: http://pfam.xfam.org/family/PF04069/alignment/seed/format?format=fasta&alnType=seed&order=a&case=u&gaps=none&download=0 Son algunas secuencias de transportadores ABC (OpuAC) 2. Intenta alinear las secuencias con clustalw, clustalx, muscle y mafft 3. Visualiza el resultado en seaview, jalview y clustalx (guarda las pantallas) 4. Con Seaview guarda el alineamiento en todos los formatos posibles (Mase, Phylip, Clustal, MSF,…
Leer más
Alineamientos múltiples Primero, quiero un control de lectura de http://132.247.90.91/bioinfo/1994_Thompson_Clustal.pdf De las familias de proteínas que encontraste en el ejercicio anterior (cd-hit o blast). 1. Identifica una familia de entre 40-50 copias en el proteoma de una especie. 2. Genera un archivo multifasta con las secuencias de proteínas de esa especie, prueba con el comando…
Leer más
http://132.247.90.91/bioinfo/paralogs.txt Vamos a usar CD-HIT hoy Descarguen la versión de cd-hit de github: https://github.com/weizhongli/cdhit/releases/download/V4.6.4/cd-hit-v4.6.4-2015-0603.tar.gz #hagan esto en el directorio donde tienen sus secuencias. wget https://github.com/weizhongli/cdhit/releases/download/V4.6.4/cd-hit-v4.6.4-2015-0603.tar.gz tar xvfz cd-hit-v4.6.4-2015-0603.tar.gz perl cd-hit-v4.6.4-2015-0603/psi-cd-hit/psi-cd-hit.pl -i vitis.faa -o vitis.clstr -c 0.3 El manual de CD-HIT puede ser consultado en: http://weizhongli-lab.org/cd-hit/wiki/doku.php?id=cd-hit_user_guide Y el artículo en: Weizhong Li & Adam Godzik.…
Leer más
Revisar el siguiente artículo: Pushker, R., Mira, A., & Rodriguez-Valera, F. (2004). Comparative genomics of gene-family size in closely related bacteria. Genome Biol, 5(4), 0. Lo pueden descargar de la siguiente dirección: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC395786/pdf/gb-2004-5-4-r27.pdf Tratar de hacer la gráfica #1 del artículo usando 3 genomas/proteomas de Agrobacterium que hemos estado usando en el curso. Trata de…
Leer más
Tienen hasta el lunes 7 de septiembre (11:59 p.m.) para poder entregar la tarea.
La lista con los aceptados al curso es la siguiente: Tendremos una sesión informativa el próximo martes 4 de agosto a las 9 a.m. en el aula de cómputo del Instituto de Ecología. A los que no fueron aceptados al curso se debe a la gran demanda del curso y a limitaciones de espacio. El…
Leer más