Autor: Luis David Alcaraz

Bioinformática 17 de noviembre

Ejercicios de RNAseq. Vamos a utilizar R y Bioconductor. El ejercicio de hoy consiste en tratar de llevar a cabo el análisis de RNAseq descrito a continuación: http://www.bioconductor.org/help/workflows/rnaseqGene/ Traten de trabajar con los ejemplos incluidos en los paquetes. Si descargan los fastq y hacen los alineamientos desde cero pueden tardar mucho tiempo. Tengan cuidado de…
Leer más

Biotecnología: Presentaciones finales 2015

La próxima semana (martes 17 de noviembre) tendremos un seminario, por equipo tienen que revisar los artículos que pueden descargar del siguiente vínculo: https://drive.google.com/file/d/0B7dtIr9rg974TS1ielVvbEczX1U/view?usp=sharing     La distribución de los artículos es la siguiente:   Equipo 1 (García Romero, Rivera, Aguilera, Olvera) – The american Chetnut’s Genetic rebirth Equipo 2 (Raymundo Alonso, Luis, Janet, José…
Leer más

Bioinformática ensamble

Lee el siguiente primer: http://www.cbcb.umd.edu/research/assembly_primer Explica: ¿Qué es la cobertura de secuenciación? ¿Qué utilidad tiene la ecuación Lander-Waterman? ¿Porqué se originan errores de ensamblado en regiones repetitivas? ¿Qué es un contig? ¿Qué es un scaffold? ¿Qué diferencia hay entre un ensamblador de tipo Greedy y un Overlap-layout-consensus? ¿Qué es un camino Hamiltoniano? ¿Qué es un…
Leer más

Bioinformática 3 de noviembre

Vamos a practicar los conceptos de filogenia. Los datos a utilizar los pueden descargar de la siguiente dirección: http://132.247.90.91/bioinfo/filogenia/   Después de descargarlos podemos comenzar con un clásico de los análisis filogenéticos: Phylip. Pueden revisar este manual que hizo nuestro amigo el Dr. Pablo Vinuesa: http://www.ccg.unam.mx/~vinuesa/Cursos2RMBF/PDFs/C1/Tutorial_Pablo_Vinuesa_uso_paqute_Phylip.pdf Hagan los pasos hasta conseguir un arbol de NJ…
Leer más

Bioinformática práctica 27 octubre

Anotación. El objetivo de la práctica del día de hoy será generar la anotación de las predicciones de genes de los ejercicios anteriores (Glimmer), si no puedes usar el archivo ffn concatenado de cromosoma + plásmidos, con la base de datos del COG (Cluster of Orthologous Groups). Además de usar lo ya aprendido con cd-hit,…
Leer más

Biotecnología 1 Tarea (entrega 26 de octubre)

Estimados, si quieren estudiar para el examen pueden descargar el siguiente PDF con todo lo que hemos visto en esta sección, solamente estará disponible por esta semana (aprovechen): Loading…

Bioinformática 20 octubre 2015

Predicción de genes codificantes Ejercicio 1. Lee el artículo de Glimmer: https://ccb.jhu.edu/papers/glimmer2.pdf 2. Entra al directorio /usr/share/glimmer3/scripts g3-from-scratch.csh get-motif-counts.awk not-acgt.awk g3-from-training.csh glim-diff.awk upstream-coords.awk g3-iterated.csh match-list-col.awk Describe que es lo que está haciendo cada uno de los scripts *.csh en el directorio. 3. Busca, que es un modelo interpolado de Markov 4. Selecciona un archivo fna…
Leer más

Biotecnología tarea 5

Por esta ocasión la tarea se entrega a mano el día de la clase el 20 de octubre, se responde por equipos. Resuelve el siguiente ejercicio, en la imagen de clase había un error que dos de sus compañeros me hicieron ver en el carril #4. Ya está corregido El siguiente es el esquema del…
Leer más

Bioinformática 13 de octubre

Alineamientos múltiples de secuencias. 1. Descarga el siguiente archivo: http://pfam.xfam.org/family/PF04069/alignment/seed/format?format=fasta&alnType=seed&order=a&case=u&gaps=none&download=0 Son algunas secuencias de transportadores ABC (OpuAC) 2. Intenta alinear las secuencias con clustalw, clustalx, muscle y mafft 3. Visualiza el resultado en seaview, jalview y clustalx (guarda las pantallas) 4. Con Seaview guarda el alineamiento en todos los formatos posibles (Mase, Phylip, Clustal, MSF,…
Leer más

Bioinformática 7

Alineamientos múltiples Primero, quiero un control de lectura de http://132.247.90.91/bioinfo/1994_Thompson_Clustal.pdf De las familias de proteínas que encontraste en el ejercicio anterior (cd-hit o blast). 1. Identifica una familia de entre 40-50 copias en el proteoma de una especie. 2. Genera un archivo multifasta con las secuencias de proteínas de esa especie, prueba con el comando…
Leer más

Bioinformática 6 oct 15

http://132.247.90.91/bioinfo/paralogs.txt   Vamos a usar CD-HIT hoy Descarguen la versión de cd-hit de github: https://github.com/weizhongli/cdhit/releases/download/V4.6.4/cd-hit-v4.6.4-2015-0603.tar.gz #hagan esto en el directorio donde tienen sus secuencias. wget https://github.com/weizhongli/cdhit/releases/download/V4.6.4/cd-hit-v4.6.4-2015-0603.tar.gz tar xvfz cd-hit-v4.6.4-2015-0603.tar.gz perl cd-hit-v4.6.4-2015-0603/psi-cd-hit/psi-cd-hit.pl -i vitis.faa -o vitis.clstr -c 0.3 El manual de CD-HIT puede ser consultado en: http://weizhongli-lab.org/cd-hit/wiki/doku.php?id=cd-hit_user_guide Y el artículo en: Weizhong Li & Adam Godzik.…
Leer más

Biotecnología, Tarea 4

Loading…

Bioinformática tarea 5

Revisar el siguiente artículo: Pushker, R., Mira, A., & Rodriguez-Valera, F. (2004). Comparative genomics of gene-family size in closely related bacteria. Genome Biol, 5(4), 0. Lo pueden descargar de la siguiente dirección: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC395786/pdf/gb-2004-5-4-r27.pdf Tratar de hacer la gráfica #1 del artículo usando 3 genomas/proteomas de Agrobacterium que hemos estado usando en el curso. Trata de…
Leer más

Bioinformática: Matriz para solucionar scores en needleman

Pueden accesar aquí a las fórmulas: https://docs.google.com/spreadsheets/d/1zEof8gFHER7NN0gxNJV7HHTuGht734xhmmai8B5jM_8/edit?usp=sharing *Gracias a su compañera Mirelle Flores