2017 Bioinformática. Práctica 29 de agosto

2017 Bioinformática. Práctica 29 de agosto

Fecha límite de entrega el domingo 4 de septiembre a las 23:00

El ejercicio de hoy es clave para comprender como organizar la información genómica, en particular las familias de genes/proteínas.

Es una actividad por equipos de al menos 2, máximo 3 personas (obligatorio, no se califican trabajos individuales).

Primero hay que hacer algunas lecturas:

Twilight zone of protein sequence alignmentsProtein Eng. (1999) 12 (2): 8594 doi:10.1093/protein/12.2.85 Abstract Full Text (HTML) Full Text (PDF)

Weizhong Li & Adam Godzik. Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences. Bioinformatics (2006) 22:1658-1659 PDF, Pubmed

En el caso de CD-HIT encontrarán mejor información en su manual online:

http://weizhongli-lab.org/lab-wiki/doku.php?id=cd-hit-user-guide

 

Posterior a dichas lecturas, revisar qué es un pangenoma, a partir del siguiente artículo:

H. Tettelin et al., Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: implications for the microbial “pan-genome.” Proc Natl Acad Sci U S A. 102, 13950–13955 (2005). https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1216834/

 

Fuente: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1216834/