Programa del curso · 2026

Genes, Genomas y Proteomas

UNIVERSIDAD DE TALCA — DOCTORADO EN CIENCIAS
PROF. EDUARDO CASTRO  ·  VIERNES 12:00–15:00  ·  MODELADO DE SISTEMAS QUÍMICOS Y BIOLÓGICOS
www.castrolab.org

Descripción

Este curso entrega los principales conceptos del estudio de genes, genomas y proteomas desde una perspectiva integradora que abarca la biología molecular, la bioinformática y la estadística. Se abordan la estructura y función de los genes, la organización y evolución de los genomas, la replicación y recombinación del ADN, y la transcripción y su regulación.

Se suman los métodos modernos para generar y analizar datos genómicos y proteómicos: secuenciación de nueva generación, transcriptómica, epigenómica y espectrometría de masas. Combina clases, seminarios y trabajo autónomo, con énfasis en la lectura crítica de la literatura y el diseño riguroso de experimentos a nivel de sistemas.

Temas del curso

  1. Evidencia de la evolución y homología: patrón frente a proceso, consiliencia de evidencias y pruebas de Patterson.
  2. Estructura de genes y genomas, evolución del genoma, secuencias repetitivas.
  3. Replicación del DNA, elementos extra-cromosomales, recombinación homóloga y sitio-específica, elementos transponibles y retrovirus.
  4. Regulación de la expresión génica, splicing, RNA catalítico, traducción y código genético.
  5. Tecnologías de secuenciación masiva: Illumina, PacBio y Nanopore.
  6. Diseño de experimentos de alto rendimiento. Algoritmos de ensamblaje y anotación de genomas.
  7. Modelos generativos para datos discretos, datos de cuentas y RNA-Seq; modelos lineales mixtos generalizados.
  8. Visualización y análisis multivariados: PCA, RDA, clustering.
  9. Genómica funcional: RNA-seq, normalización, métodos single-cell, ChIP-seq, ATAC-seq y metilación.
  10. Proteómica y cuantificación de péptidos; biomarcadores con espectrometría de masas.
  11. Integración de datos ómicos.

Evaluación

50%Seminarios o tareas semanales con exposición oralCada estudiante lidera la discusión del artículo que tiene asignado (ver Calendario y Lecturas).
50%Dos pruebas de desarrolloPrueba 1 (Temas 1–6) y Prueba 2 (Temas 7–11).

Resultados de aprendizaje

  1. Integrar datos genómicos, transcriptómicos y proteómicos para analizar sistemas biológicos, con comprensión crítica de los mecanismos moleculares de la regulación génica, la arquitectura del genoma y la función proteica.
  2. Aplicar métodos estadísticos y computacionales a datos de alto rendimiento (RNA-seq, espectrometría de masas, anotación genómica) con R/Bioconductor y plataformas afines.
  3. Evaluar críticamente la literatura en genómica funcional y evolutiva, y liderar discusiones académicas sobre métodos y hallazgos de vanguardia.
  4. Diseñar experimentos rigurosos basados en ómicas, con controles apropiados, replicación y estrategias de análisis para preguntas biológicas complejas.

Calendario y seminarios

Ses.FechaTipoTema y lecturas
S0119 junYa realizadaPresentación del curso
S0226 junClase · Prof.Clase: «La evidencia de la evolución y la homología» · lectura previa: Sección 1
S033 julSeminario · Secc. 1Evolución, homología y genómica comparada
L01 Valentina Garrido  ·  L02 Joaquín Arriagada  ·  L03 Víctor Ríos Campos
S0410 julSeminario · Secc. 1–2Evolución / Estructura del genoma y secuencias repetitivas
L04 Lucas Casanova  ·  L05 Bruno Covarrubias  ·  L06 Gabriela Urra Gajardo
S0517 julSeminario · Secc. 3Replicación, recombinación, TEs y retrovirus
L07 Javiera Brito Cabezas  ·  L08 Ana Cáceres Troncoso  ·  L09 Darien Salgado
S0624 julSeminario · Secc. 4Expresión génica, splicing, ARN catalítico y código
L10 Jordi Hernández  ·  L11 Pedro Valdés  ·  L12 Patricio Suazo Soto
S0731 julSeminario · Secc. 5–6Secuenciación masiva / Diseño, ensamblaje y anotación
L13 Talía Rodríguez  ·  L14 Joan Izquierdo  ·  L15 Valentina Garrido
S087 agoPrueba 1Prueba de desarrollo 1 · Temas 1–6 · todo el curso
S0914 agoSeminario · Secc. 6–7Anotación / Modelos estadísticos para datos ómicos
L16 Joaquín Arriagada  ·  L17 Víctor Ríos Campos  ·  L18 Lucas Casanova
S1021 agoSeminario · Secc. 8Genómica funcional (single-cell, ChIP/ATAC, metilación)
L19 Bruno Covarrubias  ·  L20 Gabriela Urra Gajardo  ·  L21 Javiera Brito Cabezas
S1128 agoSeminario · Secc. 9Proteómica y biomarcadores
L22 Ana Cáceres Troncoso  ·  L23 Darien Salgado  ·  L24 Jordi Hernández
S124 sepSeminario · Secc. 10Integración de datos multiómicos
L25 Pedro Valdés  ·  L26 Patricio Suazo Soto  ·  L27 Talía Rodríguez
S1311 sepPrueba 2 · cierrePrueba de desarrollo 2 · Temas 7–11 + cierre del curso · todo el curso

Lecturas

Veintisiete artículos recientes (2023–2026), uno por estudiante por sesión. La numeración (L01–L27) coincide con la del calendario.

Sección 1Evolución, homología y genómica comparada
L01
Majidian S. et al. · Journal of Molecular Evolution · 2025 PDF ↓ 1.4 MB

Síntesis del 8.º encuentro «Quest for Orthologs» que revisa el estado de la inferencia de ortología y paralogía, y cómo la IA, las estructuras proteicas predichas, las isoformas de splicing y la evolución de dominios remodelan la detección de ortólogos y la anotación funcional.

Discusión

La clase distingue ortología, paralogía y xenología mediante las pruebas de Patterson. ¿Cómo operacionalizan los métodos computacionales modernos esa lógica conceptual, y qué supuestos evolutivos podrían fallar al inferir ortología a escala genómica con herramientas basadas en IA?

L02
Stein R.A. & DePaola R.V. · Physiological Genomics · 2023 PDF ↓ 0.6 MB

Cerca del 8% del genoma humano corresponde a retrovirus endógenos (HERV) integrados en posiciones ortólogas hace decenas de millones de años y heredados verticalmente; algunos fueron cooptados para funciones esenciales (p. ej., sincitinas en la placentación).

Discusión

Los ERV en loci ortólogos compartidos son una de las evidencias moleculares más sólidas de ascendencia común. ¿Por qué una integración independiente en el mismo sitio ortólogo es astronómicamente improbable, y qué advertencias (p. ej., PTERV1) deben tenerse en cuenta al usarlos como marcadores filogenéticos?

L03
Forterre P. · Journal of Molecular Evolution · 2024 PDF ↓ 1.5 MB

Reconstruye la biología inferida de LUCA a partir de filogenómica de genes conservados, argumentando que ya realizaba el metabolismo central y la síntesis de proteínas, y muestra cómo las decisiones de modelo y datos moldean lo que inferimos sobre la raíz del árbol de la vida.

Discusión

La clase presenta el código casi universal y la maquinaria central compartida como evidencia de un único ancestro común (prueba de la UCA de Theobald, 2010). ¿Cómo dependen las reconstrucciones de LUCA de los supuestos de los modelos, y qué señal distingue la verdadera ascendencia común de la mera similitud de secuencia?

L04
Allard J.B. et al. · Nature Communications · 2025 PDF ↓ 1.7 MB

Presenta ESL-PSC, un método filogenético de aprendizaje automático que usa contrastes entre pares de especies para identificar genes y sitios tras rasgos convergentes (fotosíntesis C4, ecolocalización), descontando la convergencia aparente debida a la ascendencia compartida.

Discusión

El contraste central de la clase es homología vs. convergencia (las «alas» de aves y murciélagos). ¿Cómo separa este método la convergencia molecular genuina de la similitud heredada, y qué riesgos de falsos positivos persisten al buscar firmas de convergencia en todo el proteoma?

Sección 2Estructura de genes, organización del genoma y secuencias repetitivas
L05
Liao X. et al. · Communications Biology · 2023 PDF ↓ 1.1 MB

Recorrido completo del ADN repetitivo —repeticiones en tándem, elementos transponibles y duplicaciones segmentarias—: cómo se clasifican, cómo se detectan computacionalmente y cómo impulsan la evolución del genoma y contribuyen a enfermedades humanas complejas.

Discusión

Dado que las secuencias repetitivas ocupan una gran fracción del genoma humano y se asocian con enfermedades, ¿cómo debería integrarse su detección y anotación en el diseño de un experimento de genómica funcional? ¿Qué desafíos metodológicos hay que considerar?

L06
Yoo D. et al. · Nature · 2025 PDF ↓ 37.2 MB

Mediante ensamblajes telómero a telómero de seis especies de grandes simios, resuelve regiones repetitivas antes inaccesibles (duplicaciones segmentarias, centrómeros, loci del MHC), aportando una nueva línea base para entender la evolución y la diversidad del genoma humano.

Discusión

Solo ciertas regiones se resolvieron con ensamblaje telómero a telómero. ¿Qué implica esto para interpretar conclusiones evolutivas extraídas de genomas de referencia previos con vacíos? ¿Cómo cambia nuestra comprensión de la evolución del genoma?

Sección 3Replicación del ADN, recombinación, elementos transponibles y retrovirus
L07
Durrant M.G. et al. · Nature · 2024 PDF ↓ 8.6 MB

Las secuencias de inserción IS110 codifican un «ARN puente» no codificante que contacta simultáneamente el ADN donante y el diana para guiar la recombinación sitio-específica: un mecanismo enteramente nuevo de edición de ADN guiada por ARN, con potencial programable.

Discusión

Los ARN puente son un paradigma nuevo, distinto de CRISPR. Compara su lógica mecanística con la edición CRISPR-Cas9. ¿Qué implicaciones tiene para la ingeniería de genomas y la biología de los elementos transponibles?

L08
Luqman-Fatah A. et al. · RNA Biology · 2024 PDF ↓ 2.7 MB

Recorre el ciclo de vida de los retrotransposones humanos (LINE-1, Alu, HERV) y los mecanismos del hospedero que controlan sus intermediarios de ARN y ADNc. Su reactivación durante la tumorigénesis, el desarrollo, el estrés y el envejecimiento compromete la estabilidad genómica, a la vez que estos elementos operan como motores de diversidad genética y de la inmunidad innata.

Discusión

Los retrotransposones son a la vez parásitos genómicos y elementos reguladores. ¿Qué factores del hospedero restringen su movilización en las células somáticas y cómo su desregulación conecta inestabilidad genómica, inflamación y autoinmunidad?

L09
Raina V.B. et al. · Annual Review of Biochemistry · 2025 PDF ↓ 0.9 MB

Traza los mecanismos bioquímicos de la recombinación homóloga —de la invasión de cadena a la resolución de uniones de Holliday— integrando hallazgos recientes de experimentos con moléculas únicas sobre la cinética y los intermediarios estructurales del proceso.

Discusión

¿Cómo revisan o refinan los estudios de molécula única los modelos clásicos de HR? ¿Qué implicaciones tienen estos detalles mecanísticos para entender la recombinación meiótica y la generación de diversidad genética?

Sección 4Regulación de la expresión génica, splicing, ARN catalítico y código genético
L10
Choquet K. et al. · Nature Reviews Genetics · 2025 PDF ↓ 2.4 MB

Hasta el 40% de los intrones de mamíferos se procesan después de la terminación de la transcripción, lo que replantea el splicing postranscripcional como una capa reguladora importante del control de la expresión génica en el desarrollo, el estrés y la enfermedad.

Discusión

La visión tradicional considera el splicing como mayormente cotranscripcional. ¿Cómo cambia el splicing postranscripcional generalizado nuestra comprensión de cómo las células regulan el momento y la abundancia de isoformas proteicas específicas?

L11
Bhat P. et al. · Nature · 2024 PDF ↓ 9.4 MB

La proximidad física de un gen a los nuclear speckles —condensados enriquecidos en reguladores del splicing— determina directamente la eficiencia con la que se procesa su pre-ARNm, vinculando la organización tridimensional del núcleo con la expresión génica.

Discusión

Si la posición genómica en el núcleo —y no solo la secuencia— controla la eficiencia del splicing, ¿cómo se integra este modelo espacial con las señales de splicing basadas en secuencia? ¿Qué diseños distinguirían ambos mecanismos?

L12
Gilbert W.V. et al. · Annual Review of Biochemistry · 2023 PDF ↓ 0.7 MB

Las modificaciones químicas del ARNm (m6A, m5C, pseudouridina) constituyen un «epitranscriptoma» que influye en cada etapa de la vida del ARNm, desde la transcripción hasta la degradación, ofreciendo nuevas perspectivas sobre el control postranscripcional.

Discusión

¿Cómo se comparan las modificaciones epitranscriptómicas con la metilación del ADN como mecanismos reguladores? Al diseñar un experimento de RNA-seq o proteómica, ¿qué pasos tomarías para controlar sus efectos de confusión en la cuantificación?

Sección 5Tecnologías de secuenciación masiva — Illumina, PacBio y Nanopore
L13
Satam H. et al. · Biology · 2023 PDF ↓ 2.1 MB

Mapea el panorama de las plataformas NGS y sus aplicaciones en genómica, transcriptómica, epigenómica y metagenómica, cubriendo principios técnicos, desafíos de análisis y la trayectoria hacia la secuenciación de moléculas únicas y de lecturas largas.

Discusión

Para una pregunta de investigación de tu área (p. ej., regulación génica en un organismo no modelo), ¿qué plataforma NGS elegirías y cómo tendría en cuenta tu diseño experimental las limitaciones de esa plataforma?

L14
Cook R. et al. · Microbial Genomics · 2024 PDF ↓ 1.6 MB

Con una comunidad mock controlada, compara Illumina, PacBio y Nanopore en recuperación de genomas, tasas de error y predicción génica, y encuentra que los ensamblajes híbridos (Illumina + Nanopore) superan a cualquier tecnología por separado.

Discusión

Ninguna tecnología es óptima en todos los contextos. Para secuenciar un genoma eucariota complejo con muchas repeticiones, ¿cómo diseñarías una estrategia híbrida y qué métricas usarías para evaluar la calidad del ensamblaje?

Sección 6Diseño experimental de alto rendimiento, ensamblaje y anotación de genomas
L15
Gabriel L. et al. · Genome Research · 2024 PDF ↓ 1.7 MB

Pipeline automatizado de anotación que integra RNA-seq y bases de datos de proteínas con modelos génicos entrenados de forma iterativa, superando a enfoques previos especialmente en genomas eucariotas grandes y complejos.

Discusión

Compara las contribuciones de la evidencia de RNA-seq frente a la homología proteica al entrenar buscadores de genes. Sin datos transcriptómicos de una especie nueva, ¿cómo priorizarías tu estrategia de anotación?

L16
Freedman A.H. et al. · Genome Research · 2025 PDF ↓ 1.7 MB

Comparación sistemática de 12 métodos de anotación en 21 especies: TOGA, BRAKER3 y StringTie son consistentemente los de mejor desempeño, y los datos de RNA-seq mejoran sustancialmente la anotación en organismos no modelo.

Discusión

¿En qué condiciones filogenéticas esperarías que falle la transferencia de anotación, y cómo combinarías evidencia de transferencia con evidencia de novo (RNA-seq, proteínas) para anotar un linaje sin parientes cercanos bien anotados?

Sección 7Modelos estadísticos para datos ómicos — generativos, mixtos y RNA-seq
L17
Luo Y. · Theoretical and Natural Science · 2025 PDF ↓ 0.5 MB

Compara enfoques binomial negativo, bayesianos, de modelos lineales y no paramétricos para expresión diferencial en RNA-seq, discutiendo compromisos de sensibilidad, especificidad y robustez según tamaño muestral y diseño.

Discusión

Los tamaños muestrales pequeños son un desafío persistente. Para el diseño de un seminario, ¿cómo justificarías tu elección de modelo estadístico y qué análisis de potencia harías a priori para fijar el número mínimo de réplicas biológicas?

L18
Wu C.-H. et al. · Genome Biology · 2025 PDF ↓ 4.7 MB

Identifica cuatro «maldiciones» de la expresión diferencial en single-cell (exceso de ceros, normalización, efectos de donante y sesgos acumulativos) y propone un marco de efectos mixtos Poisson/Binomial generalizado (GLIMES).

Discusión

GLIMES usa expresión absoluta en lugar de abundancia relativa. ¿Qué implicaciones tiene para la interpretación biológica? ¿Cómo decidirías entre un marco de cuantificación relativa y uno absoluto en tu investigación?

Sección 8Genómica funcional — single-cell, ChIP-seq, ATAC-seq y metilación
L19
Baysoy A. et al. · Nature Reviews Molecular Cell Biology · 2023 PDF ↓ 2.7 MB

Revisión de las tecnologías de célula única que perfilan simultáneamente transcriptoma, epigenoma y proteoma de una misma célula, con aplicaciones en atlas celulares, inmunología tumoral y trazado de linajes.

Discusión

El perfilado simultáneo de transcriptoma y accesibilidad de la cromatina aporta información complementaria, a veces contradictoria. Diseña un experimento multiómico de célula única para estudiar la regulación génica durante la diferenciación, especificando qué modalidades medirías y por qué.

L20
Li H. et al. · Nature Protocols · 2025 PDF ↓ 5.6 MB

Describe spatial-ATAC-RNA-seq y spatial-CUT&Tag-RNA-seq, métodos que coperfilan expresión génica y marcas epigenómicas dentro de secciones de tejido intactas a resolución casi de célula única.

Discusión

¿Cómo cambia, al preservar la información espacial, lo que se puede concluir frente a los enfoques de célula única disociada? Propón una pregunta de tu área que requiera específicamente multiómica con resolución espacial.

L21
Loyfer N. et al. · Nature · 2023 PDF ↓ 14.6 MB

Secuenciación con bisulfito de genoma completo de 39 tipos celulares humanos purificados para construir un atlas del metiloma que revela enhancers específicos de tipo celular y loci regulados por Polycomb; referencia para biopsia líquida y estudios de enfermedad.

Discusión

¿Cómo usarías este atlas para inferir la composición celular de un tejido heterogéneo a partir de bisulfito en bulk? ¿Qué limitaciones tendría el enfoque?

Sección 9Proteómica y cuantificación de péptidos — espectrometría de masas y biomarcadores
L22
Jiang Y. et al. · ACS Measurement Science Au · 2024 PDF ↓ 10.4 MB

Revisión tipo manual del flujo completo de la proteómica bottom-up: extracción y digestión de proteínas, adquisición por LC-MS/MS e interpretación bioinformática; base para quien diseñe un experimento de proteómica.

Discusión

La proteómica bottom-up pierde información sobre proteoformas intactas por la digestión. ¿En qué contextos sería más consecuente esta pérdida, y cómo complementarías el enfoque para abordarla?

L23
Fröhlich K. et al. · Molecular & Cellular Proteomics · 2024 PDF ↓ 1.7 MB

Explica por qué la adquisición independiente de datos (DIA) transformó la proteómica al permitir medir de forma no sesgada y reproducible todos los péptidos detectables, y discute software, aplicaciones clínicas y desafíos pendientes para el diagnóstico de rutina.

Discusión

Los autores recomiendan usar varias herramientas DIA en paralelo porque cada una tiene sesgos. ¿Qué implica para la reproducibilidad clínica? ¿Cómo diseñarías un estudio de validación para un panel de biomarcadores descubierto por DIA-MS?

L24
Wenk D. et al. · Clinical Proteomics · 2024 PDF ↓ 1.6 MB

Estado de la proteómica dirigida por LC-MS/MS para medir biomarcadores de cáncer en muestras clínicas, contrastándola con inmunoensayos y discutiendo el camino del descubrimiento a la validación clínica y sus desafíos.

Discusión

Dada la brecha entre descubrimiento y validación clínica, propón un marco de validación por etapas para un biomarcador de cáncer recién descubierto, especificando los criterios estadísticos y técnicos de cada etapa.

Sección 10Integración de datos multiómicos
L25
Vandereyken K. et al. · Nature Reviews Genetics · 2023 PDF ↓ 3.6 MB

Panorama experimental y computacional de la multiómica de célula única y espacial: cómo la medición conjunta de transcriptoma, epigenoma, proteoma y metaboloma transforma la comprensión del desarrollo, la enfermedad y la identidad celular.

Discusión

La multiómica facilita la inferencia causal al vincular capas moleculares. ¿Qué supuestos computacionales y estadísticos deben cumplirse para que esas inferencias sean válidas, y cómo los comprobarías en un conjunto de datos concreto?

L26
Zheng Y. et al. · Nature Biotechnology · 2023 PDF ↓ 19.6 MB

Con un cuarteto familiar como sistema de referencia con verdad de base, muestra que la cuantificación absoluta —no el perfilado basado en razones— es la causa raíz de la irreproducibilidad en la integración multiómica, y propone una solución práctica.

Discusión

Si el mayor obstáculo es la falta de materiales de referencia comunes y no los algoritmos, ¿cómo diseñarías un estudio multiómico para maximizar la reproducibilidad entre lotes y plataformas? ¿Qué referencias y métricas de control adoptarías?

L27
Ballard J.L. et al. · BioData Mining · 2024 PDF ↓ 1.9 MB

Clasifica arquitecturas de deep learning para integración multiómica (feedforward, redes convolucionales de grafos, autoencoders, modelos generativos) y compara su manejo de datos faltantes, fusión de modalidades e interpretabilidad biológica.

Discusión

El deep learning suele mejorar la predicción a costa de la interpretabilidad. En un estudio clínico que busca predicción y descubrimiento de mecanismos, ¿cómo equilibrarías la complejidad del modelo con la explicabilidad biológica?

Bibliografía

Básica

  • Holmes, S. y Huber, W. (2018). Modern Statistics for Modern Biology. Cambridge University Press.
  • Krebs, J.E., Goldstein, E.S. y Kilpatrick, S.T. (2017). Lewin’s Genes XII. Jones & Bartlett.

Recomendada

  • Bromham, L. (2016). An Introduction to Molecular Evolution and Phylogenetics. Oxford University Press.
  • Brown, T.A. (2023). Genomes 5. CRC Press.
  • Losos, J.B. (Ed.) (2017). The Princeton Guide to Evolution (2.ª ed.). Princeton University Press.

CASTRO LAB · INSTITUTO DE CIENCIAS BIOLÓGICAS · UNIVERSIDAD DE TALCA
castrolab.org · programa actualizado en junio de 2026