Programa del curso · 2026

Genes, Genomas y Proteomas

UNIVERSIDAD DE TALCA — DOCTORADO EN CIENCIAS
PROF. EDUARDO CASTRO · VIERNES 12:00–15:00 · MODELADO DE SISTEMAS QUÍMICOS Y BIOLÓGICOS
www.castrolab.org

Syllabus PDF ↓ Lista de lecturas PDF ↓

Descripción

Este curso entrega los principales conceptos del estudio de genes, genomas y proteomas desde una perspectiva integradora que abarca la biología molecular, la bioinformática y la estadística. Se abordan la estructura y función de los genes, la organización y evolución de los genomas, la replicación y recombinación del ADN, y la transcripción y su regulación.

Se suman los métodos modernos para generar y analizar datos genómicos y proteómicos: secuenciación de nueva generación, transcriptómica, epigenómica y espectrometría de masas. Combina clases, seminarios y trabajo autónomo, con énfasis en la lectura crítica de la literatura y el diseño riguroso de experimentos a nivel de sistemas.

Temas del curso

Evidencia de la evolución y homología: patrón frente a proceso, consiliencia de evidencias y pruebas de Patterson.
Estructura de genes y genomas, evolución del genoma, secuencias repetitivas.
Replicación del DNA, elementos extra-cromosomales, recombinación homóloga y sitio-específica, elementos transponibles y retrovirus.
Regulación de la expresión génica, splicing, RNA catalítico, traducción y código genético.
Tecnologías de secuenciación masiva: Illumina, PacBio y Nanopore.
Diseño de experimentos de alto rendimiento. Algoritmos de ensamblaje y anotación de genomas.
Modelos generativos para datos discretos, datos de cuentas y RNA-Seq; modelos lineales mixtos generalizados.
Visualización y análisis multivariados: PCA, RDA, clustering.
Genómica funcional: RNA-seq, normalización, métodos single-cell, ChIP-seq, ATAC-seq y metilación.
Proteómica y cuantificación de péptidos; biomarcadores con espectrometría de masas.
Integración de datos ómicos.

Evaluación

50%	Seminarios o tareas semanales con exposición oralCada estudiante lidera la discusión del artículo que tiene asignado (ver Calendario y Lecturas).
50%	Dos pruebas de desarrolloPrueba 1 (Temas 1–6) y Prueba 2 (Temas 7–11).

Resultados de aprendizaje

Integrar datos genómicos, transcriptómicos y proteómicos para analizar sistemas biológicos, con comprensión crítica de los mecanismos moleculares de la regulación génica, la arquitectura del genoma y la función proteica.
Aplicar métodos estadísticos y computacionales a datos de alto rendimiento (RNA-seq, espectrometría de masas, anotación genómica) con R/Bioconductor y plataformas afines.
Evaluar críticamente la literatura en genómica funcional y evolutiva, y liderar discusiones académicas sobre métodos y hallazgos de vanguardia.
Diseñar experimentos rigurosos basados en ómicas, con controles apropiados, replicación y estrategias de análisis para preguntas biológicas complejas.

Calendario y seminarios

Resaltar a cargo de:

Ses.	Fecha	Tipo	Tema y lecturas
S01	19 jun	Ya realizada	Presentación del curso
S02	26 jun	Clase · Prof.	Clase: «La evidencia de la evolución y la homología» · lectura previa: Sección 1
S03	3 jul	Seminario · Secc. 1	Evolución, homología y genómica comparada L01 Valentina Garrido · L02 Joaquín Arriagada · L03 Víctor Ríos Campos
S04	10 jul	Seminario · Secc. 1–2	Evolución / Estructura del genoma y secuencias repetitivas L04 Lucas Casanova · L05 Bruno Covarrubias · L06 Gabriela Urra Gajardo
S05	17 jul	Seminario · Secc. 3	Replicación, recombinación, TEs y retrovirus L07 Javiera Brito Cabezas · L08 Ana Cáceres Troncoso · L09 Darien Salgado
S06	24 jul	Seminario · Secc. 4	Expresión génica, splicing, ARN catalítico y código L10 Jordi Hernández · L11 Pedro Valdés · L12 Patricio Suazo Soto
S07	31 jul	Seminario · Secc. 5–6	Secuenciación masiva / Diseño, ensamblaje y anotación L13 Talía Rodríguez · L14 Joan Izquierdo · L15 Valentina Garrido
S08	7 ago	Prueba 1	Prueba de desarrollo 1 · Temas 1–6 · todo el curso
S09	14 ago	Seminario · Secc. 6–7	Anotación / Modelos estadísticos para datos ómicos L16 Joaquín Arriagada · L17 Víctor Ríos Campos · L18 Lucas Casanova
S10	21 ago	Seminario · Secc. 8	Genómica funcional (single-cell, ChIP/ATAC, metilación) L19 Bruno Covarrubias · L20 Gabriela Urra Gajardo · L21 Javiera Brito Cabezas
S11	28 ago	Seminario · Secc. 9	Proteómica y biomarcadores L22 Ana Cáceres Troncoso · L23 Darien Salgado · L24 Jordi Hernández
S12	4 sep	Seminario · Secc. 10	Integración de datos multiómicos L25 Pedro Valdés · L26 Patricio Suazo Soto · L27 Talía Rodríguez
S13	11 sep	Prueba 2 · cierre	Prueba de desarrollo 2 · Temas 7–11 + cierre del curso · todo el curso

Lecturas

Veintisiete artículos recientes (2023–2026), uno por estudiante por sesión. La numeración (L01–L27) coincide con la del calendario.

Sección 1Evolución, homología y genómica comparada

L01

Quest for Orthologs in the Era of Data Deluge and AI: Challenges and Innovations in Orthology Prediction and Data Integration

Majidian S. et al. · Journal of Molecular Evolution · 2025 PDF ↓ 1.4 MB

Síntesis del 8.º encuentro «Quest for Orthologs» que revisa el estado de la inferencia de ortología y paralogía, y cómo la IA, las estructuras proteicas predichas, las isoformas de splicing y la evolución de dominios remodelan la detección de ortólogos y la anotación funcional.

Discusión

La clase distingue ortología, paralogía y xenología mediante las pruebas de Patterson. ¿Cómo operacionalizan los métodos computacionales modernos esa lógica conceptual, y qué supuestos evolutivos podrían fallar al inferir ortología a escala genómica con herramientas basadas en IA?

L02

Human Endogenous Retroviruses: Our Genomic Fossils and Companions

Stein R.A. & DePaola R.V. · Physiological Genomics · 2023 PDF ↓ 0.6 MB

Cerca del 8% del genoma humano corresponde a retrovirus endógenos (HERV) integrados en posiciones ortólogas hace decenas de millones de años y heredados verticalmente; algunos fueron cooptados para funciones esenciales (p. ej., sincitinas en la placentación).

Discusión

Los ERV en loci ortólogos compartidos son una de las evidencias moleculares más sólidas de ascendencia común. ¿Por qué una integración independiente en el mismo sitio ortólogo es astronómicamente improbable, y qué advertencias (p. ej., PTERV1) deben tenerse en cuenta al usarlos como marcadores filogenéticos?

L03

The Last Universal Common Ancestor of Ribosome-Encoding Organisms: Portrait of LUCA

Forterre P. · Journal of Molecular Evolution · 2024 PDF ↓ 1.5 MB

Reconstruye la biología inferida de LUCA a partir de filogenómica de genes conservados, argumentando que ya realizaba el metabolismo central y la síntesis de proteínas, y muestra cómo las decisiones de modelo y datos moldean lo que inferimos sobre la raíz del árbol de la vida.

Discusión

La clase presenta el código casi universal y la maquinaria central compartida como evidencia de un único ancestro común (prueba de la UCA de Theobald, 2010). ¿Cómo dependen las reconstrucciones de LUCA de los supuestos de los modelos, y qué señal distingue la verdadera ascendencia común de la mera similitud de secuencia?

L04

Evolutionary Sparse Learning Reveals the Shared Genetic Basis of Convergent Traits

Allard J.B. et al. · Nature Communications · 2025 PDF ↓ 1.7 MB

Presenta ESL-PSC, un método filogenético de aprendizaje automático que usa contrastes entre pares de especies para identificar genes y sitios tras rasgos convergentes (fotosíntesis C4, ecolocalización), descontando la convergencia aparente debida a la ascendencia compartida.

Discusión

El contraste central de la clase es homología vs. convergencia (las «alas» de aves y murciélagos). ¿Cómo separa este método la convergencia molecular genuina de la similitud heredada, y qué riesgos de falsos positivos persisten al buscar firmas de convergencia en todo el proteoma?

Sección 2Estructura de genes, organización del genoma y secuencias repetitivas

L05

Repetitive DNA sequence detection and its role in the human genome

Liao X. et al. · Communications Biology · 2023 PDF ↓ 1.1 MB

Recorrido completo del ADN repetitivo —repeticiones en tándem, elementos transponibles y duplicaciones segmentarias—: cómo se clasifican, cómo se detectan computacionalmente y cómo impulsan la evolución del genoma y contribuyen a enfermedades humanas complejas.

Discusión

Dado que las secuencias repetitivas ocupan una gran fracción del genoma humano y se asocian con enfermedades, ¿cómo debería integrarse su detección y anotación en el diseño de un experimento de genómica funcional? ¿Qué desafíos metodológicos hay que considerar?

L06

Complete sequencing of ape genomes

Yoo D. et al. · Nature · 2025 PDF ↓ 37.2 MB

Mediante ensamblajes telómero a telómero de seis especies de grandes simios, resuelve regiones repetitivas antes inaccesibles (duplicaciones segmentarias, centrómeros, loci del MHC), aportando una nueva línea base para entender la evolución y la diversidad del genoma humano.

Discusión

Solo ciertas regiones se resolvieron con ensamblaje telómero a telómero. ¿Qué implica esto para interpretar conclusiones evolutivas extraídas de genomas de referencia previos con vacíos? ¿Cómo cambia nuestra comprensión de la evolución del genoma?

Sección 3Replicación del ADN, recombinación, elementos transponibles y retrovirus

L07

Bridge RNAs direct programmable recombination of target and donor DNA

Durrant M.G. et al. · Nature · 2024 PDF ↓ 8.6 MB

Las secuencias de inserción IS110 codifican un «ARN puente» no codificante que contacta simultáneamente el ADN donante y el diana para guiar la recombinación sitio-específica: un mecanismo enteramente nuevo de edición de ADN guiada por ARN, con potencial programable.

Discusión

Los ARN puente son un paradigma nuevo, distinto de CRISPR. Compara su lógica mecanística con la edición CRISPR-Cas9. ¿Qué implicaciones tiene para la ingeniería de genomas y la biología de los elementos transponibles?

L08

Retrotransposon Life Cycle and Its Impacts on Cellular Responses

Luqman-Fatah A. et al. · RNA Biology · 2024 PDF ↓ 2.7 MB

Recorre el ciclo de vida de los retrotransposones humanos (LINE-1, Alu, HERV) y los mecanismos del hospedero que controlan sus intermediarios de ARN y ADNc. Su reactivación durante la tumorigénesis, el desarrollo, el estrés y el envejecimiento compromete la estabilidad genómica, a la vez que estos elementos operan como motores de diversidad genética y de la inmunidad innata.

Discusión

Los retrotransposones son a la vez parásitos genómicos y elementos reguladores. ¿Qué factores del hospedero restringen su movilización en las células somáticas y cómo su desregulación conecta inestabilidad genómica, inflamación y autoinmunidad?

L09

Biochemical Mechanisms of Genetic Recombination and DNA Repair

Raina V.B. et al. · Annual Review of Biochemistry · 2025 PDF ↓ 0.9 MB

Traza los mecanismos bioquímicos de la recombinación homóloga —de la invasión de cadena a la resolución de uniones de Holliday— integrando hallazgos recientes de experimentos con moléculas únicas sobre la cinética y los intermediarios estructurales del proceso.

Discusión

¿Cómo revisan o refinan los estudios de molécula única los modelos clásicos de HR? ¿Qué implicaciones tienen estos detalles mecanísticos para entender la recombinación meiótica y la generación de diversidad genética?

Sección 4Regulación de la expresión génica, splicing, ARN catalítico y código genético

L10

The regulation and function of post-transcriptional RNA splicing

Choquet K. et al. · Nature Reviews Genetics · 2025 PDF ↓ 2.4 MB

Hasta el 40% de los intrones de mamíferos se procesan después de la terminación de la transcripción, lo que replantea el splicing postranscripcional como una capa reguladora importante del control de la expresión génica en el desarrollo, el estrés y la enfermedad.

Discusión

La visión tradicional considera el splicing como mayormente cotranscripcional. ¿Cómo cambia el splicing postranscripcional generalizado nuestra comprensión de cómo las células regulan el momento y la abundancia de isoformas proteicas específicas?

L11

Genome organization around nuclear speckles drives mRNA splicing efficiency

Bhat P. et al. · Nature · 2024 PDF ↓ 9.4 MB

La proximidad física de un gen a los nuclear speckles —condensados enriquecidos en reguladores del splicing— determina directamente la eficiencia con la que se procesa su pre-ARNm, vinculando la organización tridimensional del núcleo con la expresión génica.

Discusión

Si la posición genómica en el núcleo —y no solo la secuencia— controla la eficiencia del splicing, ¿cómo se integra este modelo espacial con las señales de splicing basadas en secuencia? ¿Qué diseños distinguirían ambos mecanismos?

L12

mRNA Regulation by RNA Modifications

Gilbert W.V. et al. · Annual Review of Biochemistry · 2023 PDF ↓ 0.7 MB

Las modificaciones químicas del ARNm (m6A, m5C, pseudouridina) constituyen un «epitranscriptoma» que influye en cada etapa de la vida del ARNm, desde la transcripción hasta la degradación, ofreciendo nuevas perspectivas sobre el control postranscripcional.

Discusión

¿Cómo se comparan las modificaciones epitranscriptómicas con la metilación del ADN como mecanismos reguladores? Al diseñar un experimento de RNA-seq o proteómica, ¿qué pasos tomarías para controlar sus efectos de confusión en la cuantificación?

Sección 5Tecnologías de secuenciación masiva — Illumina, PacBio y Nanopore

L13

Next-Generation Sequencing Technology: Current Trends and Advancements

Satam H. et al. · Biology · 2023 PDF ↓ 2.1 MB

Mapea el panorama de las plataformas NGS y sus aplicaciones en genómica, transcriptómica, epigenómica y metagenómica, cubriendo principios técnicos, desafíos de análisis y la trayectoria hacia la secuenciación de moléculas únicas y de lecturas largas.

Discusión

Para una pregunta de investigación de tu área (p. ej., regulación génica en un organismo no modelo), ¿qué plataforma NGS elegirías y cómo tendría en cuenta tu diseño experimental las limitaciones de esa plataforma?

L14

The long and short of it: benchmarking viromics using Illumina, Nanopore and PacBio sequencing technologies

Cook R. et al. · Microbial Genomics · 2024 PDF ↓ 1.6 MB

Con una comunidad mock controlada, compara Illumina, PacBio y Nanopore en recuperación de genomas, tasas de error y predicción génica, y encuentra que los ensamblajes híbridos (Illumina + Nanopore) superan a cualquier tecnología por separado.

Discusión

Ninguna tecnología es óptima en todos los contextos. Para secuenciar un genoma eucariota complejo con muchas repeticiones, ¿cómo diseñarías una estrategia híbrida y qué métricas usarías para evaluar la calidad del ensamblaje?

Sección 6Diseño experimental de alto rendimiento, ensamblaje y anotación de genomas

L15

BRAKER3: Fully automated genome annotation using RNA-seq and protein evidence

Gabriel L. et al. · Genome Research · 2024 PDF ↓ 1.7 MB

Pipeline automatizado de anotación que integra RNA-seq y bases de datos de proteínas con modelos génicos entrenados de forma iterativa, superando a enfoques previos especialmente en genomas eucariotas grandes y complejos.

Discusión

Compara las contribuciones de la evidencia de RNA-seq frente a la homología proteica al entrenar buscadores de genes. Sin datos transcriptómicos de una especie nueva, ¿cómo priorizarías tu estrategia de anotación?

L16

Building better genome annotations across the tree of life

Freedman A.H. et al. · Genome Research · 2025 PDF ↓ 1.7 MB

Comparación sistemática de 12 métodos de anotación en 21 especies: TOGA, BRAKER3 y StringTie son consistentemente los de mejor desempeño, y los datos de RNA-seq mejoran sustancialmente la anotación en organismos no modelo.

Discusión

¿En qué condiciones filogenéticas esperarías que falle la transferencia de anotación, y cómo combinarías evidencia de transferencia con evidencia de novo (RNA-seq, proteínas) para anotar un linaje sin parientes cercanos bien anotados?

Sección 7Modelos estadísticos para datos ómicos — generativos, mixtos y RNA-seq

L17

Statistical Strategies for Differential Expression Analysis of RNA Sequencing Data: Model Comparison and Benchmarking

Luo Y. · Theoretical and Natural Science · 2025 PDF ↓ 0.5 MB

Compara enfoques binomial negativo, bayesianos, de modelos lineales y no paramétricos para expresión diferencial en RNA-seq, discutiendo compromisos de sensibilidad, especificidad y robustez según tamaño muestral y diseño.

Discusión

Los tamaños muestrales pequeños son un desafío persistente. Para el diseño de un seminario, ¿cómo justificarías tu elección de modelo estadístico y qué análisis de potencia harías a priori para fijar el número mínimo de réplicas biológicas?

L18

Exploring and mitigating shortcomings in single-cell differential expression analysis with a new statistical paradigm

Wu C.-H. et al. · Genome Biology · 2025 PDF ↓ 4.7 MB

Identifica cuatro «maldiciones» de la expresión diferencial en single-cell (exceso de ceros, normalización, efectos de donante y sesgos acumulativos) y propone un marco de efectos mixtos Poisson/Binomial generalizado (GLIMES).

Discusión

GLIMES usa expresión absoluta en lugar de abundancia relativa. ¿Qué implicaciones tiene para la interpretación biológica? ¿Cómo decidirías entre un marco de cuantificación relativa y uno absoluto en tu investigación?

Sección 8Genómica funcional — single-cell, ChIP-seq, ATAC-seq y metilación

L19

The technological landscape and applications of single-cell multi-omics

Baysoy A. et al. · Nature Reviews Molecular Cell Biology · 2023 PDF ↓ 2.7 MB

Revisión de las tecnologías de célula única que perfilan simultáneamente transcriptoma, epigenoma y proteoma de una misma célula, con aplicaciones en atlas celulares, inmunología tumoral y trazado de linajes.

Discusión

El perfilado simultáneo de transcriptoma y accesibilidad de la cromatina aporta información complementaria, a veces contradictoria. Diseña un experimento multiómico de célula única para estudiar la regulación génica durante la diferenciación, especificando qué modalidades medirías y por qué.

L20

Spatially resolved genome-wide joint profiling of epigenome and transcriptome

Li H. et al. · Nature Protocols · 2025 PDF ↓ 5.6 MB

Describe spatial-ATAC-RNA-seq y spatial-CUT&Tag-RNA-seq, métodos que coperfilan expresión génica y marcas epigenómicas dentro de secciones de tejido intactas a resolución casi de célula única.

Discusión

¿Cómo cambia, al preservar la información espacial, lo que se puede concluir frente a los enfoques de célula única disociada? Propón una pregunta de tu área que requiera específicamente multiómica con resolución espacial.

L21

A DNA methylation atlas of normal human cell types

Loyfer N. et al. · Nature · 2023 PDF ↓ 14.6 MB

Secuenciación con bisulfito de genoma completo de 39 tipos celulares humanos purificados para construir un atlas del metiloma que revela enhancers específicos de tipo celular y loci regulados por Polycomb; referencia para biopsia líquida y estudios de enfermedad.

Discusión

¿Cómo usarías este atlas para inferir la composición celular de un tejido heterogéneo a partir de bisulfito en bulk? ¿Qué limitaciones tendría el enfoque?

Sección 9Proteómica y cuantificación de péptidos — espectrometría de masas y biomarcadores

L22

Comprehensive Overview of Bottom-Up Proteomics Using Mass Spectrometry

Jiang Y. et al. · ACS Measurement Science Au · 2024 PDF ↓ 10.4 MB

Revisión tipo manual del flujo completo de la proteómica bottom-up: extracción y digestión de proteínas, adquisición por LC-MS/MS e interpretación bioinformática; base para quien diseñe un experimento de proteómica.

Discusión

La proteómica bottom-up pierde información sobre proteoformas intactas por la digestión. ¿En qué contextos sería más consecuente esta pérdida, y cómo complementarías el enfoque para abordarla?

L23

Data-Independent Acquisition: A Milestone and Prospect in Clinical Mass Spectrometry–Based Proteomics

Fröhlich K. et al. · Molecular & Cellular Proteomics · 2024 PDF ↓ 1.7 MB

Explica por qué la adquisición independiente de datos (DIA) transformó la proteómica al permitir medir de forma no sesgada y reproducible todos los péptidos detectables, y discute software, aplicaciones clínicas y desafíos pendientes para el diagnóstico de rutina.

Discusión

Los autores recomiendan usar varias herramientas DIA en paralelo porque cada una tiene sesgos. ¿Qué implica para la reproducibilidad clínica? ¿Cómo diseñarías un estudio de validación para un panel de biomarcadores descubierto por DIA-MS?

L24

Recent developments in mass-spectrometry-based targeted proteomics of clinical cancer biomarkers

Wenk D. et al. · Clinical Proteomics · 2024 PDF ↓ 1.6 MB

Estado de la proteómica dirigida por LC-MS/MS para medir biomarcadores de cáncer en muestras clínicas, contrastándola con inmunoensayos y discutiendo el camino del descubrimiento a la validación clínica y sus desafíos.

Discusión

Dada la brecha entre descubrimiento y validación clínica, propón un marco de validación por etapas para un biomarcador de cáncer recién descubierto, especificando los criterios estadísticos y técnicos de cada etapa.

Sección 10Integración de datos multiómicos

L25

Methods and applications for single-cell and spatial multi-omics

Vandereyken K. et al. · Nature Reviews Genetics · 2023 PDF ↓ 3.6 MB

Panorama experimental y computacional de la multiómica de célula única y espacial: cómo la medición conjunta de transcriptoma, epigenoma, proteoma y metaboloma transforma la comprensión del desarrollo, la enfermedad y la identidad celular.

Discusión

La multiómica facilita la inferencia causal al vincular capas moleculares. ¿Qué supuestos computacionales y estadísticos deben cumplirse para que esas inferencias sean válidas, y cómo los comprobarías en un conjunto de datos concreto?

L26

Multi-omics data integration using ratio-based quantitative profiling with Quartet reference materials

Zheng Y. et al. · Nature Biotechnology · 2023 PDF ↓ 19.6 MB

Con un cuarteto familiar como sistema de referencia con verdad de base, muestra que la cuantificación absoluta —no el perfilado basado en razones— es la causa raíz de la irreproducibilidad en la integración multiómica, y propone una solución práctica.

Discusión

Si el mayor obstáculo es la falta de materiales de referencia comunes y no los algoritmos, ¿cómo diseñarías un estudio multiómico para maximizar la reproducibilidad entre lotes y plataformas? ¿Qué referencias y métricas de control adoptarías?

L27

Deep learning-based approaches for multi-omics data integration and analysis

Ballard J.L. et al. · BioData Mining · 2024 PDF ↓ 1.9 MB

Clasifica arquitecturas de deep learning para integración multiómica (feedforward, redes convolucionales de grafos, autoencoders, modelos generativos) y compara su manejo de datos faltantes, fusión de modalidades e interpretabilidad biológica.

Discusión

El deep learning suele mejorar la predicción a costa de la interpretabilidad. En un estudio clínico que busca predicción y descubrimiento de mecanismos, ¿cómo equilibrarías la complejidad del modelo con la explicabilidad biológica?

Bibliografía

Básica

Holmes, S. y Huber, W. (2018). Modern Statistics for Modern Biology. Cambridge University Press.
Krebs, J.E., Goldstein, E.S. y Kilpatrick, S.T. (2017). Lewin’s Genes XII. Jones & Bartlett.

Genes, Genomas y Proteomas

Descripción

Temas del curso

Evaluación

Resultados de aprendizaje

Calendario y seminarios

Lecturas

Bibliografía

Básica

Recomendada