Con base en estos conceptos, un pangenoma puede dividirse en un “genoma central” (también conocido como “core genome”) el cual representa al conjunto de genes que están presentes en todos los individuos del clado, un “genoma periférico” (o “shell pangenome”) que contiene los genes presentes en dos o más organismos pero que no pertenecen al genoma central y, un “genoma diferencial” ( o “cloud pangenome”) referente al conjunto de genes únicos los cuales están presentes sólo en un organismo del clado[2][3][5].
Actualmente no existe una definición de consenso para las diferentes partes del pangenoma.
Sin embargo, el término ‘dispensable’ ha sido cuestionado por otros autores, al menos en el área de genómica de plantas, ya que se considera que los genes accesorios juegan “un papel importante en la evolución genómica así como en la compleja interacción genoma-medio ambiente”[4].
Por otro lado, la clasificación de ‘pangenoma abierto’ se utiliza para describir que el tamaño del pangenoma de una especie en particular no puede ser calculado teóricamente debido a que cuanto más se añaden genomas nuevos al pangenoma, el número de genes nuevos incrementa en gran medida.
Originalmente, el término pangenoma fue construido para describir la diversidad genética de bacterias y arqueas.
Sin embargo, actualmente este término también se utiliza para describir el contenido de genes diferenciales en genomas eucariotas.
El libro “The Pangenome - Diversity, Dynamics and Evolution of Genomes”[9] publicado en 2020 por Hervé Tettelin y Duccio Medini, incluye una descripción completa del concepto de pangenoma, su historia y principales avances en el área, así como importantes discusiones que han surgido en el área de la pangenómica en los últimos años.
El término ‘pangenoma’ fue definido con su significado actual por Tettelin en 2005[1]; ‘pan’ se deriva del griego y significa ‘entero’ o ‘todo’, mientras que el ‘genoma’ es un término comúnmente utilizado para describir el material genético completo de un organismo.
Las familias de genes en esta categoría a menudo están relacionadas con la adaptación ecológica.
Sin embargo, este enfoque era limitado al no capturar variantes estructurales complejas ni las relaciones entre diferentes secuencias genómicas.
Estas estructuras permiten integrar múltiples genomas en un solo modelo gráfico, donde los nodos representan segmentos de secuencia y los bordes indican las conexiones entre ellos.
El pangenoma comprende la cantidad total de los genes descubiertos en los genomas secuenciados de una determinada especie microbiana y esta cantidad puede ir cambiando cuando se secuencias nuevos genomas y se incorporan al pangenoma.
El supergenoma puede ser pensado como el tamaño real del pangenoma si todos los genomas de una especie son secuenciados[22].
Este se define como todos los genes accesibles para ser adquiridos por una determinada especie.
Pangenomas abiertos han sido observados en aislados ambientales tales como Alcaligenes sp.
Los organismos eucarióticos como los hongos, animales y plantas también han mostrado evidencias de tener pangenomas.
Los genes accesorios restantes están involucrados principalmente en patogénesis y resistencia antimicrobiana[38].
Pangenoma humano: Es un modelo genómico que esta diseñado para representar la diversidad genética completa de la población humana, incluyendo las diferentes variantes genéticas presentes en individuos o poblaciones.
Esto podría ayudar a entender mejor las bases genéticas de muchas enfermedades.
Tampoco están incluidas en este variantes genéticas específicas de ciertas poblaciones o individuos.
El T2T-CHM13 incluye las secuencias completas de telómeros y centrómeros, a diferencia del GRCh38.
Para complementar esto se han desarrollado herramientas como el algoritmo ASLAN (Algorithm for Sequence Location Approximation using Nuclear Families)[43], que sirve para validar las regiones ensambladas del T2T-CHM13, identificar discrepancias (ASLAN ha encontrado regiones que no están completamente representadas en T2T), y fundamentalmente aumentar la diversidad genética mapeando diferentes variantes genéticas.
Sin embargo, varios estudios han calculado el pangenoma de algunos linajes virales.
En 2015, un grupo revisó diferentes tipos de análisis y herramientas accesibles para los investigadores[55].
Los dos softwares más citados para el análisis pangenómico para finales del 2014[55] fueron Panseq[56] y PGAP (Pan-genomes analysis pipeline)[57].
Otras opciones incluyen BPGA (A Pan-Genome Analysis Pipeline for prolaryotic genomes)[58], GET_HOMOLOGUES[59], Roary[60] y PanDelos[61].
En 2020, una comparación de herramientas para extraer contenido pangenómico basado en genes (como GET_HOMOLOGUES, PanDelos, Roary, y otros) fue publicada[69].