La maladie d'Alzheimer (MA) manque de biomarqueurs protéiques qui reflètent ses multiples physiopathologies sous-jacentes, ce qui entrave les progrès du diagnostic et du traitement. Ici, nous utilisons une protéomique complète pour identifier les biomarqueurs du liquide céphalorachidien (LCR) qui représentent un large éventail de physiopathologie de la MA. La spectrométrie de masse multiplex a identifié respectivement environ 3 500 et environ 12 000 protéines dans le LCR AD et le cerveau. L'analyse du réseau du protéome cérébral a résolu 44 modules de biodiversité, dont 15 chevauchaient le protéome du liquide céphalo-rachidien. Les marqueurs CSF AD dans ces modules qui se chevauchent sont regroupés en cinq groupes de protéines, représentant différents processus physiopathologiques. Les synapses et les métabolites dans le cerveau atteint de MA diminuent, mais le LCR augmente, tandis que la myélinisation riche en glies et les groupes immunitaires dans le cerveau et le LCR augmentent. La cohérence et la spécificité des changements de panel ont été confirmées dans plus de 500 échantillons supplémentaires de LCR. Ces groupes ont également identifié des sous-groupes biologiques dans la MA asymptomatique. Dans l’ensemble, ces résultats constituent une étape prometteuse vers des outils de biomarqueurs basés sur le Web pour des applications cliniques dans la MA.
La maladie d'Alzheimer (MA) est la cause la plus fréquente de démence neurodégénérative dans le monde et se caractérise par un large éventail de dysfonctionnements du système biologique, notamment la transmission synaptique, l'immunité à médiation gliale et le métabolisme mitochondrial (1-3). Cependant, ses biomarqueurs protéiques établis se concentrent toujours sur la détection des protéines amyloïde et tau et ne peuvent donc pas refléter cette physiopathologie diversifiée. Ces biomarqueurs protéiques « centraux » qui sont mesurés de la manière la plus fiable dans le liquide céphalo-rachidien (LCR) comprennent (i) le peptide bêta-amyloïde 1-42 (Aβ1-42), qui reflète la formation de plaques amyloïdes corticales ; (ii) tau total, signe de dégénérescence des axones ; (iii) phospho-tau (p-tau), un représentant de l'hyperphosphorylation pathologique de la tau (4-7). Bien que ces biomarqueurs du liquide céphalo-rachidien aient grandement facilité notre détection des maladies protéiques « marquées » de la MA (4-7), ils ne représentent qu’une petite partie de la biologie complexe derrière la maladie.
Le manque de diversité physiopathologique des biomarqueurs de la MA a conduit à de nombreux défis, notamment (i) l'incapacité d'identifier et de quantifier l'hétérogénéité biologique des patients atteints de MA, (ii) une mesure insuffisante de la gravité et de la progression de la maladie, en particulier au stade préclinique, et (ii) une mesure insuffisante de la gravité et de la progression de la maladie, en particulier au stade préclinique. iii) le développement de médicaments thérapeutiques qui n’ont pas réussi à résoudre complètement tous les aspects de la détérioration neurologique. Notre dépendance à l’égard d’une pathologie historique pour décrire la MA due à des maladies apparentées ne fait qu’exacerber ces problèmes. De plus en plus de preuves montrent que la plupart des personnes âgées atteintes de démence présentent plus d'une caractéristique pathologique de déclin cognitif (8). Au moins 90 % des personnes atteintes d'une pathologie de la maladie d'Alzheimer souffrent également d'une maladie vasculaire, d'inclusions de TDP-43 ou d'autres maladies dégénératives (9). Ces proportions élevées de chevauchement pathologique ont perturbé notre cadre diagnostique actuel de la démence, et une définition physiopathologique plus complète de la maladie est nécessaire.
Compte tenu du besoin urgent d’une variété de biomarqueurs de la maladie d’Alzheimer, le domaine adopte de plus en plus la méthode « omics » basée sur le système global de découverte des biomarqueurs. L’Alliance Accelerated Pharmaceutical Partnership (AMP)-AD a été lancée en 2014 et est à l’avant-garde du programme. Cet effort multidisciplinaire des National Institutes of Health, du monde universitaire et de l'industrie vise à utiliser des stratégies basées sur le système pour mieux définir la physiopathologie de la MA et développer des analyses diagnostiques et des stratégies de traitement de la biodiversité (10). Dans le cadre de ce projet, la protéomique des réseaux est devenue un outil prometteur pour l’avancement des biomarqueurs systémiques dans la MA. Cette approche impartiale, basée sur les données, organise des ensembles de données protéomiques complexes en groupes ou « modules » de protéines co-exprimées qui sont associées à des types de cellules, organites et fonctions biologiques spécifiques (11-13). Près de 12 études protéomiques de réseau riches en informations ont été menées sur le cerveau atteint de MA (13-23). Dans l’ensemble, ces analyses indiquent que le protéome du réseau cérébral AD maintient une organisation modulaire hautement conservée en cohortes indépendantes et en plusieurs régions corticales. En outre, certains de ces modules montrent des changements reproductibles dans l’abondance liée à la MA dans les ensembles de données, reflétant la physiopathologie de plusieurs maladies. Collectivement, ces résultats démontrent un point d’ancrage prometteur pour la découverte du protéome du réseau cérébral en tant que biomarqueur systémique dans la MA.
Afin de transformer le protéome du réseau cérébral AD en biomarqueurs systémiques cliniquement utiles, nous avons combiné le réseau dérivé du cerveau avec l'analyse protéomique du CSF AD. Cette approche intégrée a conduit à l’identification de cinq ensembles prometteurs de biomarqueurs du LCR associés à un large éventail de physiopathologies cérébrales, notamment les synapses, les vaisseaux sanguins, la myélinisation, l’inflammation et le dysfonctionnement des voies métaboliques. Nous avons validé avec succès ces panels de biomarqueurs grâce à de multiples analyses de réplication, incluant plus de 500 échantillons de LCR provenant de diverses maladies neurodégénératives. Ces analyses de validation comprennent l'examen de groupes cibles dans le LCR de patients atteints de MA asymptomatique (AsymAD) ou la mise en évidence d'une accumulation anormale d'amyloïde dans un environnement cognitif normal. Ces analyses mettent en évidence l’hétérogénéité biologique significative de la population AsymAD et identifient des marqueurs de panel susceptibles de sous-typer les individus dès les premiers stades de la maladie. Dans l’ensemble, ces résultats représentent une étape clé dans le développement d’outils de biomarqueurs protéiques basés sur plusieurs systèmes capables de résoudre avec succès de nombreux défis cliniques auxquels est confrontée la MA.
L'objectif principal de cette étude est d'identifier de nouveaux biomarqueurs du liquide céphalo-rachidien qui reflètent diverses physiopathologies cérébrales qui conduisent à la MA. La figure S1 présente notre méthodologie de recherche, qui comprend (i) une analyse complète basée sur les résultats préliminaires de l'AD CSF et du protéome cérébral en réseau pour identifier plusieurs biomarqueurs de la maladie du LCR liée au cerveau, et (ii) une réplication ultérieure. Ces biomarqueurs se trouvent dans plusieurs biomarqueurs cérébro-spinaux indépendants. cohortes fluides. La recherche axée sur la découverte a débuté par l'analyse de l'expression différentielle du LCR chez 20 individus cognitivement normaux et 20 patients atteints de MA au Centre de recherche sur la maladie d'Alzheimer Emory Goizueta (ADRC). Le diagnostic de MA est défini comme un déficit cognitif important en présence d'un faible taux d'Aβ1-42 et de taux élevés de tau total et de p-tau dans le liquide céphalorachidien [Mean Montreal Cognitive Assessment (MoCA), 13,8 ± 7,0] [ELISA (ELISA )]] (tableau S1A). Le contrôle (MoCA moyen, 26,7 ± 2,2) présentait des niveaux normaux de biomarqueurs du LCR.
Le LCR humain est caractérisé par une gamme dynamique d'abondance de protéines, dans laquelle l'albumine et d'autres protéines extrêmement abondantes peuvent empêcher la détection de protéines d'intérêt (24). Pour augmenter la profondeur de la découverte des protéines, nous avons retiré les 14 premières protéines très abondantes de chaque échantillon de LCR avant l'analyse par spectrométrie de masse (MS) (24). Un total de 39 805 peptides ont été identifiés par MS, qui ont été cartographiés sur 3 691 protéomes dans 40 échantillons. La quantification des protéines est effectuée par marquage de plusieurs étiquettes de masse en tandem (TMT) (18, 25). Afin de résoudre les données manquantes, nous avons inclus uniquement les protéines quantifiées dans au moins 50 % des échantillons lors de l'analyse ultérieure, quantifiant ainsi finalement 2 875 protéomes. En raison de la différence significative dans les niveaux d’abondance totale de protéines, un échantillon témoin a été statistiquement considéré comme une valeur aberrante (13) et n’a pas été inclus dans l’analyse ultérieure. Les valeurs d'abondance des 39 échantillons restants ont été ajustées en fonction de l'âge, du sexe et de la covariance des lots (13-15, 17, 18, 20, 26).
En utilisant une analyse statistique du test t pour évaluer l'expression différentielle sur l'ensemble de données de régression, cette analyse a identifié des protéines dont les niveaux d'abondance étaient significativement modifiés (P <0,05) entre les cas témoins et les cas de MA (Tableau S2A). Comme le montre la figure 1A, l'abondance d'un total de 225 protéines dans la MA a été considérablement réduite et l'abondance de 303 protéines a été considérablement augmentée. Ces protéines différentiellement exprimées comprennent plusieurs marqueurs de MA du liquide céphalo-rachidien précédemment identifiés, tels que la protéine tau associée aux microtubules (MAPT ; P = 3,52 × 10−8), le neurofilament (NEFL ; P = 6,56 × 10−3), la protéine 43 liée à la croissance. (GAP43 ; P = 1,46 × 10−5), protéine de liaison aux acides gras 3 (FABP3 ; P = 2,00 × 10−5), chitinase 3 like 1 (CHI3L1 ; P = 4,44 × 10−6), granululine neuronale (NRGN ; P = 3,43 × 10−4) et facteur de croissance nerveuse VGF (VGF ; P = 4,83 × 10−3) (4-6). Cependant, nous avons également identifié d'autres cibles très importantes, telles que l'inhibiteur de dissociation du GDP 1 (GDI1; P = 1, 54 × 10-10) et la liaison modulaire du calcium 1 liée à SPARC (SMOC1; P = 6, 93 × 10-9). L'analyse Gene Ontology (GO) de 225 protéines significativement réduites a révélé des liens étroits avec des processus liés aux fluides corporels tels que le métabolisme des stéroïdes, la coagulation sanguine et l'activité hormonale (Figure 1B et Tableau S2B). En revanche, l’augmentation significative de la protéine 303 est étroitement liée à la structure cellulaire et au métabolisme énergétique.
(A) Le tracé du volcan montre le changement de pli log2 (axe des x) par rapport à la valeur P statistique -log10 (axe des y) obtenue par le test t, qui est utilisé pour détecter l'expression différentielle entre le contrôle (CT) et Cas AD du protéome du LCR De toutes les protéines. Les protéines dont les niveaux sont significativement réduits (P <0,05) dans la MA sont indiquées en bleu, tandis que les protéines dont les niveaux sont significativement augmentés dans la maladie sont indiquées en rouge. La protéine sélectionnée est étiquetée. (B) Les principaux termes GO liés aux protéines sont considérablement réduits (bleu) et augmentés (rouge) dans AD. Affiche les trois termes GO avec les scores z les plus élevés dans les domaines des processus biologiques, des fonctions moléculaires et des composants cellulaires. (C) MS a mesuré le niveau de MAPT dans l’échantillon de LCR (à gauche) et sa corrélation avec le niveau de tau de l’échantillon ELISA (à droite). Le coefficient de corrélation de Pearson avec la valeur P correspondante s'affiche. En raison du manque de données ELISA pour un cas de MA, ces chiffres incluent les valeurs de 38 des 39 cas analysés. (D) Analyse groupée supervisée (P <0,0001, Benjamini-Hochberg (BH) ajusté P <0,01) sur le contrôle et AD CSF ont trouvé des échantillons utilisant les 65 protéines les plus modifiées de manière significative dans l'ensemble de données. Standardiser, normaliser.
Le niveau protéomique de MAPT est étroitement lié au niveau de tau ELISA mesuré indépendamment (r = 0,78, P = 7,8 × 10-9 ; Figure 1C), ce qui conforte la validité de notre mesure MS. Après digestion par la trypsine au niveau de la protéine précurseur amyloïde (APP), les peptides spécifiques de l'isoforme cartographiés à l'extrémité C-terminale de Aβ1-40 et Aβ1-42 ne peuvent pas être ionisés efficacement (27, 28). Par conséquent, les peptides APP que nous avons identifiés n’ont rien à voir avec les niveaux ELISA Aβ1-42. Afin d'évaluer l'expression différentielle de chaque cas, nous avons utilisé des protéines exprimées différentiellement avec P <0,0001 [taux de fausse découverte (FDR) corrigé P <0,01] pour effectuer une analyse groupée supervisée des échantillons (tableau S2A). Comme le montre la figure 1D, ces 65 protéines hautement significatives peuvent regrouper correctement les échantillons en fonction de l'état de la maladie, à l'exception d'un cas de MA présentant des caractéristiques similaires à celles d'un témoin. Parmi ces 65 protéines, 63 ont augmenté dans la MA, tandis que seulement deux (CD74 et ISLR) ont diminué. Au total, ces analyses du liquide céphalorachidien ont identifié des centaines de protéines dans la MA qui pourraient servir de biomarqueurs de la maladie.
Nous avons ensuite effectué une analyse de réseau indépendante du protéome cérébral de la MA. La cohorte cérébrale de cette découverte comprenait le cortex préfrontal dorsolatéral (DLPFC) provenant de cas témoins (n = 10), de maladie de Parkinson (PD ; n = 10), de cas mixtes AD/PD (n = 10) et AD (n = 10). ) Échantillon. Emery Goizueta ADRC. Les données démographiques de ces 40 cas ont été décrites précédemment (25) et sont résumées dans le tableau S1B. Nous avons utilisé la TMT-MS pour analyser ces 40 tissus cérébraux et la cohorte de réplication de 27 cas. Au total, ces deux ensembles de données cérébrales ont produit 227 121 peptides uniques, qui ont été cartographiés sur 12 943 protéomes (25). Seules les protéines quantifiées dans au moins 50 % des cas ont été incluses dans les investigations ultérieures. L’ensemble final de données de découverte contient 8 817 protéines quantifiées. Ajustez les niveaux d’abondance de protéines en fonction de l’âge, du sexe et de l’intervalle post-mortem (PMI). L'analyse de l'expression différentielle de l'ensemble de données après régression a montré que les niveaux de protéines > 2 000 étaient significativement modifiés [P < 0,05, analyse de variance (ANOVA)] dans deux cohortes de maladies ou plus. Ensuite, nous avons effectué une analyse groupée supervisée basée sur les protéines exprimées différentiellement et P <0,0001 dans les comparaisons AD/contrôle et/ou AD/PD (Figure S2, A et B, Tableau S2C). Ces 165 protéines hautement altérées décrivent clairement les cas de pathologie de la MA à partir des échantillons témoins et PD, confirmant les forts changements spécifiques à la MA dans l'ensemble du protéome.
Nous avons ensuite utilisé un algorithme appelé Weighted Gene Co-expression Network Analysis (WGCNA) pour effectuer une analyse de réseau sur le protéome cérébral découvert, qui organise l'ensemble de données en modules protéiques présentant des modèles d'expression similaires (11-13). L'analyse a identifié 44 modules (M) de protéines co-exprimées, triées et numérotées de la plus grande (M1, n = 1821 protéines) à la plus petite (M44, n = 34 protéines) (Figure 2A et Tableau S2D). Comme mentionné ci-dessus (13) Calculez le profil d'expression représentatif ou la protéine caractéristique de chaque module et corrélez-le avec l'état de la maladie et la pathologie de la MA, c'est-à-dire établissez l'alliance du registre de la maladie d'Alzheimer (CERAD) et du score de Braak (Figure 2B). Au total, 17 modules étaient significativement liés à la neuropathologie de la MA (P <0,05). Beaucoup de ces modules liés à la maladie sont également riches en marqueurs spécifiques au type de cellule (Figure 2B). Comme mentionné ci-dessus (13), l'enrichissement du type cellulaire est déterminé en analysant le chevauchement des modules et la liste de référence des gènes spécifiques au type cellulaire. Ces gènes sont dérivés de données publiées sur des neurones de souris isolés, des cellules endothéliales et gliales. Expérience de séquençage d'ARN (RNA-seq) (29).
(A) Découvrez le WGCNA du protéome cérébral. (B) Analyse de corrélation intermédiaire bi-poids (BiCor) de la protéine de signature modulaire (le premier composant majeur de l'expression de la protéine modulaire) avec les caractéristiques neuropathologiques de la MA (en haut), y compris les scores CERAD (plaque Aβ) et Braak (enchevêtrements de tau). Les intensités des corrélations positives (rouges) et négatives (bleues) sont indiquées par une carte thermique bicolore, et les astérisques indiquent une signification statistique (P <0,05). Utilisez le test exact hypergéométrique de Fisher (FET) (en bas) pour évaluer l’association de type cellulaire de chaque module protéique. L’intensité de l’ombrage rouge indique le degré d’enrichissement du type cellulaire et l’astérisque indique une signification statistique (P <0,05). Utilisez la méthode BH pour corriger la valeur P dérivée du FET. (C) Analyse GO des protéines modulaires. Les processus biologiques les plus étroitement liés sont présentés pour chaque module ou groupe de modules associé. oligo, oligodendrocytes.
Un ensemble de cinq modules riches en astrocytes et en microglies étroitement liés (M30, M29, M18, M24 et M5) ont montré une forte corrélation positive avec la neuropathologie de la MA (Figure 2B). L'analyse ontologique relie ces modules gliaux à la croissance cellulaire, à la prolifération et à l'immunité (Figure 2C et Tableau S2E). Deux modules gliaux supplémentaires, M8 et M22, sont également fortement régulés positivement en cas de maladie. M8 est étroitement lié à la voie des récepteurs Toll-like, une cascade de signalisation qui joue un rôle clé dans la réponse immunitaire innée (30). Dans le même temps, M22 est étroitement lié à la modification post-traductionnelle. M2, riche en oligodendrocytes, présente une forte corrélation positive avec la pathologie de la MA et un lien ontologique avec la synthèse des nucléosides et la réplication de l'ADN, indiquant une prolifération cellulaire accrue dans les maladies. Dans l’ensemble, ces résultats soutiennent l’élévation des modules gliaux que nous avons précédemment observés dans le protéome du réseau AD (13, 17). Il est actuellement constaté que de nombreux modules gliaux liés à la MA dans le réseau présentent des niveaux d'expression plus faibles dans les cas témoins et dans la maladie de Parkinson, soulignant leur spécificité de maladie élevée dans la MA (Figure S2C).
Seuls quatre modules de notre protéome de réseau (M1, M3, M10 et M32) sont fortement corrélés négativement à la pathologie de la MA (P <0,05) (Figure 2, B et C). M1 et M3 sont riches en marqueurs neuronaux. M1 est fortement lié aux signaux synaptiques, tandis que M3 est étroitement lié à la fonction mitochondriale. Il n'y a aucune preuve d'enrichissement en types cellulaires pour M10 et M32. M32 reflète le lien entre M3 et le métabolisme cellulaire, tandis que M10 est fortement lié à la croissance cellulaire et à la fonction des microtubules. Par rapport à la MA, les quatre modules sont augmentés en termes de contrôle et de PD, ce qui leur confère des modifications de la MA spécifiques à la maladie (Figure S2C). Dans l’ensemble, ces résultats soutiennent la diminution de l’abondance de modules riches en neurones que nous avons précédemment observée dans la MA (13, 17). En résumé, l’analyse du réseau du protéome cérébral que nous avons découverte a produit des modules spécifiquement modifiés par la MA, cohérents avec nos découvertes précédentes.
La MA est caractérisée par un stade asymptomatique précoce (AsymAD), au cours duquel les individus présentent une accumulation d'amyloïde sans déclin cognitif clinique (5, 31). Cette étape asymptomatique représente une fenêtre critique pour une détection et une intervention précoces. Nous avons déjà démontré une forte préservation modulaire du protéome du réseau cérébral AsymAD et AD dans des ensembles de données indépendants (13, 17). Afin de garantir que le réseau cérébral que nous avons actuellement découvert est cohérent avec ces découvertes précédentes, nous avons analysé la préservation de 44 modules dans l'ensemble de données répliquées de 27 organisations DLPFC. Ces organisations incluent les cas de contrôle (n = 10), AsymAD (n = 8) et AD (n = 9). Des échantillons de contrôle et de MA ont été inclus dans l'analyse de notre cohorte cérébrale de découverte (Tableau S1B), tandis que les cas AsymAD n'étaient uniques que dans la cohorte de réplication. Ces cas AsymAD provenaient également de la banque de cerveaux Emory Goizueta ADRC. Bien que la cognition était normale au moment du décès, les taux d'amyloïde étaient anormalement élevés (CERAD moyen, 2,8 ± 0,5) (Tableau S1B).
L'analyse TMT-MS de ces 27 tissus cérébraux a abouti à la quantification de 11 244 protéomes. Ce décompte final inclut uniquement les protéines quantifiées dans au moins 50 % des échantillons. Cet ensemble de données répliquées contient 8 638 (98,0 %) des 8 817 protéines détectées dans notre analyse cérébrale de découverte et contient près de 3 000 protéines significativement modifiées entre les cohortes de contrôle et celles de la maladie d'Alzheimer (P <0,05, après le test t apparié de Tukey pour l'analyse de la variance) ( tableau S2F). Parmi ces protéines différentiellement exprimées, 910 ont également montré des changements de niveau significatifs entre les cas de contrôle de la MA et ceux du protéome cérébral (P <0,05, après test t apparié ANOVA Tukey). Il convient de noter que ces 910 marqueurs sont très cohérents dans le sens du changement entre protéomes (r = 0,94, P <1,0 × 10-200) (Figure S3A). Parmi les protéines augmentées, les protéines présentant les changements les plus cohérents entre les ensembles de données sont principalement membres des modules M5 et M18 riches en glies (MDK, COL25A1, MAPT, NTN1, SMOC1 et GFAP). Parmi les protéines réduites, celles présentant les changements les plus cohérents étaient presque exclusivement des membres du module M1 (NPTX2, VGF et RPH3A) associés à la synapse. Nous avons en outre vérifié les modifications liées à la MA de la midkine (MDK), du CD44, de la protéine 1 sécrétée liée aux frizzled (SFRP1) et du VGF par Western blot (Figure S3B). L'analyse de la préservation des modules a montré qu'environ 80 % des modules protéiques (34/44) du protéome cérébral étaient conservés de manière significative dans l'ensemble de données de réplication (score z > 1,96, P corrigé par FDR < 0,05) (Figure S3C). Quatorze de ces modules étaient spécialement réservés entre les deux protéomes (z-score> 10, FDR corrigé P <1,0 × 10−23). Dans l’ensemble, la découverte et la réplication du degré élevé de cohérence de l’expression différentielle et de la composition modulaire entre le protéome cérébral mettent en évidence la reproductibilité des modifications des protéines du cortex frontal AD. En outre, cela a également confirmé qu’AsymAD et des maladies plus avancées ont une structure de réseau cérébral très similaire.
Une analyse plus détaillée de l'expression différentielle dans l'ensemble de données de réplication cérébrale met en évidence le degré significatif de modifications de la protéine AsymAD, y compris un total de 151 protéines significativement modifiées entre AsymAD et le contrôle (P <0,05) (Figure S3D). Conformément à la charge amyloïde, l’APP dans le cerveau d’AsymAD et d’AD a augmenté de manière significative. MAPT ne change de manière significative que dans la MA, ce qui est cohérent avec des niveaux accrus d'enchevêtrements et sa corrélation connue avec le déclin cognitif (5, 7). Les modules riches en cellules gliales (M5 et M18) se reflètent fortement dans l'augmentation des protéines dans AsymAD, tandis que le module M1 lié aux neurones est le plus représentatif de la diminution des protéines dans AsymAD. Beaucoup de ces marqueurs AsymAD montrent des changements plus importants dans les maladies symptomatiques. Parmi ces marqueurs se trouve SMOC1, une protéine gliale appartenant à M18, associée aux tumeurs cérébrales et au développement des yeux et des membres (32). MDK est un facteur de croissance liant l'héparine lié à la croissance cellulaire et à l'angiogenèse (33), un autre membre de M18. Par rapport au groupe témoin, AsymAD a augmenté de manière significative, suivie d’une augmentation plus importante de la MA. En revanche, la protéine synaptique neuropentraxine 2 (NPTX2) était significativement réduite dans le cerveau AsymAD. NPTX2 était auparavant associé à la neurodégénérescence et joue un rôle reconnu dans la médiation des synapses excitatrices (34). Dans l’ensemble, ces résultats révèlent une variété de changements protéiques précliniques dans la MA qui semblent progresser avec la gravité de la maladie.
Étant donné que nous avons atteint une profondeur significative de couverture protéique lors de la découverte du protéome cérébral, nous essayons de mieux comprendre son chevauchement avec le transcriptome AD au niveau du réseau. Par conséquent, nous avons comparé le protéome cérébral que nous avons découvert avec le module que nous avions généré précédemment à partir de la mesure par micropuce de 18 204 gènes dans les tissus AD (n = 308) et témoins (n = 157) DLPFC (13). se chevauchant. Au total, nous avons identifié 20 modules d'ARN différents, dont beaucoup ont démontré l'enrichissement de types de cellules spécifiques, notamment les neurones, les oligodendrocytes, les astrocytes et les microglies (Figure 3A). Les multiples modifications de ces modules dans AD sont illustrées à la figure 3B. Conformément à notre précédente analyse de chevauchement protéine-ARN utilisant le protéome MS non marqué plus profond (environ 3 000 protéines) (13), la plupart des 44 modules du réseau de protéome cérébral que nous avons trouvé se trouvent dans le réseau du transcriptome. Après notre découverte et la réplication des 34 modules protéiques hautement retenus dans le protéome cérébral, seuls 14 (~ 40 %) ont réussi le test exact de Fisher (FET) et se sont avérés avoir un chevauchement statistiquement significatif avec le transcriptome (Figure 3A). Compatible avec la réparation des dommages à l'ADN (P-M25 et P-M19), la traduction des protéines (P-M7 et P-M20), la liaison/épissage de l'ARN (P-M16 et P-M21) et le ciblage des protéines (P-M13 et P- M23) ne chevauche pas les modules du transcriptome. Par conséquent, bien qu’un ensemble de données plus approfondies sur le protéome soit utilisé dans l’analyse de chevauchement actuelle (13), la majeure partie du protéome du réseau AD n’est pas mappée sur le réseau du transcriptome.
(A) Le FET hypergéométrique démontre l'enrichissement de marqueurs spécifiques au type de cellule dans le module ARN du transcriptome AD (en haut) et le degré de chevauchement entre les modules ARN (axe des x) et protéines (axe des y) du cerveau AD (bas) . L'intensité de l'ombrage rouge indique le degré d'enrichissement des types de cellules dans le panneau supérieur et l'intensité du chevauchement des modules dans le panneau inférieur. Les astérisques indiquent une signification statistique (P <0,05). (B) Le degré de corrélation entre les gènes caractéristiques de chaque module du transcriptome et le statut AD. Les modules de gauche sont les plus corrélés négativement avec AD (bleu), et ceux de droite sont les plus positivement corrélés avec AD (rouge). La valeur P corrigée par BH transformée en log indique le degré de signification statistique de chaque corrélation. (C) Modules se chevauchant importants avec enrichissement de type cellulaire partagé. (D) Analyse de corrélation du changement de facteur log2 de la protéine marquée (axe des x) et de l’ARN (axe des y) dans le module qui se chevauche. Le coefficient de corrélation de Pearson avec la valeur P correspondante s'affiche. Micro, microglie ; corps célestes, astrocytes. CT, contrôle.
La plupart des modules de protéines et d’ARN qui se chevauchent partagent des profils d’enrichissement de type cellulaire similaires et des directions de changement AD cohérentes (Figure 3, B et C). En d’autres termes, le module M1 du protéome cérébral lié à la synapse (PM1) est cartographié sur trois modules d’ARN homologues riches en neurones (R-M1, R-M9 et R-M16), qui sont dans la MA. un niveau réduit. De même, les modules protéiques M5 et M18 riches en glies se chevauchent avec des modules d'ARN riches en astrocytes et en marqueurs microgliaux (R-M3, R-M7 et R-M10) et sont fortement impliqués dans l'augmentation des maladies. Ces fonctionnalités modulaires partagées entre les deux ensembles de données soutiennent en outre l’enrichissement des types cellulaires et les changements liés à la maladie que nous avons observés dans le protéome cérébral. Cependant, nous avons observé de nombreuses différences significatives entre les niveaux d’ARN et de protéines de marqueurs individuels dans ces modules partagés. L'analyse de corrélation de l'expression différentielle de la protéomique et de la transcriptomique des molécules au sein de ces modules qui se chevauchent (Figure 3D) met en évidence cette incohérence. Par exemple, APP et plusieurs autres protéines du module glial (NTN1, MDK, COL25A1, ICAM1 et SFRP1) ont montré une augmentation significative du protéome AD, mais il n’y avait presque aucun changement dans le transcriptome AD. Ces changements spécifiques aux protéines peuvent être étroitement liés aux plaques amyloïdes (23, 35), mettant en évidence le protéome comme source de changements pathologiques, et ces changements peuvent ne pas être reflétés dans le transcriptome.
Après avoir analysé indépendamment les protéomes du cerveau et du LCR que nous avons découverts, nous avons effectué une analyse complète des deux ensembles de données pour identifier les biomarqueurs AD CSF liés à la physiopathologie du réseau cérébral. Il faut d'abord définir le chevauchement des deux protéomes. Bien qu’il soit largement admis que le LCR reflète des changements neurochimiques dans le cerveau atteint de la maladie d’Alzheimer (4), le degré exact de chevauchement entre le cerveau atteint de la maladie d’Alzheimer et le protéome du LCR n’est pas clair. En comparant le nombre de produits génétiques partagés détectés dans nos deux protéomes, nous avons constaté que près de 70 % (n = 1936) des protéines identifiées dans le liquide céphalo-rachidien étaient également quantifiées dans le cerveau (Figure 4A). La plupart de ces protéines qui se chevauchent (n = 1 721) sont cartographiées sur l’un des 44 modules de co-expression de l’ensemble de données cérébrales de découverte (Figure 4B). Comme prévu, les six plus grands modules cérébraux (M1 à M6) présentaient le plus grand chevauchement du LCR. Cependant, il existe des modules cérébraux plus petits (par exemple M15 et M29) qui atteignent un degré de chevauchement étonnamment élevé, plus grand qu'un module cérébral deux fois plus grand. Cela nous motive à adopter une méthode plus détaillée et statistique pour calculer le chevauchement entre le cerveau et le liquide céphalo-rachidien.
(A et B) Les protéines détectées dans les ensembles de données découvertes sur le cerveau et le LCR se chevauchent. La plupart de ces protéines superposées sont associées à l’un des 44 modules de co-expression du réseau de co-expression cérébrale. (C) Découvrez le chevauchement entre le protéome du liquide céphalo-rachidien et le protéome du réseau cérébral. Chaque ligne de la carte thermique représente une analyse de chevauchement distincte du FET hypergéométrique. La rangée supérieure représente le chevauchement (ombrage gris/noir) entre le module cérébral et l’ensemble du protéome du LCR. La deuxième ligne montre que le chevauchement entre les modules cérébraux et la protéine CSF (ombré en rouge) est significativement régulé positivement dans la MA (P <0,05). La troisième rangée montre que le chevauchement entre les modules cérébraux et la protéine CSF (ombrage bleu) est significativement régulé négativement dans la MA (P <0,05). Utilisez la méthode BH pour corriger la valeur P dérivée du FET. (D) Panneau de module pliant basé sur l’association de types de cellules et les termes GO associés. Ces panels contiennent un total de 271 protéines liées au cerveau, qui ont une expression différentielle significative dans le protéome du LCR.
À l’aide de FET unilatérals, nous avons évalué l’importance du chevauchement protéique entre le protéome du CSF et les modules cérébraux individuels. L'analyse a révélé qu'un total de 14 modules cérébraux dans l'ensemble de données du CSF présentent des chevauchements statistiquement significatifs (P ajusté par FDR <0,05) et un module supplémentaire (M18) dont le chevauchement est proche de la signification (P ajusté par FDR = 0,06) (Figure 4C. , rangée du haut). Nous nous intéressons également aux modules qui chevauchent fortement les protéines du CSF exprimées différentiellement. Par conséquent, nous avons appliqué deux analyses FET supplémentaires pour déterminer laquelle de (i) la protéine CSF était significativement augmentée dans la MA et (ii) la protéine CSF était significativement diminuée dans la MA (P <0,05, test t apparié AD/contrôle) Modules cérébraux avec chevauchement significatif entre eux. Comme le montrent les rangées du milieu et du bas de la figure 4C, ces analyses supplémentaires montrent que 8 des 44 modules cérébraux se chevauchent de manière significative avec la protéine ajoutée dans AD CSF (M12, M1, M2, M18, M5, M44, M33 et M38) . ), alors que seuls deux modules (M6 et M15) ont montré un chevauchement significatif avec la protéine réduite dans AD CSF. Comme prévu, les 10 modules font partie des 15 modules présentant le chevauchement le plus élevé avec le protéome du CSF. Par conséquent, nous supposons que ces 15 modules sont des sources à haut rendement de biomarqueurs du LCR dérivés du cerveau de la MA.
Nous avons replié ces 15 modules qui se chevauchent en cinq grands panneaux de protéines en fonction de leur proximité dans l'arborescence WGCNA et de leur association avec les types de cellules et l'ontologie des gènes (Figure 4D). Le premier panel contient des modules riches en marqueurs neuronaux et en protéines liées aux synapses (M1 et M12). Le panel synaptique contient un total de 94 protéines, et les niveaux dans le protéome du LCR ont changé de manière significative, ce qui en fait la plus grande source de marqueurs du LCR liés au cerveau parmi les cinq panels. Le deuxième groupe (M6 et M15) a démontré le lien étroit avec les marqueurs des cellules endothéliales et du corps vasculaire, tels que la « cicatrisation des plaies » (M6) et la « régulation de la réponse immunitaire humorale » (M15). M15 est également étroitement lié au métabolisme des lipoprotéines, qui est étroitement lié à l'endothélium (36). Le panel vasculaire contient 34 marqueurs du CSF liés au cerveau. Le troisième groupe comprend des modules (M2 et M4) qui sont significativement liés aux marqueurs oligodendrocytes et à la prolifération cellulaire. Par exemple, les termes ontologiques de haut niveau de M2 incluent « régulation positive de la réplication de l’ADN » et « processus de biosynthèse des purines ». Pendant ce temps, ceux de M4 incluent la « différenciation des cellules gliales » et la « ségrégation chromosomique ». Le panel de myélinisation contient 49 marqueurs du CSF liés au cerveau.
Le quatrième groupe contient le plus de modules (M30, M29, M18, M24 et M5), et presque tous les modules sont significativement riches en marqueurs microglies et astrocytes. Semblable au panel myélinisation, le quatrième panel contient également des modules (M30, M29 et M18) étroitement liés à la prolifération cellulaire. Les autres modules de ce groupe sont fortement liés aux termes immunologiques, tels que « processus d'effet immunitaire » (M5) et « régulation de la réponse immunitaire » (M24). Le groupe immunitaire glial contient 42 marqueurs du CSF liés au cerveau. Enfin, le dernier panel comprend 52 marqueurs liés au cerveau sur les quatre modules (M44, M3, M33 et M38), tous situés sur le corps et liés au stockage d'énergie et au métabolisme. Le plus grand de ces modules (M3) est étroitement lié aux mitochondries et est riche en marqueurs spécifiques aux neurones. M38 est l’un des plus petits membres du module de ce métabolome et présente également une spécificité neuronale modérée.
Dans l'ensemble, ces cinq panneaux reflètent un large éventail de types et de fonctions cellulaires dans le cortex AD et contiennent collectivement 271 marqueurs du LCR liés au cerveau (tableau S2G). Afin d'évaluer la validité de ces résultats MS, nous avons utilisé le test d'extension de proximité (PEA), une technologie orthogonale basée sur des anticorps avec des capacités de multiplexage, une sensibilité et une spécificité élevées, et avons réanalysé les échantillons de liquide céphalo-rachidien que nous avons trouvés. Un sous-ensemble de ces 271 biomarqueurs (n = 36). Ces 36 cibles démontrent le changement du multiple AD du PEA, qui est étroitement lié à nos résultats basés sur MS (r = 0,87, P = 5,6 × 10-12), ce qui a fortement vérifié les résultats de notre analyse complète MS (Figure S4 ).
Les thèmes biologiques soulignés par nos cinq groupes, de la signalisation synaptique au métabolisme énergétique, sont tous liés à la pathogenèse de la MA (1-3). Par conséquent, les 15 modules contenant ces panneaux sont liés à la pathologie AD dans le protéome cérébral que nous avons découverte (Figure 2B). Le plus remarquable est la forte corrélation pathologique positive entre nos modules gliaux et la forte corrélation pathologique négative entre nos plus grands modules neuronaux (M1 et M3). L'analyse de l'expression différentielle de notre protéome cérébral répliqué (Figure S3D) met également en évidence les protéines gliales dérivées de M5 et M18. Dans AsymAD et la MA symptomatique, les protéines gliales et les synapses liées à M1 sont les plus augmentées. La protéine est la plus réduite. Ces observations indiquent que les 271 marqueurs du liquide céphalo-rachidien que nous avons identifiés dans les cinq groupes sont liés à des processus pathologiques dans le cortex MA, y compris ceux qui surviennent aux premiers stades asymptomatiques.
Afin de mieux analyser la direction du changement des protéines du panel dans le cerveau et le liquide céphalorachidien, nous avons dessiné ce qui suit pour chacun des 15 modules qui se chevauchent : (i) trouvé le niveau d'abondance du module dans l'ensemble de données cérébrales et (ii) le module protéine La différence est exprimée dans le liquide céphalo-rachidien (Figure S5). Comme mentionné précédemment, WGCNA est utilisé pour déterminer l’abondance des modules ou la valeur caractéristique des protéines dans le cerveau (13). La carte du volcan est utilisée pour décrire l'expression différentielle des protéines modulaires dans le liquide céphalo-rachidien (AD/contrôle). Ces figures montrent que trois des cinq panneaux montrent des tendances d'expression différentes dans le cerveau et le liquide céphalo-rachidien. Les deux modules du panel synapse (M1 et M12) montrent une diminution du niveau d'abondance dans le cerveau AD, mais se chevauchent de manière significative avec l'augmentation des protéines dans le LCR AD (Figure S5A). Les modules liés aux neurones contenant le métabolome (M3 et M38) présentaient des modèles d'expression similaires dans le cerveau et le liquide céphalo-rachidien, incohérents (Figure S5E). Le panel vasculaire a également montré des tendances d'expression différentes, bien que ses modules (M6 et M15) aient été modérément augmentés dans le cerveau atteint de MA et diminués dans le LCR malade (Figure S5B). Les deux panneaux restants contiennent de grands réseaux gliaux dont les protéines sont systématiquement régulées positivement dans les deux compartiments (Figures S5, C et D).
Veuillez noter que ces tendances ne sont pas communes à tous les marqueurs de ces panels. Par exemple, le panel synaptique comprend plusieurs protéines qui sont considérablement réduites dans le cerveau AD et le LCR (Figure S5A). Parmi ces marqueurs du liquide céphalo-rachidien régulés négativement figurent NPTX2 et VGF de M1 et la chromogranine B de M12. Cependant, malgré ces exceptions, la plupart de nos marqueurs synaptiques sont élevés dans le liquide céphalo-rachidien AD. Dans l'ensemble, ces analyses ont permis de distinguer des tendances statistiquement significatives dans les niveaux de cerveau et de liquide céphalo-rachidien dans chacun de nos cinq panels. Ces tendances mettent en évidence la relation complexe et souvent différente entre l’expression des protéines cérébrales et du LCR dans la MA.
Ensuite, nous avons utilisé l’analyse de réplication MS à haut débit (réplication CSF 1) pour restreindre notre ensemble de 271 biomarqueurs aux cibles les plus prometteuses et reproductibles (Figure 5A). La copie 1 du CSF contient un total de 96 échantillons d'Emory Goizueta ADRC, y compris le contrôle, AsymAD et la cohorte AD (tableau S1A). Ces cas de MA sont caractérisés par un léger déclin cognitif (MoCA moyen, 20,0 ± 3,8) et des modifications des biomarqueurs de la MA confirmées dans le liquide céphalo-rachidien (Tableau S1A). Contrairement à l'analyse du LCR que nous avons trouvée, cette réplication est réalisée à l'aide d'une méthode MS « à injection unique » plus efficace et à haut débit (sans fractionnement hors ligne), comprenant un protocole de préparation d'échantillon simplifié qui élimine le besoin d'immunodéplétion d'échantillons individuels. . Au lieu de cela, un seul « canal d’amélioration » immunodéprimé est utilisé pour amplifier le signal des protéines moins abondantes (37). Bien qu'elle réduise la couverture totale du protéome, cette méthode en un seul coup réduit considérablement le temps machine et augmente le nombre d'échantillons marqués au TMT pouvant être analysés de manière viable (17, 38). Au total, l’analyse a identifié 6 487 peptides, correspondant à 1 183 protéomes dans 96 cas. Comme pour l'analyse du LCR que nous avons trouvée, seules les protéines quantifiées dans au moins 50 % des échantillons ont été incluses dans les calculs ultérieurs, et les données ont été régressées pour tenir compte des effets de l'âge et du sexe. Cela a conduit à la quantification finale de 792 protéomes, dont 95 % ont également été identifiés dans l’ensemble de données CSF trouvé.
(A) Cibles protéiques du CSF liées au cerveau vérifiées dans la première cohorte répliquée du CSF et incluses dans le panel final (n = 60). (B à E) Niveaux de biomarqueurs du panel (scores z composites) mesurés dans les quatre cohortes de réplication du LCR. Des tests t appariés ou une ANOVA avec post-correction de Tukey ont été utilisés pour évaluer la signification statistique des changements d'abondance dans chaque analyse répétée. CT, contrôle.
Étant donné que nous souhaitons particulièrement vérifier nos 271 cibles du LCR liées au cerveau grâce à une analyse complète, nous limiterons l'examen plus approfondi de ce protéome répliqué à ces marqueurs. Parmi ces 271 protéines, 100 ont été détectées dans la réplication 1 du CSF. La figure S6A montre l'expression différentielle de ces 100 marqueurs qui se chevauchent entre les échantillons de contrôle et de réplication AD. Les histones synaptiques et métabolites augmentent le plus dans la MA, tandis que les protéines vasculaires diminuent le plus dans la maladie. La plupart des 100 marqueurs qui se chevauchent (n = 70) ont conservé la même direction de changement dans les deux ensembles de données (Figure S6B). Ces 70 marqueurs validés du LCR liés au cerveau (tableau S2H) reflètent en grande partie les tendances d'expression des panels précédemment observées, c'est-à-dire la régulation négative des protéines vasculaires et la régulation positive de tous les autres panels. Seules 10 de ces 70 protéines validées ont montré des changements dans l’abondance de la MA qui contredisaient les tendances de ces panels. Afin de générer un panel reflétant au mieux la tendance globale du cerveau et du liquide céphalo-rachidien, nous avons exclu ces 10 protéines du panel d'intérêt que nous avons finalement vérifié (Figure 5A). Par conséquent, notre panel comprend finalement un total de 60 protéines vérifiées dans deux cohortes indépendantes de CSF AD utilisant différentes préparations d’échantillons et analyses sur plateforme MS. Les tracés d'expression du score z de ces panels finaux dans les cas de contrôle de la copie 1 du LCR et de MA ont confirmé la tendance du panel observée dans la cohorte du LCR que nous avons trouvée (Figure 5B).
Parmi ces 60 protéines, il existe des molécules connues pour être associées à la MA, comme l'ostéopontine (SPP1), qui est une cytokine pro-inflammatoire associée à la MA dans de nombreuses études (39-41), et GAP43, une protéine synaptique. cela est clairement lié à la neurodégénérescence (42). Les protéines les plus entièrement vérifiées sont des marqueurs liés à d'autres maladies neurodégénératives, telles que la superoxyde dismutase 1 (SOD1) liée à la sclérose latérale amyotrophique (SLA) et la désaccharase liée à la maladie de Parkinson (PARK7) . Nous avons également vérifié que de nombreux autres marqueurs, tels que SMOC1 et la protéine 1 de signalisation de l'attachement membranaire riche en cerveau (BASP1), avaient des liens antérieurs limités avec la neurodégénérescence. Il convient de noter qu'en raison de leur faible abondance globale dans le protéome du LCR, il nous est difficile d'utiliser cette méthode de détection unique à haut débit pour détecter de manière fiable MAPT et certaines autres protéines liées à la MA (par exemple, NEFL et NRGN). ) ( 43, 44).
Nous avons ensuite vérifié ces 60 marqueurs de panel prioritaires dans trois analyses répétées supplémentaires. Dans CSF Copy 2, nous avons utilisé un seul TMT-MS pour analyser une cohorte indépendante de 297 échantillons de contrôle et AD d'Emory Goizueta ADRC (17). La réplication 3 du CSF comprenait une réanalyse des données TMT-MS disponibles provenant de 120 patients témoins et patients atteints de MA de Lausanne, Suisse (45). Nous avons détecté plus des deux tiers des 60 marqueurs prioritaires dans chaque ensemble de données. Bien que l'étude suisse ait utilisé différentes plates-formes MS et méthodes de quantification TMT (45, 46), nous avons fortement reproduit les tendances de notre panel dans deux analyses répétées (Figure 5, C et D, et tableaux S2, I et J). Pour évaluer la spécificité de la maladie de notre groupe, nous avons utilisé TMT-MS pour analyser le quatrième ensemble de données de réplication (réplication CSF 4), qui comprenait non seulement les cas témoins (n = 18) et AD (n = 17), mais également la maladie de Parkinson ( n = 14)), des échantillons de SLA (n = 18) et de démence frontotemporale (FTD) (n = 11) (Tableau S1A). Nous avons quantifié avec succès près des deux tiers des protéines du panel de cette cohorte (38 sur 60). Ces résultats mettent en évidence les changements spécifiques à la MA dans les cinq panels de biomarqueurs (Figure 5E et Tableau S2K). L’augmentation dans le groupe métabolite a montré la plus forte spécificité AD, suivie par le groupe myélinisation et glial. Dans une moindre mesure, le FTD montre également une augmentation entre ces panels, ce qui peut refléter des changements potentiels similaires sur le réseau (17). En revanche, la SLA et la MP présentaient presque les mêmes profils de myélinisation, de cellules gliales et de métabolome que le groupe témoin. Dans l'ensemble, malgré les différences dans la préparation des échantillons, la plate-forme MS et les méthodes de quantification du TMT, ces analyses répétées montrent que nos marqueurs de panel prioritaires présentent des changements spécifiques à la MA très cohérents dans plus de 500 échantillons uniques de LCR.
La neurodégénérescence de la MA a été largement reconnue plusieurs années avant l'apparition des symptômes cognitifs, il existe donc un besoin urgent de biomarqueurs d'AsymAD (5, 31). Cependant, de plus en plus de preuves montrent que la biologie d’AsymAD est loin d’être homogène et que l’interaction complexe du risque et de la résilience conduit à de grandes différences individuelles dans la progression ultérieure de la maladie (47). Bien qu'ils soient utilisés pour identifier les cas d'AsymAD, les niveaux des biomarqueurs principaux du LCR (Aβ1-42, tau total et p-tau) ne se sont pas révélés capables de prédire de manière fiable qui évoluera vers la démence (4, 7), ce qui indique que cela pourrait être plus le cas. Il est nécessaire d’inclure des outils de biomarqueurs holistiques basés sur de multiples aspects de la physiologie cérébrale pour stratifier avec précision le risque de cette population. Par conséquent, nous avons ensuite analysé notre panel de biomarqueurs validés par AD dans la population AsymAD de la copie 1 du LCR. Ces 31 cas AsymAD présentaient des niveaux anormaux de biomarqueurs de base (rapport Aβ1–42/ELISA tau total, <5,5) et une cognition complète (MoCA moyen, 27,1). ± 2,2) (tableau S1A). De plus, toutes les personnes atteintes d’AsymAD ont un score de démence clinique de 0, ce qui indique qu’il n’y a aucune preuve d’une baisse des performances cognitives ou fonctionnelles quotidiennes.
Nous avons d'abord analysé les niveaux des panels validés dans les 96 répétitions 1 du CSF, y compris la cohorte AsymAD. Nous avons constaté que plusieurs panels du groupe AsymAD présentaient des changements d'abondance significatifs de type AD, le panel vasculaire présentait une tendance à la baisse dans AsymAD, tandis que tous les autres panels présentaient une tendance à la hausse (Figure 6A). Par conséquent, tous les panels ont montré une corrélation hautement significative avec l’ELISA Aβ1-42 et les niveaux totaux de tau (Figure 6B). En revanche, la corrélation entre le groupe et le score MoCA est relativement faible. L’une des conclusions les plus frappantes de ces analyses est la large gamme d’abondances de panels dans la cohorte AsymAD. Comme le montre la figure 6A, le niveau du panel du groupe AsymAD croise généralement le niveau du panel du groupe témoin et du groupe AD, montrant une variabilité relativement élevée. Pour explorer davantage cette hétérogénéité d’AsymAD, nous avons appliqué l’analyse Multidimensionnelle Scaling (MDS) à 96 cas de réplication 1 du CSF. L'analyse MDS permet de visualiser la similarité entre les cas en fonction de certaines variables de l'ensemble de données. Pour cette analyse groupée, nous utilisons uniquement les marqueurs de panel validés qui présentent un changement statistiquement significatif (P <0,05, AD / contrôle) au niveau du protéome de découverte et de réplication 1 du CSF (n = 29) (Tableau S2L). Cette analyse a produit un regroupement spatial clair entre nos cas de contrôle et nos cas de MA (Figure 6C). En revanche, certains cas AsymAD sont clairement regroupés dans le groupe témoin, tandis que d’autres sont localisés dans des cas MA. Pour explorer davantage cette hétérogénéité AsymAD, nous avons utilisé notre carte MDS pour définir deux groupes de ces cas AsymAD. Le premier groupe comprenait des cas AsymAD regroupés plus près du contrôle (n = 19), tandis que le deuxième groupe était caractérisé par des cas AsymAD avec un profil de marqueur plus proche de la MA (n = 12).
(A) Le niveau d’expression (z-score) du groupe de biomarqueurs du LCR dans les 96 échantillons de la cohorte de réplication 1 du LCR, y compris AsymAD. L'analyse de variance avec la post-correction de Tukey a été utilisée pour évaluer la signification statistique des changements d'abondance du panel. (B) Analyse de corrélation du niveau d’abondance des protéines du panel (score z) avec le score MoCA et le niveau total de tau dans les échantillons ELISA Aβ1-42 et CSF copie 1. Le coefficient de corrélation de Pearson avec la valeur P correspondante s'affiche. (C) Le MDS de 96 cas de copie 1 du CSF était basé sur les niveaux d'abondance de 29 marqueurs de panel validés, qui ont été modifiés de manière significative dans les ensembles de données de découverte et de copie 1 du CSF [P <0,05 AD/contrôle (CT)]. Cette analyse a été utilisée pour diviser le groupe AsymAD en sous-groupes contrôle (n = 19) et AD (n = 12). (D) Le tracé du volcan montre l’expression différentielle de toutes les protéines de réplication 1 du CSF avec un changement de facteur log2 (axe des x) par rapport à la valeur P statistique -log10 entre les deux sous-groupes AsymAD. Les biomarqueurs du panel sont colorés. (E) Le niveau d’abondance de la réplication 1 du CSF des biomarqueurs du groupe de sélection est exprimé de manière différentielle entre les sous-groupes AsymAD. L'analyse de variance post-ajustée de Tukey a été utilisée pour évaluer la signification statistique.
Nous avons examiné l'expression différentielle des protéines entre ces cas AsymAD témoins et de type AD (Figure 6D et Tableau S2L). La carte des volcans qui en résulte montre que 14 panneaux marqueurs ont changé de manière significative entre les deux groupes. La plupart de ces marqueurs sont membres de la synapse et du métabolome. Cependant, la SOD1 et le substrat de la protéine kinase C riche en alanine myristoylée (MARCKS), qui sont respectivement membres des groupes immunitaires myéline et gliale, appartiennent également à ce groupe (Figure 6, D et E) . Le panel vasculaire a également contribué à deux marqueurs qui ont été significativement réduits dans le groupe AsymAD de type AD, notamment la protéine de liaison AE 1 (AEBP1) et le membre C9 de la famille du complément. Il n'y avait pas de différence significative entre les sous-groupes témoins et AsymAD de type AD dans l'ELISA AB1-42 (P = 0,38) et p-tau (P = 0,28), mais il y avait effectivement une différence significative dans le niveau total de tau (P = 0,0031). ) (Fig. S7). Plusieurs marqueurs de panel indiquent que les changements entre les deux sous-groupes AsymAD sont plus significatifs que les niveaux totaux de tau (par exemple, YWHAZ, SOD1 et MDH1) (Figure 6E). Dans l'ensemble, ces résultats indiquent que notre panel validé peut contenir des biomarqueurs pouvant sous-typer et stratifier le risque potentiel des patients atteints d'une maladie asymptomatique.
Il existe un besoin urgent de disposer d’outils de biomarqueurs systémiques pour mieux mesurer et cibler les différentes physiopathologies à l’origine de la MA. Ces outils devraient non seulement modifier notre cadre de diagnostic de la MA, mais également promouvoir l'adoption de stratégies de traitement efficaces et spécifiques au patient (1, 2). À cette fin, nous avons appliqué une approche protéomique complète et impartiale au cerveau et au LCR de la MA afin d'identifier des biomarqueurs du LCR basés sur le Web qui reflètent un large éventail de physiopathologies cérébrales. Notre analyse a produit cinq panels de biomarqueurs du LCR, qui (i) reflètent les synapses, les vaisseaux sanguins, la myéline, les dysfonctionnements immunitaires et métaboliques ; (ii) démontrer une forte reproductibilité sur différentes plates-formes MS ; (iii) Montrer des changements progressifs spécifiques à la maladie tout au long des stades précoces et tardifs de la MA. Dans l’ensemble, ces résultats représentent une étape prometteuse vers le développement d’outils de biomarqueurs diversifiés, fiables et orientés Web pour la recherche sur la MA et les applications cliniques.
Nos résultats démontrent l’organisation hautement conservée du protéome du réseau cérébral AD et soutiennent son utilisation comme point d’ancrage pour le développement de biomarqueurs systémiques. Notre analyse montre que deux ensembles de données TMT-MS indépendants contenant les cerveaux AD et AsymAD ont une forte modularité. Ces résultats étendent nos travaux antérieurs, démontrant la préservation des modules puissants de plus de 2 000 tissus cérébraux provenant de plusieurs cohortes indépendantes dans le cortex frontal, pariétal et temporal (17). Ce réseau de consensus reflète divers changements liés à la maladie observés dans les recherches actuelles, notamment l'augmentation des modules inflammatoires riches en cellules gliales et la diminution des modules riches en neurones. À l’instar des recherches actuelles, ce réseau à grande échelle présente également des changements modulaires importants dans AsymAD, montrant une variété de physiopathologies précliniques différentes (17).
Cependant, dans ce cadre systémique hautement conservateur, il existe une hétérogénéité biologique plus fine, en particulier parmi les individus aux premiers stades de la MA. Notre panel de biomarqueurs est capable de décrire deux sous-groupes dans AsymAD, qui démontrent l'expression différentielle significative de plusieurs marqueurs du CSF. Notre groupe a pu mettre en évidence des différences biologiques entre ces deux sous-groupes, qui n’étaient pas évidentes au niveau des biomarqueurs centraux de la MA. Par rapport au groupe témoin, les ratios Aβ1-42/tau total de ces individus AsymAD étaient anormalement faibles. Cependant, seuls les niveaux totaux de tau étaient significativement différents entre les deux sous-groupes AsymAD, tandis que les niveaux d'Aβ1-42 et de p-tau restaient relativement comparables. Étant donné qu’un taux élevé de tau dans le LCR semble être un meilleur prédicteur des symptômes cognitifs que les niveaux d’Aβ1-42 (7), nous soupçonnons que les deux cohortes AsymAD pourraient présenter des risques différents de progression de la maladie. Compte tenu de la taille limitée de l'échantillon de notre AsymAD et du manque de données longitudinales, des recherches supplémentaires sont nécessaires pour tirer ces conclusions avec certitude. Cependant, ces résultats indiquent qu'un panel de LCR basé sur un système peut améliorer notre capacité à stratifier efficacement les individus pendant la phase asymptomatique de la maladie.
Dans l’ensemble, nos résultats confirment le rôle de multiples fonctions biologiques dans la pathogenèse de la MA. Cependant, le métabolisme énergétique dérégulé est devenu le thème principal de nos cinq panels d’étiquetage validés. Les protéines métaboliques, telles que l'hypoxanthine-guanine phosphoribosyltransférase 1 (HPRT1) et la lactate déshydrogénase A (LDHA), sont les biomarqueurs synaptiques les plus robustement validés, indiquant que l'augmentation de la AD CSF est hautement reproductible lors du sexe. Nos vaisseaux sanguins et nos panneaux gliaux contiennent également plusieurs marqueurs impliqués dans le métabolisme des substances oxydantes. Ces résultats concordent avec le rôle clé que jouent les processus métaboliques dans l’ensemble du cerveau, non seulement pour répondre à la forte demande énergétique des neurones, mais également pour répondre à la forte demande énergétique des astrocytes et d’autres cellules gliales (17, 48). Nos résultats corroborent les preuves croissantes selon lesquelles les modifications du potentiel redox et l'interruption des voies énergétiques pourraient constituer le lien principal entre plusieurs processus clés impliqués dans la pathogenèse de la MA, notamment les troubles mitochondriaux, l'inflammation à médiation gliale et les lésions vasculaires (49). De plus, les biomarqueurs métaboliques du liquide céphalo-rachidien contiennent un grand nombre de protéines différentiellement riches entre nos sous-groupes de contrôle et les sous-groupes AsymAD de type AD, ce qui suggère que la perturbation de ces voies énergétiques et redox pourrait être critique au stade préclinique de la maladie.
Les différentes tendances du panel sur le cerveau et le liquide céphalo-rachidien que nous avons observées ont également des implications biologiques intéressantes. Les synapses et les métabolomes riches en neurones présentent des niveaux réduits dans le cerveau atteint de MA et une abondance accrue dans le liquide céphalo-rachidien. Étant donné que les neurones sont riches en mitochondries productrices d'énergie au niveau des synapses pour fournir de l'énergie à leurs nombreux signaux spécialisés (50), la similarité des profils d'expression de ces deux groupes de neurones est attendue. La perte de neurones et l'extrusion de cellules endommagées peuvent expliquer ces tendances du panel du cerveau et du LCR au cours de la maladie ultérieure, mais elles ne peuvent pas expliquer les changements précoces du panel que nous observons (13). Une explication possible de ces résultats au début d’une maladie asymptomatique est un élagage synaptique anormal. De nouvelles preuves dans des modèles murins suggèrent que la phagocytose synaptique médiée par les microglies pourrait être anormalement activée dans la MA et conduire à une perte précoce des synapses dans le cerveau (51). Ce matériel synaptique rejeté peut s'accumuler dans le LCR, c'est pourquoi nous observons l'augmentation du LCR dans le panel neuronal. L'élagage synaptique à médiation immunitaire peut également expliquer en partie l'augmentation des protéines gliales que nous observons dans le cerveau et le liquide céphalo-rachidien tout au long du processus pathologique. En plus de l’élagage synaptique, des anomalies globales de la voie exocytaire peuvent également conduire à différentes expressions de marqueurs neuronaux dans le cerveau et le LCR. Un certain nombre d'études ont montré que le contenu des exosomes dans la pathogenèse du cerveau atteint de MA avait changé (52). La voie extracellulaire est également impliquée dans la prolifération de l'Aβ (53, 54). Il convient de noter que la suppression de la sécrétion exosomale peut réduire la pathologie de type MA dans les modèles de souris transgéniques MA (55).
Dans le même temps, la protéine dans le panel vasculaire a montré une augmentation modérée dans le cerveau atteint de MA, mais une diminution significative dans le LCR. Le dysfonctionnement de la barrière hémato-encéphalique (BBB) peut expliquer en partie ces constatations. De nombreuses études post-mortem indépendantes sur des humains ont démontré une dégradation de la BBB dans la MA (56, 57). Ces études ont confirmé diverses activités anormales entourant cette couche étroitement scellée de cellules endothéliales, notamment une fuite capillaire cérébrale et une accumulation périvasculaire de protéines véhiculées par le sang (57). Cela peut fournir une explication simple à l’augmentation des protéines vasculaires dans le cerveau, mais cela ne peut pas expliquer complètement la déplétion de ces mêmes protéines dans le liquide céphalo-rachidien. Une possibilité est que le système nerveux central isole activement ces molécules pour résoudre le problème de l’inflammation accrue et du stress oxydatif. La réduction de certaines des protéines du LCR les plus sévères de ce panel, en particulier celles impliquées dans la régulation des lipoprotéines, est liée à l'inhibition de niveaux nocifs d'inflammation et au processus neuroprotecteur des espèces réactives de l'oxygène. Cela est vrai pour la Paroxonase 1 (PON1), une enzyme de liaison aux lipoprotéines responsable de la réduction des niveaux de stress oxydatif dans la circulation (58, 59). Le précurseur alpha-1-microglobuline/bikunine (AMBP) est un autre marqueur significativement régulé négativement du groupe vasculaire. C'est le précurseur du transporteur lipidique bikunine, qui est également impliqué dans la suppression de l'inflammation et la protection neurologique (60, 61).
Malgré diverses hypothèses intéressantes, l’incapacité de détecter directement les mécanismes biochimiques des maladies constitue une limitation bien connue de l’analyse protéomique axée sur la découverte. Par conséquent, des recherches supplémentaires sont nécessaires pour définir avec certitude les mécanismes à l’origine de ces panels de biomarqueurs. Afin de progresser vers le développement d’une analyse clinique basée sur la SEP, l’orientation future nécessite également l’utilisation de méthodes quantitatives ciblées pour la vérification des biomarqueurs à grande échelle, telles que la surveillance sélective ou parallèle des réactions (62). Nous avons récemment utilisé la surveillance des réactions parallèles (63) pour valider de nombreux changements protéiques du CSF décrits ici. Plusieurs cibles de panel prioritaires sont quantifiées avec une précision significative, notamment YWHAZ, ALDOA et SMOC1, qui correspondent respectivement à nos panels de synapse, de métabolisme et d'inflammation (63). L'acquisition de données indépendante (DIA) et d'autres stratégies basées sur MS peuvent également être utiles pour la vérification des cibles. Bud et coll. (64) Il a été récemment démontré qu'il existe un chevauchement significatif entre les biomarqueurs de la maladie d'Alzheimer identifiés dans notre ensemble de données de découverte du LCR et l'ensemble de données indépendant DIA-MS, qui comprend près de 200 échantillons de LCR provenant de trois cohortes européennes différentes. Ces études récentes soutiennent le potentiel de nos panels à se transformer en une détection fiable basée sur MS. La détection traditionnelle basée sur les anticorps et les aptamères est également importante pour le développement ultérieur de biomarqueurs clés de la MA. En raison de la faible abondance du LCR, il est plus difficile de détecter ces biomarqueurs à l’aide de méthodes MS à haut débit. NEFL et NRGN sont deux exemples de biomarqueurs du LCR à faible abondance, qui sont cartographiés sur le panel dans notre analyse complète, mais ne peuvent pas être détectés de manière fiable à l'aide de notre stratégie unique de SEP. Les stratégies de ciblage basées sur plusieurs anticorps, comme le PEA, peuvent favoriser la transformation clinique de ces marqueurs.
Dans l’ensemble, cette étude propose une approche protéomique unique pour l’identification et la vérification des biomarqueurs du LCR AD basés sur différents systèmes. L’optimisation de ces panels de marqueurs sur d’autres cohortes de MA et plates-formes de SEP pourrait s’avérer prometteuse pour faire progresser la stratification et le traitement du risque de MA. Les études qui évaluent le niveau longitudinal de ces panels au fil du temps sont également essentielles pour déterminer quelle combinaison de marqueurs stratifie le mieux le risque de maladie précoce et les changements dans la gravité de la maladie.
À l'exception des 3 échantillons copiés par le CSF, tous les échantillons de CSF utilisés dans cette étude ont été collectés sous les auspices d'Emory ADRC ou d'institutions de recherche étroitement liées. Au total, quatre ensembles d'échantillons Emory CSF ont été utilisés dans ces études protéomiques. La cohorte CSF contenait des échantillons provenant de 20 témoins sains et de 20 patients atteints de MA. La copie 1 du CSF comprend des échantillons provenant de 32 contrôles sains, de 31 individus AsymAD et de 33 individus AD. La copie 2 du CSF contient 147 contrôles et 150 échantillons AD. La cohorte multi-maladie de réplication 4 du LCR comprenait 18 échantillons témoins, 17 AD, 19 ALS, 13 PD et 11 FTD. Selon l'accord approuvé par l'Emory University Institutional Review Board, tous les participants à l'étude Emory ont obtenu un consentement éclairé. Selon les lignes directrices 2014 de l'Institut national du vieillissement pour les centres Alzheimer (https://alz.washington.edu/BiospecimenTaskForce.html), le liquide céphalo-rachidien a été collecté et stocké par ponction lombaire. Les patients témoins et AsymAD et MA ont reçu une évaluation cognitive standardisée à la clinique de neurologie cognitive Emory ou à Goizueta ADRC. Leurs échantillons de liquide céphalorachidien ont été testés par INNO-BIA AlzBio3 Luminex pour ELISA Aβ1-42, analyse tau totale et p-tau (65). Les valeurs ELISA sont utilisées pour soutenir la classification diagnostique des sujets sur la base de critères de coupure établis pour les biomarqueurs de la MA (66, 67). Les données démographiques et diagnostiques de base pour d'autres diagnostics de LCR (FTD, ALS et PD) sont également obtenues auprès d'Emory ADRC ou d'instituts de recherche affiliés. Les métadonnées récapitulatives de ces cas Emory CSF se trouvent dans le tableau S1A. Les caractéristiques de la cohorte suisse de réplication 3 du CSF ont déjà été publiées (45).
CSF a trouvé l'échantillon. Afin d'approfondir notre découverte de l'ensemble de données du LCR, une consommation immunitaire de protéines en forte abondance a été réalisée avant la trypsinisation. En bref, 130 µl de LCR provenant de 40 échantillons individuels de LCR et un volume égal (130 µl) de résine de déplétion des protéines High Select Top14 Abundance (Thermo Fisher Scientific, A36372) ont été placés dans une colonne de centrifugation (Thermo Fisher Scientific, A89868) dans la pièce. température Incuber). Après 15 minutes d'essorage, centrifugez l'échantillon à 1 000 g pendant 2 minutes. Un dispositif de filtre ultracentrifuge 3K (Millipore, UFC500396) a été utilisé pour concentrer l'échantillon d'effluent par centrifugation à 14 000 g pendant 30 minutes. Diluer tous les volumes d’échantillon à 75 ul avec une solution saline tamponnée au phosphate. La concentration en protéines a été évaluée par la méthode à l'acide bicinchoninique (BCA) selon le protocole du fabricant (Thermo Fisher Scientific). Le LCR immunodéprimé (60 µl) des 40 échantillons a été digéré avec de la lysyl endopeptidase (LysC) et de la trypsine. En bref, l'échantillon a été réduit et alkylé avec 1,2 µl de tris-2 (-carboxyéthyl)-phosphine 0,5 M et 3 µl de chloroacétamide 0,8 M à 90 ° C pendant 10 minutes, puis soniqué dans un bain-marie pendant 15 minutes. L'échantillon a été dilué avec 193 µl de tampon d'urée 8 M [urée 8 M et NaHPO4 100 mM (pH 8,5)] jusqu'à une concentration finale de 6 M d'urée. LysC (4,5 µg ; Wako) est utilisé pour une digestion nocturne à température ambiante. L'échantillon a ensuite été dilué dans de l'urée 1 M avec du bicarbonate d'ammonium (ABC) 50 mM (68). Ajoutez une quantité égale (4,5 μg) de trypsine (Promega), puis incubez l'échantillon pendant 12 heures. Acidifiez la solution peptidique digérée à une concentration finale de 1 % d'acide formique (FA) et 0,1 % d'acide trifluoroacétique (TFA) (66), puis dessalez avec une colonne Sep-Pak C18 de 50 mg (Waters) comme décrit ci-dessus (25). . Le peptide a ensuite été élué dans 1 ml d'acétonitrile à 50 % (ACN). Pour standardiser la quantification des protéines entre les lots (25), des aliquotes de 100 µl provenant des 40 échantillons de LCR ont été combinées pour générer un échantillon mixte, qui a ensuite été divisé en cinq échantillons d'étalons internes globaux (GIS) (48). Tous les échantillons individuels et étalons combinés sont séchés sous vide à grande vitesse (Labconco).
CSF copie l'échantillon. Dayon et ses collègues ont déjà décrit la déplétion immunitaire et la digestion des échantillons de copie 3 du LCR (45, 46). Les échantillons répétés restants n’étaient pas individuellement immunodéprimés. Digérez ces échantillons non retirés dans la trypsine comme décrit précédemment (17). Pour chaque analyse répétée, des aliquotes de 120 µl du peptide élué de chaque échantillon ont été regroupées et divisées en aliquotes de volume égal pour être utilisées comme étalon interne global marqué au TMT (48). Tous les échantillons individuels et étalons combinés sont séchés sous vide à grande vitesse (Labconco). Afin d'améliorer le signal de la protéine CSF en faible abondance, en combinant 125 µl de chaque échantillon, un échantillon « amélioré » a été préparé pour chaque analyse répétée [c'est-à-dire un échantillon biologique qui imite l'échantillon de recherche, mais la quantité disponible est beaucoup plus grand (37, 69)] fusionné dans un échantillon mixte de LCR (17). L'échantillon mélangé a ensuite été immunoéliminé à l'aide de 12 ml de résine d'élimination des protéines High Select Top14 Abundance (Thermo Fisher Scientific, A36372), digéré comme décrit ci-dessus et inclus dans le marquage TMT multiple ultérieur.
Heure de publication : 27 août 2021