Automated free speech analysis reveals distinct markers of Alzheimer’s and frontotemporal dementia Academic Article

abstract

  • Dementia can disrupt how people experience and describe events as well as their own role in them. Alzheimer’s disease (AD) compromises the processing of entities expressed by nouns, while behavioral variant frontotemporal dementia (bvFTD) entails a depersonalized perspective with increased third-person references. Yet, no study has examined whether these patterns can be captured in connected speech via natural language processing tools. To tackle such gaps, we asked 96 participants (32 AD patients, 32 bvFTD patients, 32 healthy controls) to narrate a typical day of their lives and calculated the proportion of nouns, verbs, and first- or third-person markers (via part-of-speech and morphological tagging). We also extracted objective properties (frequency, phonological neighborhood, length, semantic variability) from each content word. In our main study (with 21 AD patients, 21 bvFTD patients, and 21 healthy controls), we used inferential statistics and machine learning for group-level and subject-level discrimination. The above linguistic features were correlated with patients’ scores in tests of general cognitive status and executive functions. We found that, compared with HCs, (i) AD (but not bvFTD) patients produced significantly fewer nouns, (ii) bvFTD (but not AD) patients used significantly more third-person markers, and (iii) both patient groups produced more frequent words. Machine learning analyses showed that these features identified individuals with AD and bvFTD (AUC = 0.71). A generalizability test, with a model trained on the entire main study sample and tested on hold-out samples (11 AD patients, 11 bvFTD patients, 11 healthy controls), showed even better performance, with AUCs of 0.76 and 0.83 for AD and bvFTD, respectively. No linguistic feature was significantly correlated with cognitive test scores in either patient group. These results suggest that specific cognitive traits of each disorder can be captured automatically in connected speech, favoring interpretability for enhanced syndrome characterization, diagnosis, and monitoring.
  • La demencia puede alterar la forma en que las personas experimentan y describen los acontecimientos, así como su propio papel en ellos. La enfermedad de Alzheimer (EA) compromete el procesamiento de entidades expresadas por sustantivos, mientras que la demencia frontotemporal variante del comportamiento (dfctv) conlleva una perspectiva despersonalizada con un aumento de las referencias en tercera persona. Sin embargo, ningún estudio ha examinado si estos patrones pueden captarse en el habla conectada mediante herramientas de procesamiento del lenguaje natural. Para subsanar estas deficiencias, pedimos a 96 participantes (32 pacientes con EA, 32 pacientes con dFTb y 32 controles sanos) que narraran un día típico de sus vidas y calculamos la proporción de sustantivos, verbos y marcadores de primera o tercera persona (mediante etiquetado morfológico y de parte del habla). También extrajimos propiedades objetivas (frecuencia, vecindad fonológica, longitud, variabilidad semántica) de cada palabra de contenido. En nuestro estudio principal (con 21 pacientes con EA, 21 pacientes con bvFTD y 21 controles sanos), utilizamos estadística inferencial y aprendizaje automático para la discriminación a nivel de grupo y a nivel de sujeto. Las características lingüísticas anteriores se correlacionaron con las puntuaciones de los pacientes en pruebas de estado cognitivo general y funciones ejecutivas. Se observó que, en comparación con los HC, (i) los pacientes con EA (pero no con bvFTD) producían significativamente menos sustantivos, (ii) los pacientes con bvFTD (pero no con EA) utilizaban significativamente más marcadores de tercera persona, y (iii) ambos grupos de pacientes producían palabras más frecuentes. Los análisis de aprendizaje automático mostraron que estas características identificaban a los individuos con EA y bvFTD (AUC = 0,71). Una prueba de generalizabilidad, con un modelo entrenado en toda la muestra del estudio principal y probado en muestras de retención (11 pacientes con EA, 11 pacientes con bvFTD, 11 controles sanos), mostró un rendimiento aún mejor, con AUC de 0,76 y 0,83 para EA y bvFTD, respectivamente. Ningún rasgo lingüístico se correlacionó significativamente con las puntuaciones de las pruebas cognitivas en ninguno de los grupos de pacientes. Estos resultados sugieren que los rasgos cognitivos específicos de cada trastorno pueden captarse automáticamente en el habla conectada, favoreciendo la interpretabilidad para una mejor caracterización, diagnóstico y seguimiento del síndrome.

publication date

  • 2024-6-6

edition

  • 19

keywords

  • Alzheimer Disease
  • Alzheimer Disease 11
  • Area Under Curve
  • Cognition
  • Dementia
  • Executive Function
  • Frontotemporal Dementia
  • Linguistics
  • Machine Learning
  • Natural Language Processing
  • Semantics
  • Statistics

number of pages

  • 19

start page

  • 1

end page

  • 19