In the context of language assessment, language testing assumes a major role, as it allows the collection of detailed information on language production at various levels, including morpho-syntactic and others. Current assessment tools mainly investigate morpho-syntactic development before the age of 3 years of a child, while few tests focus on development at preschool age. Assessment methods at this age, which are still on the market, have many limitations such as dated normative references that do not reflect the vocabulary of today's children, a fragility of sample size, the presence of outdated and ambiguous figurative material, the absence of a basic psychometric construct, and provide poor indices in relation to the excessive time expenditure. The use of language analysis software, as indicated by data reported in the literature (Pezold et al., 2020), can greatly reduce correction time, ensuring rapid, automated, and increasingly accurate analysis in distinguishing pathological from normative language samples (Bååth et al., 2019; Chojnicka & Wawer, 2020). The research project being presented aims to overcome the current limitations of child language assessment tests by creating an assessment tool that allows for specific, in-depth, multilevel analysis of language, based on solid psychometric data with clear, modern material built from scratch. The study, curated and promoted by the Paideia Foundation of Turin in collaboration with the University of Turin, consists of the creation, administration and data collection of the new test and its subsequent analysis using a specific software called Talkidz with the ultimate goal of being able to optimize the early diagnosis of expressive language disorders in developmental age. 120 children attending three preschools in the City of Turin were involved. Among them, 102 children (62 boys, 40 girls) monolingual Italians with typical development and without intellectual disability, neurological injury or hearing problems were selected. The age of the selected children ranged from 42 to 77 months. They described what was happening in 42 pictures created following specific criteria (Zmarich et al., 2012).The previously trained examiner avoided intrusive questions that could induce naming alone, such as "who is there?" or "what is it?" thus compromising the validity of the test. To record the child's output, a 5.0MP webcam at 1080p resolution was used noninvasively. After an acoustic analysis of the video recordings, the operator transcribed the child's production orthographically, which was then entered and processed by the software. Various linguistic parameters, such as the distribution of words and their structure, morphosyntactic data, lexical variability indices, phonetic inventory, and analysis into traits and processes, were thus derived. The time taken for test administration and analysis of the language sample averaged 95 minutes. From an initial analysis of the morphosyntactic results, data from the literature are confirmed that LME (p=0.042) is not significant in representing syntactic complexity in preschool, instead the ratio of mono-bisyllabic words to total different words produced was found to be indicative of morphosyntactic development (p=0.02).

Nel contesto della valutazione linguistica, l'analisi del linguaggio assume un ruolo di primaria importanza, poiché permette di raccogliere informazioni dettagliate sulla produzione del linguaggio a vari livelli, compresi quelli morfo-sintattico e non solo. Gli attuali strumenti di valutazione indagano principalmente lo sviluppo morfo-sintattico prima dei 3 anni di età del bambino, mentre pochi test si concentrano sullo sviluppo in età prescolare. I metodi di valutazione in quest’età, tuttora in commercio, hanno molti limiti come i riferimenti normativi datati che non rispecchiano il lessico dei bambini di oggi, una fragilità di numerosità campionaria, la presenza di materiale figurato obsoleto e ambiguo, l’assenza di un costrutto psicometrico di base e forniscono scarsi indici in rapporto all’eccessivo dispendio temporale. L'impiego di software di analisi del linguaggio, come indicato dai dati riportati in letteratura (Pezold et al., 2020), è in grado di ridurre notevolmente i tempi di correzione, garantendo un'analisi rapida, automatizzata e sempre più accurata nel distinguere campioni di linguaggio patologici da quelli normativi (Bååth et al., 2019; Chojnicka & Wawer, 2020). Il progetto di ricerca che viene presentato si pone l’obiettivo di superare i limiti attuali dei test per la valutazione del linguaggio infantile, attraverso la creazione di uno strumento valutativo che permetta un’analisi specifica, approfondita e multilivello del linguaggio, basata su dati psicometrici solidi con materiale chiaro e moderno costruito ex novo. Lo studio, curato e promosso dalla Fondazione Paideia di Torino in collaborazione con l’Università degli Studi di Torino, consiste nella creazione, somministrazione e raccolta dati del nuovo test e la successiva analisi tramite uno specifico software denominato Talkidz con l’obiettivo finale di poter ottimizzare la diagnosi precoce dei disturbi di linguaggio espressivo in età evolutiva. Sono stati coinvolti 120 bambini frequentanti tre scuole dell'infanzia del Comune di Torino. Tra di essi, sono stati selezionati 102 bambini (62 maschi, 40 femmine) monolingui italiani con sviluppo tipico e senza disabilità intellettiva, lesioni neurologiche o problemi uditivi. L'età dei bambini selezionati è compresa tra i 42 e i 77 mesi. Essi hanno descritto ciò che succedeva in 42 immagini create seguendo i criteri specifici (Zmarich et al., 2012), l’esaminatore, precedentemente formato, ha evitato le domande intrusive che potessero indurre la sola denominazione, come "chi c'è?" o "che cos’è?" compromettendo così la validità del test. Per registrare la produzione del bambino, è stata utilizzata una webcam 5.0MP a risoluzione 1080p, in modo non invasivo. Dopo un’analisi acustica delle videoregistrazioni, l'operatore ha trascritto ortograficamente la produzione del bambino che è stata poi inserita ed elaborata dal software. Si sono così ricavati diversi parametri linguistici, come la distribuzione delle parole e della loro struttura, i dati morfosintattici, gli indici di variabilità lessicale, l’inventario fonetico e l’analisi in tratti e processi. Il tempo impiegato per la somministrazione del test e l’analisi del campione di linguaggio è in media di 95 minuti. Da una prima analisi dei risultati morfosintattici, si confermano i dati della letteratura per cui la LME (p=0.042) non è significativa a rappresentare la complessità sintattica in età prescolare, invece il rapporto tra le parole mono-bisillabiche e il totale delle parole diverse prodotte è risultato essere indicativo dello sviluppo morfo-sintattico (p=0.02).

Talkidz, software per l’analisi del linguaggio: dati di morfo-sintassi del campione in età prescolare

CAMPANA, VALERIA
2021/2022

Abstract

Nel contesto della valutazione linguistica, l'analisi del linguaggio assume un ruolo di primaria importanza, poiché permette di raccogliere informazioni dettagliate sulla produzione del linguaggio a vari livelli, compresi quelli morfo-sintattico e non solo. Gli attuali strumenti di valutazione indagano principalmente lo sviluppo morfo-sintattico prima dei 3 anni di età del bambino, mentre pochi test si concentrano sullo sviluppo in età prescolare. I metodi di valutazione in quest’età, tuttora in commercio, hanno molti limiti come i riferimenti normativi datati che non rispecchiano il lessico dei bambini di oggi, una fragilità di numerosità campionaria, la presenza di materiale figurato obsoleto e ambiguo, l’assenza di un costrutto psicometrico di base e forniscono scarsi indici in rapporto all’eccessivo dispendio temporale. L'impiego di software di analisi del linguaggio, come indicato dai dati riportati in letteratura (Pezold et al., 2020), è in grado di ridurre notevolmente i tempi di correzione, garantendo un'analisi rapida, automatizzata e sempre più accurata nel distinguere campioni di linguaggio patologici da quelli normativi (Bååth et al., 2019; Chojnicka & Wawer, 2020). Il progetto di ricerca che viene presentato si pone l’obiettivo di superare i limiti attuali dei test per la valutazione del linguaggio infantile, attraverso la creazione di uno strumento valutativo che permetta un’analisi specifica, approfondita e multilivello del linguaggio, basata su dati psicometrici solidi con materiale chiaro e moderno costruito ex novo. Lo studio, curato e promosso dalla Fondazione Paideia di Torino in collaborazione con l’Università degli Studi di Torino, consiste nella creazione, somministrazione e raccolta dati del nuovo test e la successiva analisi tramite uno specifico software denominato Talkidz con l’obiettivo finale di poter ottimizzare la diagnosi precoce dei disturbi di linguaggio espressivo in età evolutiva. Sono stati coinvolti 120 bambini frequentanti tre scuole dell'infanzia del Comune di Torino. Tra di essi, sono stati selezionati 102 bambini (62 maschi, 40 femmine) monolingui italiani con sviluppo tipico e senza disabilità intellettiva, lesioni neurologiche o problemi uditivi. L'età dei bambini selezionati è compresa tra i 42 e i 77 mesi. Essi hanno descritto ciò che succedeva in 42 immagini create seguendo i criteri specifici (Zmarich et al., 2012), l’esaminatore, precedentemente formato, ha evitato le domande intrusive che potessero indurre la sola denominazione, come "chi c'è?" o "che cos’è?" compromettendo così la validità del test. Per registrare la produzione del bambino, è stata utilizzata una webcam 5.0MP a risoluzione 1080p, in modo non invasivo. Dopo un’analisi acustica delle videoregistrazioni, l'operatore ha trascritto ortograficamente la produzione del bambino che è stata poi inserita ed elaborata dal software. Si sono così ricavati diversi parametri linguistici, come la distribuzione delle parole e della loro struttura, i dati morfosintattici, gli indici di variabilità lessicale, l’inventario fonetico e l’analisi in tratti e processi. Il tempo impiegato per la somministrazione del test e l’analisi del campione di linguaggio è in media di 95 minuti. Da una prima analisi dei risultati morfosintattici, si confermano i dati della letteratura per cui la LME (p=0.042) non è significativa a rappresentare la complessità sintattica in età prescolare, invece il rapporto tra le parole mono-bisillabiche e il totale delle parole diverse prodotte è risultato essere indicativo dello sviluppo morfo-sintattico (p=0.02).
Talkidz, language analysis software: morpho-syntax data of a preschool sample
In the context of language assessment, language testing assumes a major role, as it allows the collection of detailed information on language production at various levels, including morpho-syntactic and others. Current assessment tools mainly investigate morpho-syntactic development before the age of 3 years of a child, while few tests focus on development at preschool age. Assessment methods at this age, which are still on the market, have many limitations such as dated normative references that do not reflect the vocabulary of today's children, a fragility of sample size, the presence of outdated and ambiguous figurative material, the absence of a basic psychometric construct, and provide poor indices in relation to the excessive time expenditure. The use of language analysis software, as indicated by data reported in the literature (Pezold et al., 2020), can greatly reduce correction time, ensuring rapid, automated, and increasingly accurate analysis in distinguishing pathological from normative language samples (Bååth et al., 2019; Chojnicka & Wawer, 2020). The research project being presented aims to overcome the current limitations of child language assessment tests by creating an assessment tool that allows for specific, in-depth, multilevel analysis of language, based on solid psychometric data with clear, modern material built from scratch. The study, curated and promoted by the Paideia Foundation of Turin in collaboration with the University of Turin, consists of the creation, administration and data collection of the new test and its subsequent analysis using a specific software called Talkidz with the ultimate goal of being able to optimize the early diagnosis of expressive language disorders in developmental age. 120 children attending three preschools in the City of Turin were involved. Among them, 102 children (62 boys, 40 girls) monolingual Italians with typical development and without intellectual disability, neurological injury or hearing problems were selected. The age of the selected children ranged from 42 to 77 months. They described what was happening in 42 pictures created following specific criteria (Zmarich et al., 2012).The previously trained examiner avoided intrusive questions that could induce naming alone, such as "who is there?" or "what is it?" thus compromising the validity of the test. To record the child's output, a 5.0MP webcam at 1080p resolution was used noninvasively. After an acoustic analysis of the video recordings, the operator transcribed the child's production orthographically, which was then entered and processed by the software. Various linguistic parameters, such as the distribution of words and their structure, morphosyntactic data, lexical variability indices, phonetic inventory, and analysis into traits and processes, were thus derived. The time taken for test administration and analysis of the language sample averaged 95 minutes. From an initial analysis of the morphosyntactic results, data from the literature are confirmed that LME (p=0.042) is not significant in representing syntactic complexity in preschool, instead the ratio of mono-bisyllabic words to total different words produced was found to be indicative of morphosyntactic development (p=0.02).
IMPORT TESI SOLO SU ESSE3 DAL 2018
File in questo prodotto:
File Dimensione Formato  
Tesi di laurea-Valeria Campana.pdf

non disponibili

Dimensione 1.84 MB
Formato Adobe PDF
1.84 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/3577