The new paradigm of low-code or zero-code platforms, even if the scientist has low or null programming skills, allows to prepare quite sophisticated tools for data analysis. The present work is partially focused on new predictive models inspired by machine learning paradigm, reviewing data acquired in the past and now available as open source, with the aim to shed light on possible relationship between easily accessible experimental parameters or in silico descriptors. A well-tempered subset of data extracted from training/test set adopted in the machine leaning based models, along with unpublished results regarding liposomes with similar characteristics, were then adopted to explore one of the most popular Design of Experiments techniques, with the aim of detect a robust and self-consistent workflow able to capture the relevant role of computational tools in drug carriers design. Another relevant goal of the study is to use open-source software or platforms, able to assist scientist in the design, in order to demonstrate that possible relevant improvement can be reached free of charge. Results show that machine learning software can be employed in early stage of experiments to analyze acquired data and develop new algorithm to predict different precious variables, like drug loading into the carriers or their stability. Several models, based on Random Forest and Gradient Boosted algorithm apparently turned out to be efficient predictor of highly loaded liposome, whereas a posteriori analyses, based on 2k factorial design, strongly address toward a rational design of successful liposome, rationalizing the preliminary stage of experimental variables selection.

La presenza di nuove piattaforme low-code o zero-code, sebbene gli scienziati abbiano ridotte o nulle capacità di programmazione, permette di creare sofisticati strumenti per l’analisi dei dati. Il presente lavoro è parzialmente focalizzato su nuovi modelli predittivi ispirati al paradigma del machine learning, riesaminando i dati acquisiti in passato o ora disponibili come open source, con lo scopo di fare chiarezza su possibili relazioni tra parametri sperimentali facilmente accessibili o descrittori. Un sottoinsieme di dati estratti da training e test set usati nei modelli di machine learning, insieme a dati inediti riguardanti liposomi con simili caratteristiche, sono stati utilizzati per indagare una delle tecniche più popolari di Design of experiments¸ con lo scopo di trovare un flusso robusto che permettesse di catturare il ruolo rilevante di strumenti computazionali del design di drug carrier. Un altro obiettivo importante dello studio è l’utilizzo di software o piattaforme open source¸in grado di assistere gli scienziati nel design, in modo da dimostrare che importanti miglioramenti possono essere raggiunti senza elevati costi. I risultati dimostrano che i software di machine learning possono essere impiegati nelle prime fasi di sperimentazione per analizzare i dati acquisiti e sviluppare nuovi algoritmi per predire diverse importanti variabili, come il caricamento dei principi attivi all’interno dei carrier o la loro stabilità. Molti modelli, basati sugli algoritmi Random Forest e Gradient Boosted sembrano essere predittori efficienti di liposomi con alti livelli di caricamento, mentre un’analisi a posteriori, basata su disegno fattoriale 2k, indirizza fortemente verso un design razionale di successo dei liposomi, razionalizzando gli step iniziali di selezione delle variabili.

Disegno degli esperimenti e metodi basati sull'apprendimento automatico: un drug carrier di successo rivisitato usando nuovi strumenti di analisi dei dati ​

ANTONUCCI, ALICE
2021/2022

Abstract

La presenza di nuove piattaforme low-code o zero-code, sebbene gli scienziati abbiano ridotte o nulle capacità di programmazione, permette di creare sofisticati strumenti per l’analisi dei dati. Il presente lavoro è parzialmente focalizzato su nuovi modelli predittivi ispirati al paradigma del machine learning, riesaminando i dati acquisiti in passato o ora disponibili come open source, con lo scopo di fare chiarezza su possibili relazioni tra parametri sperimentali facilmente accessibili o descrittori. Un sottoinsieme di dati estratti da training e test set usati nei modelli di machine learning, insieme a dati inediti riguardanti liposomi con simili caratteristiche, sono stati utilizzati per indagare una delle tecniche più popolari di Design of experiments¸ con lo scopo di trovare un flusso robusto che permettesse di catturare il ruolo rilevante di strumenti computazionali del design di drug carrier. Un altro obiettivo importante dello studio è l’utilizzo di software o piattaforme open source¸in grado di assistere gli scienziati nel design, in modo da dimostrare che importanti miglioramenti possono essere raggiunti senza elevati costi. I risultati dimostrano che i software di machine learning possono essere impiegati nelle prime fasi di sperimentazione per analizzare i dati acquisiti e sviluppare nuovi algoritmi per predire diverse importanti variabili, come il caricamento dei principi attivi all’interno dei carrier o la loro stabilità. Molti modelli, basati sugli algoritmi Random Forest e Gradient Boosted sembrano essere predittori efficienti di liposomi con alti livelli di caricamento, mentre un’analisi a posteriori, basata su disegno fattoriale 2k, indirizza fortemente verso un design razionale di successo dei liposomi, razionalizzando gli step iniziali di selezione delle variabili.
ENG
The new paradigm of low-code or zero-code platforms, even if the scientist has low or null programming skills, allows to prepare quite sophisticated tools for data analysis. The present work is partially focused on new predictive models inspired by machine learning paradigm, reviewing data acquired in the past and now available as open source, with the aim to shed light on possible relationship between easily accessible experimental parameters or in silico descriptors. A well-tempered subset of data extracted from training/test set adopted in the machine leaning based models, along with unpublished results regarding liposomes with similar characteristics, were then adopted to explore one of the most popular Design of Experiments techniques, with the aim of detect a robust and self-consistent workflow able to capture the relevant role of computational tools in drug carriers design. Another relevant goal of the study is to use open-source software or platforms, able to assist scientist in the design, in order to demonstrate that possible relevant improvement can be reached free of charge. Results show that machine learning software can be employed in early stage of experiments to analyze acquired data and develop new algorithm to predict different precious variables, like drug loading into the carriers or their stability. Several models, based on Random Forest and Gradient Boosted algorithm apparently turned out to be efficient predictor of highly loaded liposome, whereas a posteriori analyses, based on 2k factorial design, strongly address toward a rational design of successful liposome, rationalizing the preliminary stage of experimental variables selection.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
840329_design_of_experiments_and_machine_learning_in_life_science_a_successful_drug_carrier_revisited_using_modern_data_analysis_tools.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 4.55 MB
Formato Adobe PDF
4.55 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/37612