Deepfakes are digitally manipulated artificial multimedia content created using generative artificial intelligence, in which subjects represented through images, videos, or audio have a different face, perform actions, or deliver speeches that have never actually taken place in reality. Starting with a historical analysis of multimedia manipulations, this study initially examines the period spanning from the early photographic retouching of the 19th century to the emergence of deepfakes, characterized by extreme realism, in the 21st century, proposing an investigation into the evolution of techniques and objectives throughout the history of content alteration. Moving into the specifics of the work conducted, the second chapter defines the concepts necessary to understand the topic, from the development of machine learning and artificial neural networks to deep learning and deep neural networks, and then analyses the structures and functioning of the main deep generative models which are used to generate deepfakes. Following that, an overview regarding the categorization of deepfake techniques is provided, from facial synthesis to voice conversion, in order to highlight the different results that can be achieved through such manipulations. The thesis sheds light on the increasingly advanced implementation of deep learning, which has opened the doors to a scenario of unprecedented potential and challenges in the field of content alteration, with implications as promising as alarming. The third chapter aims to outline the multiple aspects of deepfake usage, exploring both negative and positive perspectives that arise from their application, such as the threat of misinformation and damage to personal identity integrity, in contrast to the exciting opportunities in the fields of entertainment and education, where new forms of storytelling and expression come to life. The final chapter, in conclusion, emphasizes the institutional, ethical, and social implications determined by the growing prevalence of artificial content synthesis. Considering this, legislative measures adopted worldwide to address the studied consequences are evaluated, before examining the possible implications on society and on the perception of reality in relation to what is artificial. ​

I deepfake sono contenuti multimediali artificiali manipolati digitalmente mediante l’intelligenza artificiale generativa, in cui i soggetti rappresentati tramite immagini, video o audio, presentano un altro volto, oppure eseguono azioni o pronunciano discorsi che non hanno mai avuto luogo realmente. Partendo da un’analisi storica delle manipolazioni multimediali, il presente studio prende inizialmente in esame il periodo che intercorre tra i primi ritocchi fotografici del XIX secolo e l’avvento dei deepfake, caratterizzati da un’estrema realisticità, nel XXI, proponendo un’indagine sull’evoluzione delle tecniche e degli obiettivi nel corso della storia dell’alterazione dei contenuti. Entrando nello specifico del lavoro svolto, all’interno del secondo capitolo si definiscono i concetti utili alla comprensione dell’argomento, dallo sviluppo del machine learning e delle reti neurali artificiali al deep learning e alle reti neurali profonde, per poi analizzare le strutture e il funzionamento dei principali modelli generativi profondi utilizzati per la generazione dei deepfake. In seguito, si propone una panoramica riguardo alla suddivisione in categorie delle tecniche deepfake, dalla sintesi facciale alla conversione vocale, al fine di evidenziare i differenti risultati che possono essere ottenuti attraverso tali manipolazioni. La tesi ha gettato luce sull’implementazione sempre più avanzata del deep learning, che ha aperto le porte a uno scenario di potenzialità e sfide senza precedenti nell’ambito dell’alterazione dei contenuti, con implicazioni tanto promettenti quanto allarmanti. Il terzo capitolo propone di tracciare un quadro delle molteplici sfaccettature dell’utilizzo dei deepfake, sondando le prospettive sia negative e sia positive che emergono dal loro impiego, come la minaccia della disinformazione e il danneggiamento dell’integrità dell’identità personale, in contrasto con le entusiasmanti opportunità nei campi dell’intrattenimento e dell’educazione, dove nuove forme di narrazione ed espressione prendono vita. L’ultimo capitolo, infine, pone l’accento sulle implicazioni istituzionali, etiche e sociali determinate dalla crescente diffusione della sintesi artificiale dei contenuti. Alla luce di ciò, si valutano i provvedimenti legislativi adottati nel mondo per far fronte alle conseguenze studiate, per poi sondare i possibili risvolti sulla società e sulla percezione della realtà rispetto a ciò che è artificiale.

Tra realtà ingannevoli e nuove forme di espressione: analisi e tecnica del deepfake.

PUSCEDDU, ALICE
2022/2023

Abstract

I deepfake sono contenuti multimediali artificiali manipolati digitalmente mediante l’intelligenza artificiale generativa, in cui i soggetti rappresentati tramite immagini, video o audio, presentano un altro volto, oppure eseguono azioni o pronunciano discorsi che non hanno mai avuto luogo realmente. Partendo da un’analisi storica delle manipolazioni multimediali, il presente studio prende inizialmente in esame il periodo che intercorre tra i primi ritocchi fotografici del XIX secolo e l’avvento dei deepfake, caratterizzati da un’estrema realisticità, nel XXI, proponendo un’indagine sull’evoluzione delle tecniche e degli obiettivi nel corso della storia dell’alterazione dei contenuti. Entrando nello specifico del lavoro svolto, all’interno del secondo capitolo si definiscono i concetti utili alla comprensione dell’argomento, dallo sviluppo del machine learning e delle reti neurali artificiali al deep learning e alle reti neurali profonde, per poi analizzare le strutture e il funzionamento dei principali modelli generativi profondi utilizzati per la generazione dei deepfake. In seguito, si propone una panoramica riguardo alla suddivisione in categorie delle tecniche deepfake, dalla sintesi facciale alla conversione vocale, al fine di evidenziare i differenti risultati che possono essere ottenuti attraverso tali manipolazioni. La tesi ha gettato luce sull’implementazione sempre più avanzata del deep learning, che ha aperto le porte a uno scenario di potenzialità e sfide senza precedenti nell’ambito dell’alterazione dei contenuti, con implicazioni tanto promettenti quanto allarmanti. Il terzo capitolo propone di tracciare un quadro delle molteplici sfaccettature dell’utilizzo dei deepfake, sondando le prospettive sia negative e sia positive che emergono dal loro impiego, come la minaccia della disinformazione e il danneggiamento dell’integrità dell’identità personale, in contrasto con le entusiasmanti opportunità nei campi dell’intrattenimento e dell’educazione, dove nuove forme di narrazione ed espressione prendono vita. L’ultimo capitolo, infine, pone l’accento sulle implicazioni istituzionali, etiche e sociali determinate dalla crescente diffusione della sintesi artificiale dei contenuti. Alla luce di ciò, si valutano i provvedimenti legislativi adottati nel mondo per far fronte alle conseguenze studiate, per poi sondare i possibili risvolti sulla società e sulla percezione della realtà rispetto a ciò che è artificiale.
ITA
Deepfakes are digitally manipulated artificial multimedia content created using generative artificial intelligence, in which subjects represented through images, videos, or audio have a different face, perform actions, or deliver speeches that have never actually taken place in reality. Starting with a historical analysis of multimedia manipulations, this study initially examines the period spanning from the early photographic retouching of the 19th century to the emergence of deepfakes, characterized by extreme realism, in the 21st century, proposing an investigation into the evolution of techniques and objectives throughout the history of content alteration. Moving into the specifics of the work conducted, the second chapter defines the concepts necessary to understand the topic, from the development of machine learning and artificial neural networks to deep learning and deep neural networks, and then analyses the structures and functioning of the main deep generative models which are used to generate deepfakes. Following that, an overview regarding the categorization of deepfake techniques is provided, from facial synthesis to voice conversion, in order to highlight the different results that can be achieved through such manipulations. The thesis sheds light on the increasingly advanced implementation of deep learning, which has opened the doors to a scenario of unprecedented potential and challenges in the field of content alteration, with implications as promising as alarming. The third chapter aims to outline the multiple aspects of deepfake usage, exploring both negative and positive perspectives that arise from their application, such as the threat of misinformation and damage to personal identity integrity, in contrast to the exciting opportunities in the fields of entertainment and education, where new forms of storytelling and expression come to life. The final chapter, in conclusion, emphasizes the institutional, ethical, and social implications determined by the growing prevalence of artificial content synthesis. Considering this, legislative measures adopted worldwide to address the studied consequences are evaluated, before examining the possible implications on society and on the perception of reality in relation to what is artificial. ​
IMPORT DA TESIONLINE
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/106452