top of page

Progetto VALIS: un’indagine computazionale sul linguaggio religioso di Philip K. Dick

“VALIS – Vast Active Intelligent System. […] Simbolo del pesce, Cristiani. Vestito di vecchia moda sulla donna. Disfunzione temporale. […] Tempo e spazio per VALIS non avevano nessun valore. […] Sembrava avere potere assoluto su di noi.”

Estratti da VALIS


“Voglio dire, in fine dei conti, dovete sempre pensare che siamo solo fatti di polvere…”

Incipit di Le tre stimmate di Palmer Eldritch


È sotto gli occhi di chiunque abbia mai letto Philip K. Dick che la sua scrittura viri fortemente verso un senso religioso e una ricerca del divino. Lui e Frank Herbert sono probabilmente gli scrittori cardine del filone “spirituale” della fantascienza contemporanea. Ma si parla sempre molto sommessamente della chiara ispirazione religiosa in Dick, preferendo coglierne gli aspetti più secolari, che hanno avuto grande successo nella cultura pop: i mondi fantapolitici (La svastica sul sole e L’uomo nell’alto castello), la distopia e gli utilizzi della cyber-security (Minority Report), il rapporto esistenziale fra umani e androidi (Il cacciatore di androidi, da cui Blade Runner), la questione della realtà e il problema del materiale-artificiale come strumento di controllo (il fortunatissimo concetto di Matrix), fino al ruolo delle droghe e degli stati mentali alterati, di matrice beat e punk, come strumenti di libertà individuale (Un oscuro scrutare).

Parlare di ispirazione e individuare precisamente come tale influenza si sostanzi nella lingua sono due cose molto differenti. Eppure, la matrice religiosa e spirituale in Dick è preponderante: qualsiasi introduzione all’autore prima o poi indicherà il valore centrale di scritti religiosi nella produzione dickiana, la monumentale raccolta di riflessioni teologiche confluita nell’Esegesi conclusa nel 1982, e della sua esperienza “mistica” del 1974, dopo la quale la sua scrittura risultò ancora più impregnata di tematiche spirituali. Si citeranno la Bibbia, gli scritti dei Padri della Chiesa, la metafisica di Platone, Aristotele, Spinoza e Cartesio, ma anche e soprattutto qualcosa di cui non si parla spesso, se non con diffidenza: gli scritti apocrifi, il corpus gnostico, la produzione ermetica, il neoplatonismo misterico e iniziatico.


La nostra domanda, dunque, è semplice: tutto ciò è effettivamente poi confluito nella lingua e nello stile di Dick? O si tratta solo di una vaga influenza di cui si parla più per dovere bio-bibliografico, nei confronti di un autore che ha sempre dimostrato un interesse verso un certo filone di studi, ma niente più? Per rispondere a ciò e individuare con esattezza i punti fisici di sovrapposizione, ci siamo avvalsi di un’ampia strumentazione informatica (Natural Language Processing, Machine Learning ed AI) che ricade sotto l’ampio cappello degli Studi Letterari Computazionali.


Questo è il resoconto di un’indagine.





Fascicolo n. 1: prima raccolta indiziaria


Prima di tutto, ci servivano indizi. Dovevamo cominciare da qualche parte, per cui abbiamo condotto la prima indagine ad ampio spettro.

Abbiamo iniziato con una raccolta di dati. Abbiamo preparato un corpus (insieme di testi) abbastanza variegato, che comprendesse:

● Gruppo di test - Opere di Dick pre- e post- 1974. I testi pre-1974 come controprova, pur sempre pregni di religione e spiritualità come da archetipo dickiano, sarebbero dovuti essere comunque meno marcati in queste tematiche e nel relativo linguaggio.

● Gruppo di riferimento – Corpus gnostico/apocrifo/ermetico. Abbiamo raccolto una vasta collezione di testi apocrifi di Nuovo e Antico Testamento, l’intero Corpus Hermeticum di Ermete Trismegisto, testi spuri dell’ermetismo antico e medievale, la gran parte del corpus gnostico, compresi testi di Nag Hammadi, gnosticismo copto, gnosticismo valentiniano, papiri esseni di Qumran e in generale testi fondamentali per la corrente gnostica; infine, abbiamo inserito anche Antico e Nuovo Testamento (nella versione King James Bible, lo standard nel mondo anglosassone) e le Enneadi di Plotino, autore di fondamentale importanza nello sviluppo dello gnosticismo.

● Gruppo di controllo – Corpus letterario di XIX-XX secolo. Come ulteriore controllo e controprova, abbiamo inserito testi (da Fitzgerald, Hemingway, Doyle, Thackeray, Stevenson, Trollope, Foster Wallace e Conrad) che non dovrebbero avere nulla a che fare con l’ispirazione religiosa gnostico-apocrifa. Se questi testi non avessero mostrato alcuna relazione col gruppo di riferimento, allora il nostro metodo si sarebbe mostrato corretto.


Un totale di 71 testi per 5 milioni e mezzo di parole. L’indagine si prospettava faticosa.


Abbiamo poi proceduto con la definizione della prima metodologia.

La scelta è ricaduta sulla Stilometria, un insieme di tecniche di Deep Learning e Machine Learning che prendono in considerazione lo stile di un gruppo di autori inteso come la presenza, la quantità e la modulazione lungo il testo, di connettivi testuali (in inglese: function words), quegli “agenti invisibili del linguaggio” che legano la sintassi di un testo: congiunzioni, subgiunzioni, avverbi, esclamazioni. Tutto ciò che non vi è di puramente “semantico” in un testo letterario. Con questa prima esplorazione speravamo così di catturare un’immagine precisa dell’influenza di testi gnostico-apocrifi sullo stile di Dick.

Abbiamo testato numerosi algoritmi di “Delta” (la distanza matematica, geometrica e statistica fra elementi testuali), accordandone i parametri lungo diversi test. I risultati non sono stati molto incoraggianti. Da una prima Cluster Analysis [fig.1] (un algoritmo che permette di raggruppare testi in base alla loro somiglianza stilistica) è emersa una quasi totale estraneità di Dick nei confronti di testi religiosi, mentre è stato raggruppato coi suoi colleghi dell’8-900, come sarebbe corretto aspettarsi.


Abbiamo poi cambiato la Delta distance, la metodologia di raggruppamento, da una classica basata sulla distanza geometrica in uno spazio vettoriale a diverse matematico-statistiche che sottintendono algoritmi molto differenti (abbiamo provato, nello specifico, dal campo del Machine Learning: Nearest Shrunken Centroids e Support Vector Machine). I risultati stavolta hanno rivelato una tenue pista indiziaria [fig. 2, fig. 3]: tentando prima rapporti di somiglianza fra il solo corpus dickiano e quello gnostico-apocrifo, e poi inserendo i nostri gruppi di controllo (a cui abbiamo aggiunto un piccolo gruppo di opere shakespeariane, per buona misura), i primi, flebili, segnali di connessione sono emersi. Dalla figura 2 si evidenzia qualche sporadica vicinanza fra romanzi di Dick (per la maggior facenti parte dell’ultimo periodo, come Vulcan’s Hammer, The divine Invasion e The Transmigration of Timothy Archer); dall’altro lato si può notare dalla figura 3 che i cluster sono ben definiti: i due gruppi di controllo che abbiamo inserito (autori dell’8-900 e Shakespeare) non mostrano alcun tipo di somiglianza stilistica col corpus gnostico-apocrifo, mentre l’unico contatto con quest’ultimo è proprio Dick, seppur in sporadici segnali provenienti da The Divine Invasion e Timothy Archer. Il nostro algoritmo dunque funzionava, ma non aveva dato risultati evidenti.





Fascicolo n. 2: seguire la pista


Una pista c’era, per quanto esile. E dunque, dai nostri primi tentativi, abbiamo proceduto con esperimenti più mirati e sicuri, nella metodologia e nell’oggetto studiato.

Come nuovo passo, abbiamo optato per una misura differente, presa dal campo dell’Information Retrieval (minare un testo per estrarre informazioni utili): la Somiglianza del Coseno. Una metrica che, in breve, trasforma ogni parola di un testo in un vettore (dimensione matematica) in uno spazio geometrico, assegnandogli un valore numerico; ogni vettore occupa una dimensione, dunque l’oggetto finale sarà un enorme spazio n-dimensionale, dove n corrisponde a ogni parola-vettore nel corpus analizzato (nel nostro caso: più di cinque milioni). La distanza geometrica fra questi vettori nello spazio è la distanza computata, fra le parole [fig. 5]. Nel nostro caso, abbiamo accordato ulteriormente i parametri, eliminando dal corpus le function words che erano state centrali in precedenza, forzando dunque la nostra metodologia ad analizzare solo le parole “semantiche” dei nostri testi.

Una tecnica semplice ma efficace, già utilizzata con grande successo in passato da altri indagatori per differenti indagini per determinare la somiglianza fra documenti, per cui più di un caso è stato risolto e archiviato grazie ad essa.


Eppure, ancora nessun risultato eclatante. Nessuna prova definitiva. Come si può vedere dalla fig. 4, dove la somiglianza è espressa da una scala matematica da -1 a +1 (con corrispettiva gradazione di colore, da più scura a più chiara), non si evince nessuna particolare somiglianza fra i testi di Dick e il corpus gnostico-apocrifo, se posti in relazione alle somiglianze fra i testi degli autori dell’8-900 e lo stesso corpus gnostico-apocrifo: entrambi mostrano una media di somiglianza del coseno fra 0 e 0.6, senza particolari guizzi. Dick non mostra una somiglianza superiore rispetto ad autori come Hemingway o Fitzgerald. Che tale metodologia ci abbia fornito risultati troppo generalizzati? In fondo si tratta di una metrica ad ampio spettro, che prende in considerazione ogni parola del corpus: il livello medio di somiglianza può essere dunque dovuto a svariati fattori, su tutti la diversa lunghezza dei testi (alcuni brevissimi, come le Apocalissi apocrife, e alcuni molto lunghi, come Wallace e Hemingway), per cui l’incidenza delle parole più frequenti, e dunque i vettori più lunghi, è decisamente squilibrata fra i diversi campioni; o anche solo alla generale incidenza di parole comuni nel linguaggio contemporaneo (fra tutti, lessico tecnologico), non presenti in quello tardoantico, e viceversa.


Col morale basso, abbiamo deciso di proseguire in un ultimo tentativo, impiegando una tecnica mista ma applicata più da vicino sui testi. Abbiamo nuovamente invocato un algoritmo di Machine Learning (NSC, Nearest Shrunken Centroids), indipendente dal contesto, su un’analisi sequenziale: la base, il corpus dickiano; il test, il corpus gnostico-apocrifo. La metodologia alla base implementa un modello “continuous-bag-of-words” (CBOW), per cui la macchina estrae automaticamente elementi caratteristici (features) da una parola sorgente, assegnandole un peso e valutando globalmente solo quelle di peso maggiore, mettendo poi ogni parola pesata in relazione con la somma generale di parole. Una tecnica di grande efficacia e precisione, che tenta di derivare la possibile relazione di una parola con un’altra in base al contesto, invece di risultarne indipendente.


Prendiamo in analisi la fig. 6, dove la linea orizzontale è il corpus dickiano e i diversi colori le parole target più votate dall’algoritmo, provenienti dai diversi testi del corpus gnostico-apocrifo (in classifica dal basso verso l’alto, come mostrato a destra). Lo spessore della linea è abbastanza contenuto, e dimostra ancora una volta una somiglianza molto vaga fra Dick e il corpus di riferimento, mentre sembra esserci una preferenza abbastanza chiara per alcuni testi gnostico-apocrifi: il Discorso sull’Ottavo e il Nono e il Giovanni Segreto (o Apochryphon) per i testi pre-74, ed Eugnostos e Corpus Hermeticum, con una continua presenza dell’Apochryphon di Giovanni, per i testi tardi, post-74.

Ancora una volta, risultati poco incoraggianti. La linea orizzontale, che mostra l’affidabilità delle sovrapposizioni testuali, è troppo esile per poter dare indizi definitivi, e le preferenze per alcuni testi, in questo frangente, di per sé non significano nulla.

A questo punto dell’indagine ci ritrovavamo col morale azzerato, poco convinti della bontà del nostro indagare, senza piste né prove schiaccianti.





Fascicolo n. 3: la svolta e la sentenza


Eppure doveva pur esserci una prova, da qualche parte. I nostri tentativi non dovevano essere vani, doveva esistere una leva che permettesse di scardinare questo mistero. Tale stoica convinzione veniva soltanto acuita dal ritrovamento di reperti in forma di stralci di interviste a Dick, in cui l’autore confermava ogni sospetto. Fra tutte, una edita postuma contenuta in un volume di studi letterari e filosofici su Dick[1]: “Ed eccomi qua, non faccio nulla tutto il giorno se non leggere la Bibbia, Gli Apocrifi, testi gnostici, storie sul Cristianesimo. Ti dico, potrei prendermi una laurea in teologia!”.


Ci siamo perciò messi a ripensare al nostro percorso indiziario. Cosa hanno dimostrato le indagini finora? Che non ci sono prove del possibile contatto fra Dick e la scrittura esoterica gnostico-apocrifa?

No. Dimostrano che non ci sono prove nella modalità e nel campo specifico in cui stiamo indagando. Vale a dire:

a) Lo stile di Dick non è direttamente influenzato da quello degli scritti religiosi di riferimento

b) Non ci sono sovrapposizioni testuali, cioè Dick non riutilizza direttamente materiale gnostico-apocrifo nei suoi romanzi.

E qui ci ha colpito l’illuminazione. Le somiglianze e le sovrapposizioni, i punti di contatto fra i due mondi, sono sempre da ricercare nel testo, ma non nelle parole. Sono da ricercare nelle idee.

Anche se Dick non riutilizza direttamente stilemi, espressioni, parole chiave, o non cita passi da scritti religiosi, non significa comunque che i suoi testi non siano pregni di concetti gnostici ed ermetici. E i concetti si possono esprimere in innumerevoli modi differenti, spesso anche non consequenziali, non cristallizzati in gruppi di parole, ma fluidi, lungo più frasi e paragrafi.

Ecco la nostra pista, finalmente! Dovevamo seguire questa intuizione fino in fondo.


Ma come si tracciano idee e concetti? Questa era diventata la nuova sfida. Ci è venuta a quel punto in aiuto una metodologia chiamata Topic Modelling, modellizzazione di argomenti o concetti. Abbiamo così impiegato un algoritmo di LSA (Analisi Semantica Latente), che permette di comparare relazioni fra testi e i termini inclusi in essi producendo un gruppo di concetti a cui tali termini fanno riferimento: un’astrazione del testo, e delle parole che lo compongono, ai suoi concetti più generali (i topic), lungo spazi testuali molto ampi e inconsequenziali.

Abbiamo tirato un sospiro di sollievo e ci siamo sciolti in un sorriso. I risultati sono stati incredibilmente puntuali e decisivi. Il nostro algoritmo ha individuato, nei romanzi di Dick, molti topic cluster (gruppi di concetti con le parole chiave che li compongono e concorrono assieme nello stesso spazio testuale) afferenti a modelli religiosi apocrifi, e in particolare gnostici. Basterà analizzarne qualcuno, per fornire le prove schiaccianti di cui siamo in cerca.


● Cluster 1 – dio, yah, belial, torah, tetragrammaton.

È chiara l’influenza veterotestamentaria, in particolare nella versione apocrifo-cabalistica copta, dove Yah (o Jah) è il nome di Dio, mentre Belial è la figura cabalistica dell’anti-Dio, dell’archetipo demoniaco dell’uomo iniquo, senza qualità, che tenta di sostituirsi a Dio, rappresentando dunque la negazione dell’umano e il demoniaco.

● Cluster 2 – valis, uno, visione, vista, occhi, logos, nous, cerchio

Ecco l’influenza plotiniana, che Dick esplicita a più riprese nelle sue interviste, chiara come il sole. Valis come costrutto è descritto sempre come un occhio, un dispositivo di controllo (un satellite), dunque legato alla vista. Così come viene espresso nell’Uno divino plotiniano, dove la percezione e la vista sono sia positive (superare il velo della materialità per raggiungere la Divina Conoscenza) che negative (la percezione delle cose terrene vela l’Idea della cosa in sé che sta dietro gli oggetti). Valis è Dio, è l’uno, l’ordine, il Logos, la Nous (la mente), il “tutto riunito della bellezza”, e l’esistenza si emana per cerchi concentrici dall’Uno come le onde radio del satellite-Valis.

● Cluster 3 – anokhi, signorina, ginevra, marsha, janet, fran, vergine

Anokhi, rafforzativo dell’ebraico “ani”, io, me stesso, l’attributo divino con cui Dio parla a Mosè sul Sinai per dettargli le Tavole della Legge. E nel centrale racconto gnostico del Tuono, o la Mente Perfetta, ri-narrazione della teodicea divina sul Sinai, la figura divina viene presentata come femminile, di voce virginea.

● Cluster 4 – dio, morte, angelo, disse, corpo, zadokita, fato, israele, episcopale, cristo

Si tratta della reinterpretazione tutta dickiana, e del suo personaggio Timothy Archer, vescovo, della divinità, secondo i canoni gnostici: il Dio nascosto, che tenta di recuperare mangiando un corpo di Cristo allucinogeno (il fungo zadokita). E il mantra del protagonista: “trova Dio”.

● Cluster 5 – sophia, salvatore, figlio, unità, uno, cristo, respiro

Ripercorre qui un mito centrale dello gnosticismo, il mito di Sophia, sorella e sposa dell'arconte Cristo (figlio), emanazione della saggezza divina (pleroma) che infonde negli uomini la propria scintilla (pneuma o gnosi, il respiro divimo) che li rende coscienti dell'inganno del mondo e riaccende in loro il desiderio di ricongiungersi con l'Uno, Dio, oltre il velo delle cose terrene.

● Cluster 6 - giudice, controllo, yaldabaoth, droga, legge

Il “cluster degli arconti”, creature divine interposte fra Dio e la terra, e che controllano l’esistenza materiale. Yaldabaoth è il primo arconte, esistente prima di Dio, e primario ostacolo contro il raggiungimento della gnosi da parte dell’uomo (e dunque rappresentato dal potere opprimente della legge umana, l’Occhio nel cielo che controlla l’esistenza terrestre). La droga, come fu per Timothy Archer nello zadokita, il fungo allucinogeno contente il corpo di Cristo, è tramite per la liberazione.


Ecco le prove che cercavamo. Schiaccianti, testuali, definitive. Il punto di contatto fra Dick e il linguaggio religioso gnostico, ermetico, cabalistico, neoplatonico. Dick è dunque uno scrittore profondamente influenzato da tali correnti, non nello stile, ma nei concetti; ora lo si può affermare per certo, con prove definitive a sostegno, e non solo come la vaga influenza di letture personali.

Certo ci potrebbero essere innumerevoli altre prove a carico, ma basta questa esile manciata a inchiodare la questione sulla pietra. Se in futuro qualcun altro vorrà rimettere mano al caso, dovrà sostenere gli oneri di prove ancora più schiaccianti e metodologie sempre più complesse. Per ora, noi, questo caso, lo diremo chiuso.


---


Nota finale


Per i più curiosi, i più appassionati alla tecnica, o per i più ficcanaso, che volessero constatare e confermare che tutto ciò è stato veramente fatto e non è puro prodotto di fantasia, oltre che per amore di riproducibilità scientifica, ecco il link alla nostra repository dove è tutto contenuto: il corpus coi testi, il codice scritto per le analisi.


 

[1] “Philip K. Dick on Philosophy: A Brief Interview,” in The Shifting Realities of Philip K. Dick: Selected Literary and Philosophical Writings, ed. Lawrence Sutin. New York: Pantheon Books, 1995.

bottom of page