Innumerevoli progetti di ricerca, anche di notevoli dimensioni e a tutti i livelli istituzionali, hanno collezionato banche dati molto ricche. Benché non si sia ancora raggiunto il momento in cui si possa parlare di Big Data nelle Digital Humanities, le basi di sapere sviluppate fino ad ora nel campo delle discipline umanistiche rappresentano una nuova sfida per coloro che intendono analizzarle allo scopo di effettuare ricostruzioni ed argomentazioni storiche. Si tratta in effetti di dataset caratterizzati da molte dimensioni, cioè da un numero molto alto di tipi di dati connessi gli uni agli altri in molteplici modi, attraverso un grande collezione di attributi utilizzati per definire ogni singolo data point.
Un importante sviluppo avvenuto nell’ambito delle Digital Humanities, per rendere questi dataset più accessibili alla ricerca, concerne tecnologie realizzate allo scopo di visualizzare e dunque esplorare i dati acquisiti. Molto spesso sono tecniche di visualizzazione geo-temporale che permettono di acquisire un’idea iniziale sull’andamento dei dati nel tempo e, se necessario, nello spazio.
Esistono anche modalità di visualizzazione più astratte, allo scopo di esplorare le distribuzioni dei dati e giungere ad un’idea complessiva delle loro interconnessioni (Valleriani et al. 2023). Da qui, è stato breve il passaggio ad un approccio matematico attraverso l’utilizzo di tecniche per l’analisi dei network.
Ma facciamo una premessa, per introdurre il progetto di studi storici “The Sphere. Knowledge System Evolution and the Shared Scientific Identity of Europe”, svolto con l’Intelligenza Artificiale, per capire come sistemi intelligenti in futuro permetteranno di analizzare e di “interpretare” le genealogie tra le fonti storiche, supportando così il lavoro dello storico attraverso ipotesi basate su correlazioni che, vagliate, possono permettere le ricostruzioni storiche. Utilizzando tecniche che spaziano dal Machine Learning al Deep Learning, fino a XAI.
Digital Humanities: verso i big data nella ricerca storica
La quantificazione delle fonti storiche ancora inesplorate e preservate negli archivi e delle biblioteche è sostanzialmente impossibile ma probabilmente ci si aggira tra il 70 e l’80 percento.
Anche prendendo in considerazione solamente le fonti storiche che sono state
digitalizzate e messe a disposizione attraverso Internet durante gli ultimi vent’anni, il
numero di fonti disponibili per la ricerca storica eccede di gran lunga le capacità d’analisi degli storici professionisti i quali utilizzano il classico approccio del “close reading”: lettura e annotazione.
La prima conseguenza del processo di digitalizzazione eseguito dalle istituzioni, atte alla preservazione della memoria storica, è stata la nascita della disciplina Digital Humanities. Attraverso i suoi più recenti sviluppi e soprattutto grazie alla diffusione delle tecnologie semantiche, siamo ora in grado di amministrare una grande quantità di fonti storiche, spesso organizzate in collezioni, e di dati, siano questi metadati di carattere bibliografico o dati estratti attraverso l’esame dei contenuti delle fonti stesse (Kräutli and Valleriani 2018; El- Hajj and Valleriani 2021).
Computational History
L’introduzione della Network Analysis nelle scienze storiche ha rappresentato il primo
passo verso la creazione di una nuova disciplina, fondata sulla Digital Humanities ma anche distinta da essa e che oggi viene sempre più spesso denominata Computational History.
Da diversi anni si è consolidata una comunità di storici specializzati nei più diversi campi di ricerca, ma che hanno in comune l’idea di analizzare i dataset applicando precetti e metodi della Network Analysis. Solitamente si tratta di metodi utilizzati e sviluppati inizialmente nell’ambito della sociologia e dunque di Social Network Analysis. Ma più recentemente e, a causa della multidimensionalità dei dataset, anche tecniche d’analisi tipiche della fisica dei sistemi complessi sono state implementate con successo.
Sono nate riviste specializzate, come per esempio il Journal of Historical Network Research. Alcuni progetti, per essere in grado di raggiungere gli scopi storico-investigativi prefissati, continuano a sviluppare nuove metodologie e approcci,
spostando quasi ininterrottamente le frontiere della Computational History.
Il progetto
Il progetto “The Sphere. Knowledge System Evolution and the Shared Scientific Identity of Europe” mira allo studio dell’evoluzione del sapere scientifico durante il Rinascimento. In particolare si focalizza sulla ricostruzione di meccanismi epistemologici di economia del sapere quali i processi di matematizzazione e di omogenizzazione del sapere scientifico.
Le fonti storiche analizzate sono i libri di testo usati in tutte le università europee tra circa la metà del XV secolo (1472, il primo anno in cui testi scientifico-matematici furono stampati) e il 1650 (Valleriani 2017; El-Hajj et al. 2022). La ricerca intende inoltre dimostrare come la crescente omogenizzazione del sapere scientifico in questo periodo abbia rappresentato un fattore determinante per la creazione di una identità culturale europea durante la pre-modernità.
Attraverso l’analisi di oltre 350 diverse edizioni, per un ammontare di circa 76.000 pagine di materiale, per un totale stimato di oltre 300.000 volumi circolanti nel territorio europeo, è uno dei primi progetti di ricerca che ha applicato l’approccio tipico della fisica dei sistemi complessi.
Le edizioni sono di libri di testo introduttivi allo studio dell’astronomia geocentrica, solitamente composti da vari trattati scientifici di autori diversi. Gli studiosi hanno selezionato tutte edizioni contenenti un testo molto usato a questo scopo e cioè il Tractatus de sphaera di Johannes de Sacrobosco.
Quest’analisi ha portato alla scoperta che gli studi scientifici di alto livello divennero continuamente più omogenei soprattutto a partire dal 1532 e in seguito ad un processo di imitazione dei contenuti scientifici impartiti presso le università che si trovavano nei territori allora recentemente convertiti al Protestantesimo, ed in particolare all’Università di Wittenberg (Valleriani et al. 2019; Zamani et al. 2020; Valleriani et al. 2022a; Zamani et al. In press).
Altri studi, miranti all’analisi di correlazioni tra la trasformazione dei contenuti dei testi scientifici e il tessuto economico e sociale di attori quali autori e stampatori, hanno rivelato che tale processo di imitazione era dovuto principalmente, ma non solo, a motivi legati ai meccanismi europei di produzione e marketing del libro di testo accademico di quel periodo (Valleriani 2020; Valleriani and Ottone 2022; Valleriani et al. 2022b) [Figura 1].
Metodo di studio
Questi studi hanno richiesto l’utilizzo di dati riferiti esclusivamente all’apparato testuale delle fonti. In pratica, gli studiosi prima hanno sezionato i volumi in porzioni di testo (una sorta di autopsia) e poi hanno fissato relazioni di tipo semantico tra queste porzioni: “basato su”, “commento di”, “frammento di” e “traduzione di”.
Il network sincronico così generato ha acquisito poi una profondità temporale (network diacronico) in base alle ri-occorrenze delle porzioni di testo identificate e dunque delle loro reciproche relazioni semantiche.
Oltre ai dati provenienti dall’esame dei testi, gli studiosi hanno inoltre effettuato l’estrazione di tutti gli elementi visivi così come delle tabelle numeriche ed alfanumeriche. In questo modo tre tipi di dati (denominati knowledge atoms) si definiscono come rappresentativi dei contenuti delle edizioni: testo, immagine, tabella [Figura 2a–c]. La conclusione dell’esame completo dei contenuti delle fonti avverrà dunque sono quando si stabilirà la relazione fra tutti i dati, tra gli uni e gli altri, e si svolgerà l’analisi del network risultante.
Fig. 2. Knowledge atoms sono tipi di dati scelti per rappresentare il contenuto delle fonti storiche esaminate. Nel progetto The Sphere i knowledge atoms sono testi, elementi visivi e tabelle numeriche e alfanumeriche. Queste illustrazioni rappresentano esempi di knowledge
atoms tratti dai libri di testo rinascimentali utilizzati per l’introduzione allo studio dell’astronomia:
2a) testo; a causa dell’impossibilità di rendere i testi rinascimentali machine readable, i testi sono stati scomposti in porzioni di testo, generalmente attraverso l’identificazione di titoli e sottotitoli; in questa pagina si notano il testo di riferimento di Sacrobosco e il commento stampato attorno ad esso in forma di parentesi. Si notano inoltre
tre elementi visivi, due iniziali e una figura geometrica (contenuto: commento di Prosdocimo Beldomandi al Tractatus de sphaera di Johannes de Sacrobosco). Tratto da (Sacrobosco et al. 1508) ;
2b) illustrazione scientifica (contenuto: dimostrazione della sfericità
dell’elemento acqua nell’ambito della concezione geocentrica di Aristotele). Tratto da (Sacrobosco et al. 1490);
2c) tabella numerica (contenuto: tavola logaritmica con i valori della
funzione del seno). Tratto da (Finé 1542) . Biblioteca del Max-Planck-Institut für Wissenschaftsgeschichte, Berlino.
Machine Learning: gli studi storici con l’Intelligenza Artificiale
Il passo finale non è ancora stato raggiunto a causa del fatto che l’estrazione e il controllo dei dati richiede un’enorme quantità di risorse umane. Un forte limite per gli studi storici che utilizzano questo approccio.
A causa di questo problema, tuttavia, nei tempi più recenti il campo della Computational History si sta estendendo allo scopo di sviluppare applicazioni e modelli specifici di Machine Learning che consentono di estrarre dati automaticamente, di classificarli in base a tassonomie predefinite ed infine di analizzarli.
La possibilità di usufruire in modo immediato di architetture come per esempio VGG16 e YOLO ha permesso l’implementazione di Machine Learning al livello di analisi delle fonti, dove per analisi si intende l’estrazione di elementi fondamentali per capirne il contenuto e quindi nuovi dati. Nel progetto The Sphere si esegue l’analisi di testi a stampa rinascimentali, impossibili da trasformare in testi leggibili dalla macchina, se non attraverso un investimento di risorse umane oltre la ragionevolezza. Per questo motivo in questo progetto, così come in ogni progetto di Computational History che si focalizza su fonti rinascimentali europee, l’applicazione di Machine Learning è sostanzialmente un’applicazione nel campo di Computer Vision. Si utilizzano modelli per segmentare le immagini delle pagine dei trattati storici e, infine, per distinguere il testo dalle immagini.
L’uso del Deep Learning
Nel caso del progetto The Sphere è stato sviluppato CorDeep, un Convolutional Neural Network in grado di identificare ogni tipo di elemento visivo e di classificarlo in base ad una tassonomia generale che distingue tra decorazioni e vignette, marche di stampatori, iniziali, e illustrazioni scientifiche (Büttner et al. 2022) [Figura 3].
È ovviamente possibile specializzare il modello per compiere ulteriori distinzioni, per esempio per identificare automaticamente quali immagini rappresentano illustrazioni astratte, strumenti matematici, e macchine. Ecco come si è parzialmente condotto questo passo.
Come in tutti gli sviluppi di intelligenza artificiale (IA) che utilizzano la tecnologia Deep Learning però, è possibile raggiungere risultati ottimali solo se una grande quantità di dati è a disposizione. CorDeep funziona con una precisione (mean Average Precision – mAP) che va oltre il 98% e sono state utilizzate circa 23.000 scansioni di pagine con elementi visivi così come altrettante pagine senza elementi visivi (circa 38.500 per il training e le restanti per la validazione). Per raggiungere la stessa precisione, effettuando una maggiore specializzazione del modello, servirebbero diverse migliaia di immagini per ogni nuova categoria.
L’estrazione e la classificazione generano dati in molteplici formati da inserire agevolmente nella banca dati di riferimento, associandoli quindi a tutti gli altri dati presenti e, soprattutto, alle fonti storiche da cui è avvenuta l’estrazione.
Network Analysis
Per proseguire le ricerche mantenendo un approccio collegato alla Network Analysis e per poter compiere un’esplorazione che riguarda migliaia di illustrazioni, è necessario raggruppare le immagini attraverso un principio di similitudine.
Nel caso del progetto The Sphere si è particolarmente interessati a scoprire quali stampatori hanno utilizzato le stesse strategie visive ovvero le stesse illustrazioni, per trasmettere lo stesso sapere scientifico.
Dunque si cercano illustrazioni scientifiche uguali tra loro e non solamente simili. Anche in questo caso il Deep Learning ha soccorso la ricerca e grazie all’utilizzo di un’architettura ResNet50, raggruppando le illustrazioni in base a questo principio. In tal modo si crea un network tra fonti storiche in base al fatto che contengono la stessa illustrazione.
Questo network andrà infine ad aggiungersi a quelli già creati ed analizzati in base alle relazioni semantiche tra testi. Dunque, sarà possibile compiere ricerche in riferimento alla relazione testo e immagini, prendendo in considerazione una grande quantità di fonti storiche ed un lungo arco temporale.
Ulteriori sviluppi in corso nel progetto The Sphere e nel campo dell’Intelligenza Artificiale stanno conducendo alla produzione di un modello in grado di identificare tabelle numeriche ed alfanumeriche. Ma soprattutto in grado di raggrupparle in base alla similitudine dei loro contenuti.
Si tratta di un lavoro molto complesso dovuto all’eterogeneità dei dati a disposizione in quanto la stessa tabella numerica prevede un numero quasi illimitato di layout di paginazione. E, a causa delle diverse dimensioni dei testi a stampa rinascimentali, su una o molteplici pagine (Eberle et al. 2020).
Explainable Artificial Intelligence (XAI)
I più recenti sviluppi in riferimento alla explainability e intepretatibility delineano un’ulteriore linea di ricerca nel campo della Computational History e legata all’Intelligenza Artificiale.
L’Explainable Artificial Intelligence (XAI) rappresenta un’emergente specializzazione in cui attualmente si investono grandi risorse. Il metodo infatti promette di svelare i segreti della cosiddetta black box rappresentata dal Deep Learning e di comprendere perché – e come – il modello ha compiuto una previsione specifica.
XAI è dunque una ricerca che mira a risolvere problemi di tipo legale e giuridico ogni qual volta vi sono modelli di IA. che possono agire in piena autonomia, come per esempio nel campo medico. XAI però è anche un approccio con un grande potenziale conoscitivo. Infatti scoprire i motivi del comportamento di un modello IA può anche essere un modo per raccogliere nuove conoscenze sul materiale analizzato dal modello.
Il progetto The Sphere ha permesso di compiere recentemente un primo passo verso l’utilizzo di XAI nel campo degli studi storici e allo scopo di imparare da IA come analizzare le fonti storiche.
Una volta preparato, il classificatore CorDeep consente infatti di distinguere quali illustrazioni rappresentano strumenti matematici rinascimentali, come per esempio un quadrante, un astrolabio o un orologio solare.
Validata la classificazione, l’applicazione di XAI ha permesso di comprendere quali sono gli elementi dell’illustrazione determinanti per il modello IA per compiere la stessa classificazione. In questo modo è possibile raccogliere un numero di informazioni sufficiente per formulare una definizione di strumento matematico rinascimentale così come interpretato dall’Intelligenza Artificiale e non dagli esseri umani (El-Hajj et al. Forthcoming) [Figura 4].
Sviluppi futuri degli studi storici con l’Intelligenza Artificiale
Le possibilità di sviluppo all’intersezione tra gli studi storici e quelli rivolti allo sviluppo dell’IA sono estremamente vasti. Alcuni di questi trovano un uso corrente nell’ambito del progetto The Sphere.
In quasi tutti i casi si richiede lo sviluppo di modelli di Deep Learning che funzionano in base ad un supervised learning. Benché i modelli risultino estremamente efficienti, questa caratteristica però rappresenta anche un limite. Infatti la quantità di dati, la qualità della loro struttura, e il numero di annotazioni necessari per compiere il training richiesto, si basa spesso su un investimento in termini di risorse umane che solo in rari casi è possibile.
La ricerca si deve dunque muovere verso nuove frontiere che, nel caso di Deep Learning, siano in grado di imparare autonomamente in modo unsupervised, eventualmente attraverso la generazione di dati sintetici non reali. E soprattutto attraverso la realizzazione di modelli fondazionali applicabili in contesti diversi.
Questi modelli fondazionali devono essere in grado di analizzare collezioni di dati non strutturati per le quali sono a disposizione solo poche annotazioni. La situazione non è tipica solo degli studi storici. Infatti è sempre più comune in svariati campi. Ciò permetterebbe un’agilità e flessibilità d’applicazione della IA, attualmente non possibile. È prevedibile che l’unione degli studi storici con la ricerca nel campo di IA aiuterà a spianare questa via.
In riferimento ai soli studi storici, l’unione apre a uno scenario futuro che si muove su due piani distinti. Il primo riguarda l’analisi delle fonti storiche e la creazione di genealogie tra loro. Scoprire in che modo le fonti storiche sono collegate semanticamente le une alle altre è la base di ogni ricerca storica. Fino ad ora questo compito richiedeva una laboriosa analisi manuale ad opera dei singoli professionisti. Questa analisi dunque si limita ad un numero molto piccolo di fonti, in confronto con quelle a disposizione.
Grazie alla digitalizzazione delle fonti e al trasferimento dei metadati dal cartaceo al catalogo elettronico, l’IA può completamente eseguire questo compito. Le biblioteche e gli archivi che procederanno in questa direzione si arricchiranno dunque di un nuovo compito ed una nuova missione. Diventeranno centri di dati già connessi e probabilmente esplorati nel loro andamento complessivo spazio temporale.
Le ricerche storiche prenderanno il via da questi dati e non più dalle singole fonti. Solo dopo aver scoperto particolarità nell’andamento dei dati, allora si tornerà a leggere individualmente le fonti, proprio per spiegare i cambiamenti. In questo modo si ribalta il rapporto tra macro e micro storia. Sarà un’analisi dell’andamento generale che fornirà idee per gli approfondimenti e non viceversa, come è stato fatto fino ad ora, dove, partendo da studi specifici si cerca di connetterli costruendo una linea generale, sostanzialmente collegando i punti con una linea.
Conclusioni
Nel progetto The Sphere, l’applicazione dei modelli di estrazione e clustering ha condotto alla formazione di tre nuove collezioni di dati che si riferiscono a tre diverse collezioni di fonti storiche nel corso di soli sei mesi e con l’impiego di due assistenti di progetto assunti part-time.
La prima collezione ha invece richiesto 4 anni di lavoro e, in tutto, una decina di persone. Il progetto The Sphere riuscirà a compiere un grande passo avanti quando riuscirà ad entrare in una solida alleanza con una grande istituzione per la preservazione delle fonti storiche.
Da un punto di vista più astratto, l’impostazione legata alla Network Analyis permette di concepire modelli di IA applicati ai network, come per esempio, Graph Neural Networks (GNN) e Temporal Graph Neural Networks (TGNN). GNN, TGNN e il concomitante utilizzo di XAI lasciano già ora intravedere lo sviluppo di sistemi intelligenti in grado non solo di analizzare ma anche di “interpretare” le genealogie tra le fonti storiche, supportando così il lavoro dello storico attraverso la formulazione di ipotesi basate su correlazioni che, vagliate, possono essere assunte come cause nelle ricostruzioni storiche.
Ringraziamenti
L’autore ringrazia Hassan El-Hajj, IT Officer al Max-Planck-Institut für Wissenschaftsgeschichte di Berlino per i consigli elargiti su alcune parti dell’articolo.
Bibliografia
Büttner, Jochen, Julius Martinetz, Hassan El-Hajj and Matteo Valleriani. 2022. CorDeep and the Sacrobosco Dataset: Detection of Visual Elements in Historical Documents. Journal of Imaging 8 (10): 285. https://doi.org/https://doi.org/10.3390/jimaging8100285
De Domenico, Manlio, Mason A. Porter and Alex Arenas. 2015. MuxViz: a Tool for Multilayer Analysis and Visualization of Networks. Journal of Complex Networks 3: 159–176.
Eberle, Oliver, Jochen Büttner, Florian Kräutli, Klaus-Robert Müller, Matteo Valleriani and Grégoire Montavon. 2020. Building and Interpreting Deep Similarity Models. IEEE Transactions on Pattern Analysis and Machine Intelligence. https://doi.org/10.1109/TPAMI.2020.3020738.
El-Hajj, Hassan, Oliver Eberle, Anika Merklein, Anna Siebold, Noga Shlomi, Jochen Büttner, Julius Martinetz, Grégoire Montavon, Klaus-Robert Müller and Matteo Valleriani. Forthcoming. The Historian XAI: Explainability and Transparency in the Realm of Digital Humanities. International Journal of Digital Humanities.
El-Hajj, Hassan and Matteo Valleriani. 2021. CIDOC2VEC: Extracting Information from Atomized CIDOC-CRM Humanities Knowledge Graphs. Information 12: 1–18. https://doi.org/https://doi.org/10.3390/info12120503.
El-Hajj, Hassan, Maryam Zamani, Jochen Büttner, Julius Martinetz, Oliver Eberle, Noga Shlomi, Anna Siebold, Grégoire Montavon, Klaus-Robert Müller, Holger Kantz and Matteo Valleriani. 2022. An Ever-Expanding Humanities Knowledge Graph: The Sphaera Corpus at the Intersection of Humanities, Data Management, and Machine Learning. Datenbank-Spektrum: Zeitschrift für Datenbanktechnologien und Information Retrieval. https://doi.org/10.1007/s13222-022-00414-1.
Finé, Oronce. 1542. Orontij Finei Delphinatis, regii mathematicarvm professoris, De Mundi sphaera, sive Cosmographia, primáve Astronomiae parte, Lib. V: Inaudita methodo ab authore renovati, proprijsque tum commentarijs & figuris, tum demonstrationibus & tabulis recens illustrati. Eivsdem Orontii, rectarum in circuli quadrante subtensarum (quos sinus vocant) demonstratio, supputatióque facillima, nunc primùm edita; vna cum eorundem sinuum tabula, fideli admodum calculo restituta. Eivsdem Orontii, organum vniversale, ex supradicta sinuum ratione contextum, quo tum Geometrici, tum omnes astro nomici canones, ex quatuor sinuum proportione pendentes, mira facilitate practicantur. Oaris: Simon de Colines. https://hdl.handle.net/21.11103/sphaera.101201.
Kräutli, Florian and Matteo Valleriani. 2018. CorpusTracer: A CIDOC Database for Tracing Knowledge Networks. Digital Scholarship in the Humanities 33: 336–346. https://doi.org/10.1093/llc/fqx047.
Ramelli, Agostino. 1588. Le diverse et artificiose machine del Capitano Agostino Ramelli dal Ponte Della Tresia Ingegniero del Christianissimo Re di Francia et di pollonia: nelle quali si contengono uarij et industriosi Mouimenti, degni digrandißima speculatione, per cauarne beneficio infinito in ogni sorte d’operatione. Parigi: In casa del Autore.
Sacrobosco, Johannes de, Pierre d’Ailly, Francesco Capuano, Robert Grosseteste, Jacques Lefèvre d’Etaples, Joannes Regiomontanus, Georg von Peurbach and Bartolomeo Vespucci. 1508. Nota eorum quæ in hoc libro continentur. Oratio de laudibus astrologiae habita a Bartholomeo Vespucio florentino in almo Patavio Gymnasio anno.M.d.vi. TEXTUS SPHAERAE IOANNIS DE SACRO BUSTO. Expositio sphaerae Eximii artium & medicinae doctoris Domini Francisci Capuani de manfredonia. Annotationes nonnullae eiusdem Bartholomei Vespucii hic ide itersertae. Iacobi frabri stapulensis Commentarii in eandem sphaeram. Reverendissimi Domini Petri de aliaco Cardinalis & episcopi Cameracensis in eandem quaestiones subtilissimae numero xiiii. Reverendissimi episcopi Domini Roberti linconiensis sphaerae compendium. Disputationes Ioannis de regio monte contra cremonensia deliramenta. Theoricarum novarum textus cum expositione eiusdem Francisci Capuani omnia nuper diligentia summa emendata. Venice: Giovanni and Bernardino Rosso for Giuntino Giunta. https://hdl.handle.net/21.11103/sphaera.100915.
Sacrobosco, Johannes de, Joannes Regiomontanus and Georg von Peurbach. 1490. Spaerae mundi compendium foeliciter inchoat. Noviciis adolescentibus: ad astronomicam rem publicam capessendam aditum impetrantibus: pro brevi rectoque tramite a vulgari vestigio semoto: Ioannis de Sacro busto sphaericum opusculum una cum additionibus nonnullis littera A sparsim ubi intersertae sint signatis: Contraque cremonensia in planetarum theoricas delyramenta Ioannis de monte regio disputationes tam acuratiss. atque utills. Nec non Georgii purbachii in erundem motus planetarum acuratiss. theoricae: dicatum opus: utili serie contextum: fausto sidere inchoat. Venice: Ottaviano Scoto I. https://hdl.handle.net/21.11103/sphaera.100885.
Valleriani, Matteo. 2017. The Tracts on The Sphere. Knowledge Restructured over a Network. In Structures of Practical Knowledge, ed. Matteo Valleriani, 421–473. Dordrecht: Springer.
———, ed. 2020. De sphaera of Johannes de Sacrobosco in the Early Modern Period: The Authors of the Commentaries. Cham: Springer Nature. https://doi.org/10.1007/978-3-030-30833-9.
Valleriani, Matteo, Beate Federau and Olga Nicolaeva. 2022a. The Hidden Praeceptor: How Georg Rheticus Taught Geocentric Cosmology to Europe. Perspectives in Science 30 (3): 407–436. https://doi.org/10.1162/posc_a_00421. https://doi.org/10.1162/posc_a_00421.
Valleriani, Matteo, Florian Kräutli, Daan Lockhorst and Noga Shlomi. 2023. Vision on Vision: Defining Similarities Among Early Modern Illustrations on Cosmology. In Scientific Visual Representations in History, eds. Matteo Valleriani, Giulia Giannini and Enrico Giannetto, 99–137. Cham: Springer. https://doi.org/10.1007/978-3-031-11317-8_4.
Valleriani, Matteo, Florian Kräutli, Maryam Zamani, Alejandro Tejedor, Christoph Sander, Malte Vogl, Sabine Bertram, Gesa Funke and Holger Kantz. 2019. The Emergence of Epistemic Communities in the Sphaera Corpus: Mechanisms of Knowledge Evolution. Journal of Historical Network Research 3: 50–91. https://doi.org/10.25517/jhnr.v3i1.63.
Valleriani, Matteo and Andrea Ottone, eds. 2022. Publishing Sacrobosco’s «De sphaera» in Early Modern Europe. Modes of Material and Scientific Exchange. Cham: Springer. https://doi.org/10.1007/978-3-030-86600-6.
Valleriani, Matteo, Malte Vogl, Hassan El-Hajj and Kim Pham. 2022b. The Network of Early Modern Printers and Its Impact on the Evolution of Scientific Knowledge: Automatic Detection of Awareness Relations. Histories 2 (4): 466–503. https://doi.org/https://doi.org/10.3390/histories2040033.
Zamani, Maryam, Hassan El-Hajj, Malte Vogl, Holger Kantz and Matteo Valleriani. In press. Modeling the Accumulation of Scientific Knowledge in the Early Modern Period. Humanities & Social Sciences Communications.
Zamani, Maryam, Alejandro Tejedor, Malte Vogl, Florian Kräutli, Matteo Valleriani and Holger Kantz. 2020. Evolution and Transformation of Early Modern Cosmological Knowledge: A Network Study. Scientific Reports – Nature 10: 19822. https://doi.org/10.1038/s41598-020-76916-3.