Gli astronomi hanno bisogno di un formato di file particolare per le immagini e i cataloghi, che conservi molte informazioni e la qualità dei dati, e che renda facile l’analisi di questi dati. L’estensione usata è .FITS, che sta per Flexible Image Transport System (in italiano Sistema flessibile di trasporto delle immagini).
Il telescopio: come è fatto, come funziona, quali sono i più diffusi e dove
Caratteristiche del formato .FITS
Questo formato non proprietario è perfetto per la conservazione, lo scambio e il processamento dei dati, tre usi che gli astronomi si trovano a fare abitualmente: le immagini in formato FITS sono prima create come output di un telescopio, poi trasportate da un computer a un server online, e infine perfette per essere sottoposte a varie analisi, con lo scopo finale di ottenere informazioni scientifiche sulle sorgenti astronomiche.
Un file in formato FITS è formattato come una griglia multidimensionale o come una tabella, e include anche un header (in formato ASCII), che a sua volta include metadati. Tra questi metadati si possono inserire uno svariato numero di informazioni, come il nome della sorgente osservata, le coordinate della regione di cielo dove ha puntato il telescopio, numero e dimensione dei pixel dell’immagine, ecc. ecc. In alcuni casi in un singolo file FITS si possono inserire anche immagini diverse utilizzando frame diversi o attraverso un datacube (una griglia di valori multidimensionali). Ma non basta, il formato supporta interi a 64 bit. Non va infine dimenticato che anche se sono state create nuove versioni del formato FITS, un file FITS creato con versioni precedenti del formato, potrà sempre essere letto, permettendo la conservazione e l’uso dei dati al suo interno per sempre.
Come si usa il formato .FITS
I file FITS non immagazzinano solo immagini, ma anche spettri (la luce di sorgenti in funzione della lunghezza d’onda, osservata utilizzando uno spettrografo) e database. Svariati linguaggi di programmazione supportano questo formato, come C++, Fortran, IDL, Java, Wolfram Mathematica, MATLAB, Perl, Python, R, per citarne qualcuno.
Per una veloce visualizzazione di immagini FITS, e per effettuare azioni molto basilari, gli astronomi usano il programma SAOImage DS9 Astronomical Data Visualization Application, chiamato brevemente DS9.
Qui di seguito mostro una finestra di DS9, nell’immagine vedi la galassia NGC 5457, una galassia a spirale vista di faccia (face-on). L’immagine mostrata è stata osservata nel filtro r, e cioè i fotoni che ha raccolto il telescopio sono quelli in una regione spettrale intorno ai colori rossi (lunghezze d’onda intorno a 6000 Angstrom). Quindi l’immagine è sostanzialmente monocromatica e appare colorata secondo una scala di colore di grigi: pixel con più luce corrispondono alle parti bianche, mentre le parti più nere corrispondono a regioni dove c’è meno luce e quindi dove non ci sono sorgenti. Questo semplice programma permette di fare lo zoom nell’immagine, scalare la luminosità nell’immagine, permettendo di aumentare il contrasto tra sorgente e fondo del cielo, di misurare la distanza in secondi d’arco tra le varie sorgenti e individuare le coordinate delle stesse. Per analisi più complesse, poi, si possono utilizzare programmi che permettono un maggior numero di applicazioni, scritti ad esempio con Python o IDL.
Creare cataloghi di galassie e tabelle di dati
Un formato utile anche per creare cataloghi di galassie. Ma gli astronomi utilizzano questo speciale formato anche per creare delle tabelle di dati. Gli astronomi hanno infatti necessità di catalogare le galassie. Il catalogo di Messier, composto da 110 sorgenti, è uno dei primi cataloghi di sorgenti astronomiche, il primo con sorgenti diverse dalle stelle e quindi contenente galassie diverse dalla Via Lattea; fu pubblicato nel 1774.
Dopo oltre due secoli, lo sviluppo tecnologico e le nostre conoscenze sono aumentati, i nostri cataloghi di stelle e galassie contengono milioni, se non miliardi di sorgenti, e questi numeri aumenteranno sempre di più. E i file contenenti queste informazioni devono includere per ogni stella o galassia svariati parametri e informazioni: coordinate, luminosità, colori, masse, distanze, ecc. ecc. Occupano spazio, e sono difficili da maneggiare. Il formato FITS aiuta a creare file che possono essere facilmente trasportati e maneggiabili nell’analisi dati: rispetto a una tabella di testo in formato ASCII, una tabella FITS contiene anche una serie di informazioni sui nomi, i formati e le unità di misura delle colonne della tabella. Per aprire velocemente questi file utilizziamo un programma scritto in Java che si chiama TOPCAT, Tool for OPerations on Catalogues And Tables (vedete la sua finestra aperta nell’immagine a destra), che permette di effettuare tutta una serie di operazioni tra tabelle, come abbinare righe di diverse tabelle che hanno valori uguali di un parametro o coordinate simili, e si può interfacciare anche con server esterni per poter importare cataloghi di stelle o galassie presenti su server online. Oltre al formato FITS, questo programma può importare tabelle in tanti altri formati, come ad esempio ASCII e CSV.
I principali formati di file per immagini digitali
Tutti siamo più o meno a conoscenza dei formati JPG, PNG e GIF: sono le estensioni più note e usate per salvare le immagini. Le immagini digitali sono una rappresentazione numerica di immagini reali, e le più comunemente usate sono le immagini bitmap, che sono composte da matrici di pixel. Nelle immagini a colori in ogni pixel è memorizzato il livello di intensità di colori fondamentali che poi andranno a combinarsi per comporre il colore di quel pixel specifico. Ad esempio, nel modello di colore RGB, i colori sono realizzati dalla combinazione di tre colori fondamentali, rosso, verde e blu, pesati opportunamente. Nel caso di immagini monocromatiche, invece, il valore numerico associato al pixel indica scale di grigio, con estremi il bianco e il nero. Inoltre il file contiene anche un header, contenente metadati, e cioè una lista di informazioni aggiuntive sul file.
Uno degli utilizzi delle immagini digitali è quello di far parte di pagine internet; per avere pagine web veloci le dimensioni delle immagini vengono ridotte attraverso processi di compressione (come il formato di compressione ZIP, che permette di ridurre le dimensioni di file singoli o insiemi di file).
Il formato JPG è senz’altro il più famoso e usato, creato dal Joint Photographic Experts Group, è il primo standard di compressione digitale. Permette un buon compromesso tra dimensioni e qualità. Il formato GIF (Graphic Interchange Format) ha visto un grande utilizzo per immagini animate e il PNG (Portable Network Graphic) è usato da coloro che non vogliono perdere dettagli nelle immagini che vogliono conservare. Puoi trovare maggiori dettagli a questo link.
Un nuovo formato per le immagini astronomiche
Per rendere l’idea della facilità di utilizzo dei FITS per la conservazione delle tabelle, ho importato in TOPCAT un file FITS che avevo creato per un campione di galassie della survey KiDS (survey astronomica effettuata col telescopio VST, telescopio situato sulle Ande cilene). Il catalogo contiene circa 5 milioni di sorgenti e per ogni sorgente 234 parametri diversi. Le dimensioni di questo file in formato FITS sono di 7.4 Gigabyte, e TOPCAT riesce ad aprire il file quasi istantaneamente, rendendolo subito disponibile per le analisi. Salvato con estensione CSV, il file ha dimensioni simili, ma richiederebbe molto più tempo per essere visualizzato.
Un’applicazione inaspettata del formato .FITS
Ma il formato FITS non è uno strumento nelle sole mani degli astronomi. All’interno del processo di digitalizzazione di oltre 80000 manoscritti della Biblioteca Apostolica Vaticana, per l’acquisizione delle immagini delle pagine di questi libri e la loro conservazione nel tempo, è stato scelto proprio questo formato. Stiamo parlando di un patrimonio culturale e storico immenso conservato attraverso la tecnologia.