Scopri milioni di eBook, audiolibri e tanto altro ancora con una prova gratuita

Solo $11.99/mese al termine del periodo di prova. Cancella quando vuoi.

Dither: Rumore visivo nella visione artificiale
Dither: Rumore visivo nella visione artificiale
Dither: Rumore visivo nella visione artificiale
E-book143 pagine1 ora

Dither: Rumore visivo nella visione artificiale

Valutazione: 0 su 5 stelle

()

Leggi anteprima

Info su questo ebook

Cos'è Dither


Il dither è una forma di rumore applicata intenzionalmente e utilizzata per randomizzare l'errore di quantizzazione, prevenendo modelli su larga scala come le bande di colore nelle immagini. Il dither viene utilizzato abitualmente nell'elaborazione di dati audio e video digitali ed è spesso una delle ultime fasi della masterizzazione dell'audio su un CD.


Come trarrai beneficio


(I) Approfondimenti e convalide sui seguenti argomenti:


Capitolo 1: Dithering


Capitolo 2: Convertitore analogico-digitale


Capitolo 3: Gamma dinamica


Capitolo 4: Rapporto segnale-rumore


Capitolo 5: Mezzitoni


Capitolo 6: Confronto tra registrazione analogica e digitale


Capitolo 7: Artefatto di compressione


Capitolo 8: Campionamento (elaborazione del segnale)


Capitolo 9: Quantizzazione (elaborazione del segnale)


Capitolo 10: Scala di grigi


(II) Rispondere alle principali domande del pubblico sul dithering.


(III) Esempi reali dell'utilizzo del dither in molti campi.


A chi è rivolto questo libro


Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che vogliono andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di Dither.

LinguaItaliano
Data di uscita5 mag 2024
Dither: Rumore visivo nella visione artificiale

Correlato a Dither

Titoli di questa serie (100)

Visualizza altri

Ebook correlati

Intelligenza artificiale e semantica per voi

Visualizza altri

Articoli correlati

Recensioni su Dither

Valutazione: 0 su 5 stelle
0 valutazioni

0 valutazioni0 recensioni

Cosa ne pensi?

Tocca per valutare

La recensione deve contenere almeno 10 parole

    Anteprima del libro

    Dither - Fouad Sabry

    Capitolo 1: Dithering

    Il dithering è un tipo di rumore intenzionale utilizzato per randomizzare l'errore di quantizzazione, impedendo così modelli su larga scala come le bande di colore nelle fotografie. Il dithering è comunemente impiegato nell'elaborazione di dati audio e video digitali ed è spesso uno dei passaggi finali nella masterizzazione dell'audio per un CD.

    In genere, il dithering viene utilizzato per trasformare un'immagine in scala di grigi in bianco e nero in modo tale che la densità dei punti neri nell'immagine risultante si avvicini al livello medio di grigio dell'immagine originale.

    … Una delle prime applicazioni del dithering avvenne durante la seconda guerra mondiale.

    I bombardieri utilizzavano computer meccanici per la navigazione e il calcolo della traiettoria delle bombe.

    Curiosamente, questi computer (scatole contenenti centinaia di ingranaggi e ingranaggi) si comportavano in modo più preciso a bordo dell'aeroplano e meno solidamente stabiliti.

    Gli ingegneri hanno notato che le vibrazioni dell'aereo hanno ridotto al minimo l'errore causato dalle parti mobili appiccicose.

    Invece di muoverti a scatti veloci, dovresti muoverti senza intoppi, si sono mossi con maggiore coerenza.

    I motori vibranti in miniatura sono stati inclusi nei computer, Il termine dithering deriva dal verbo inglese medio didderen, che significa scuotere. Oggi, quando si tocca un misuratore meccanico per migliorarne la precisione, si usa l'esitazione, I dizionari moderni definiscono l'itthering come uno stato mentale profondamente ansioso, confuso o agitato.

    In quantità minuscole, Dither rende effettivamente un sistema digitale più analogico nel senso positivo del termine.

    Ken Pohlmann, Principi dell'audio digitale

    Poco dopo la seconda guerra mondiale, il termine dithering è stato pubblicato in letteratura sul calcolo analogico e sulle armi ad azionamento idraulico.

    Il dithering viene applicato in numerosi campi che includono l'elaborazione e l'analisi digitale. Queste applicazioni includono audio digitale, video digitale, fotografia digitale, sismologia, radar e sistemi di previsione meteorologica che richiedono l'elaborazione digitale del segnale.

    La quantificazione produce errori. Se questa imprecisione è associata al segnale, il risultato può essere ciclico o prevedibile. In alcuni domini, in particolare quelli in cui il recettore è sensibile a tali distorsioni, gli errori ciclici si traducono in artefatti indesiderati. L'introduzione del dithering in queste aree trasforma l'errore in rumore casuale. L'industria audio ne è un esempio lampante. L'orecchio umano agisce in modo simile a una trasformata di Fourier in quanto rileva frequenze distinte.

    In un sistema analogico, il segnale è continuo, mentre in un sistema digitale PCM, l'ampiezza del segnale è limitata a uno di un insieme fisso di valori o numeri. Questo metodo è noto come quantizzazione. Ogni valore codificato è un passo discreto; Se un segnale viene quantizzato senza dithering, ci sarà una distorsione di quantizzazione associata al segnale di ingresso originale... Per evitare ciò, il segnale viene ditherato, una procedura che elimina matematicamente le armoniche e altre distorsioni altamente indesiderabili e le sostituisce con un livello costante e fisso di rumore.

    Durante il processo di produzione, viene spesso utilizzato un numero maggiore di bit per rappresentare ogni campione; Questo deve essere ridotto a 16 bit per creare un compact disc.

    Ci sono numerosi modi per raggiungere questo obiettivo. Si può, ad esempio, scartare i bit in più; Questa operazione è nota come troncamento. Inoltre, è possibile arrotondare i bit in eccesso al valore più vicino. Ognuna di queste strategie, tuttavia, produce errori prevedibili e calcolabili. Il dithering sostituisce queste imprecisioni con un livello di rumore continuo e fisso.

    Esempi di esempi audio di troncamento a 6 bit

    Sinusoide a 16 bit


    ridotto a sei bit


    ridotto a 6 bit


    Hai problemi a riprodurre questi file? Vedere Supporto multimediale.

    Prendiamo, ad esempio, una forma d'onda con i seguenti valori:

    1 2 3 4 5 6 7 8

    Se la forma d'onda viene diminuita del 20%, si ottengono i seguenti valori:

    0.8 1.6 2.4 3.2 4.0 4.8 5.6 6.4

    Se questi valori vengono abbreviati, i dati risultanti sono i seguenti:

    0 1 2 3 4 4 5 6

    Se invece questi valori vengono arrotondati, si ottengono i seguenti dati:

    1 2 2 3 4 5 6 6

    La tecnica di ridurre l'ampiezza di qualsiasi forma d'onda originale del 20% si traduce in errori consistenti. Si consideri un'onda sinusoidale che, per una porzione, soddisfi i parametri di cui sopra. Come mostrato nell'esempio precedente, ogni volta che il valore dell'onda sinusoidale raggiungeva 3,2, il risultato accorciato sarebbe sbagliato di 0,2. Ogni volta che il valore dell'onda sinusoidale raggiungeva 4,0, non ci sarebbe alcun errore perché il risultato accorciato sarebbe fuori di 0,0, come illustrato in precedenza. Durante il ciclo dell'onda sinusoidale, l'entità dell'errore varia regolarmente e ripetutamente. Questo errore si rivela specificamente come distorsione. Ciò che l'orecchio percepisce come distorsione è l'informazione aggiuntiva a frequenze discrete risultante da un errore di quantizzazione ricorrente.

    Un possibile approccio potrebbe essere quello di arrotondare il numero a due cifre (ad esempio, 4,8) in entrambe le direzioni. Potrebbe essere arrotondato a cinque una volta e poi a quattro la volta successiva. Ciò renderebbe la media a lungo termine di 4,5 anziché 4, avvicinando il valore al suo valore reale nel tempo. Tuttavia, ciò si traduce ancora in un errore determinabile (anche se più complesso). Ogni due volte viene rilevato il valore 4,8, il risultato è un errore dello 0,2% e le altre volte l'errore è 0,8. Ciò si traduce comunque in un errore quantificato e ripetuto.

    Un'opzione alternativa potrebbe essere quella di arrotondare 4,8 in modo che quattro volte su cinque venga arrotondato per eccesso a 5 e la quinta volta venga arrotondato per difetto a 4. A lungo termine, la media sarebbe esattamente di 4,8. Sfortunatamente, si verificano ancora guasti ricorrenti e prevedibili e questi difetti continuano a manifestarsi come distorsioni udibili.

    Ciò si traduce nella soluzione del dithering. Invece di arrotondare per eccesso o per difetto in modo prevedibile e ripetitivo, è possibile arrotondare per eccesso o per difetto in modo casuale. Se una serie di numeri casuali compresi tra 0,0 e 0,9 (ad esempio, 0,6, 0,1, 0,3, 0,6, 0,9, ecc.) vengono creati e aggiunti a 4,8, due volte su dieci il risultato verrà troncato a 4 (se 0,0 o 0,1 viene aggiunto a 4,8) e otto volte su dieci il risultato verrà troncato a 5. Ogni condizione ha una probabilità del 20% di essere arrotondata a 4 e una probabilità dell'80% di essere arrotondata a 5. La media a lungo termine di questi risultati è 4,8 e il loro errore di quantizzazione è rumore casuale. Questo rumore è meno fastidioso per l'orecchio rispetto alla distorsione misurabile prodotta da altre soluzioni.

    Prima della quantizzazione o della ri-quantizzazione, viene introdotto il dithering per disaccoppiare il rumore di quantizzazione dal segnale di ingresso e prevenire il comportamento non lineare (distorsione). La quantizzazione con una profondità di bit inferiore richiede un maggiore dithering. La tecnica provoca ancora una distorsione, ma la distorsione è casuale, quindi il rumore risultante è essenzialmente correlato al segnale desiderato.

    Lipshitz e Vanderkooi hanno dimostrato in uno studio seminale pubblicato sull'AES Journal che diversi tipi di rumore con distinte funzioni di densità di probabilità (PDF) reagiscono in modo diverso quando vengono impiegati come segnali di dithering, il dithering può essere utilizzato per interrompere i cicli limite periodici, un problema tipico con i filtri digitali. Tipicamente, il rumore casuale è meno fastidioso dei toni armonici prodotti dai cicli limite.

    Funzione della densità di probabilità rettangolare (RPDF) Qualsiasi valore all'interno dell'intervallo definito ha la stessa probabilità di verificarsi all'interno del rumore di dithering.

    Funzione della densità di probabilità triangolare (TPDF) Il rumore di dithering ha una distribuzione triangolare; La probabilità che si verifichi è maggiore per i valori al centro dell'intervallo. È possibile ottenere una distribuzione triangolare combinando due sorgenti RPDF separate.

    La distribuzione PDF gaussiana ha una distribuzione normale. Questa curva a campana o gaussiana è caratteristica del dithering generato da sorgenti analogiche come i preamplificatori microfonici. Se la profondità di bit di una registrazione è sufficiente, il rumore del preamplificatore sarà adeguato per il dithering della registrazione.

    Il noise shaping è una procedura di filtraggio che modifica l'energia spettrale dell'errore di quantizzazione, spesso per deenfatizzare le frequenze a cui l'orecchio è più sensibile o per separare completamente le bande di segnale e rumore. Il fatto che il dithering sia inserito all'interno o all'esterno del ciclo di feedback del noise shaper influisce sul suo spettro finale se viene utilizzato. Se all'interno, il dithering viene considerato come parte del segnale di errore e formato in combinazione con l'errore di quantizzazione reale. Se si trova al di fuori della finestra di quantizzazione, il dithering viene trattato come parte del segnale originale e linearizza la quantizzazione senza essere modellato. In questo caso, il rumore di fondo finale è uguale alla somma dello spettro del dithering piatto

    Ti è piaciuta l'anteprima?
    Pagina 1 di 1