Dither: Rumore visivo nella visione artificiale
Di Fouad Sabry
()
Info su questo ebook
Cos'è Dither
Il dither è una forma di rumore applicata intenzionalmente e utilizzata per randomizzare l'errore di quantizzazione, prevenendo modelli su larga scala come le bande di colore nelle immagini. Il dither viene utilizzato abitualmente nell'elaborazione di dati audio e video digitali ed è spesso una delle ultime fasi della masterizzazione dell'audio su un CD.
Come trarrai beneficio
(I) Approfondimenti e convalide sui seguenti argomenti:
Capitolo 1: Dithering
Capitolo 2: Convertitore analogico-digitale
Capitolo 3: Gamma dinamica
Capitolo 4: Rapporto segnale-rumore
Capitolo 5: Mezzitoni
Capitolo 6: Confronto tra registrazione analogica e digitale
Capitolo 7: Artefatto di compressione
Capitolo 8: Campionamento (elaborazione del segnale)
Capitolo 9: Quantizzazione (elaborazione del segnale)
Capitolo 10: Scala di grigi
(II) Rispondere alle principali domande del pubblico sul dithering.
(III) Esempi reali dell'utilizzo del dither in molti campi.
A chi è rivolto questo libro
Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che vogliono andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di Dither.
Correlato a Dither
Titoli di questa serie (100)
Istogramma dell'immagine: Svelare intuizioni visive, esplorare le profondità degli istogrammi delle immagini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRiduzione del rumore: Miglioramento della chiarezza, tecniche avanzate per la riduzione del rumore nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCorrezione gamma: Migliorare la chiarezza visiva nella visione artificiale: la tecnica di correzione gamma Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniModello del sistema visivo umano: Comprendere la percezione e l'elaborazione Valutazione: 0 su 5 stelle0 valutazioniSpazio colore: Esplorare lo spettro della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRetinex: Svelare i segreti della visione computazionale con Retinex Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRidipintura: Colmare le lacune nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDiffusione anisotropa: Miglioramento dell'analisi delle immagini attraverso la diffusione anisotropa Valutazione: 0 su 5 stelle0 valutazioniVisione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniContorno attivo: Avanzamento della visione artificiale con tecniche di contorno attivo Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento dei contorni: Svelare l'arte della percezione visiva nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniPercezione visiva: Approfondimenti sull'elaborazione visiva computazionale Valutazione: 0 su 5 stelle0 valutazioniFiltro adattivo: Migliorare la visione artificiale attraverso il filtraggio adattivo Valutazione: 0 su 5 stelle0 valutazioniGruppo congiunto di esperti fotografici: Sfruttare la potenza dei dati visivi con lo standard JPEG Valutazione: 0 su 5 stelle0 valutazioniEqualizzazione dell'istogramma: Miglioramento del contrasto dell'immagine per una migliore percezione visiva Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniTrasformazione affine: Sbloccare le prospettive visive: esplorare la trasformazione affine nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniBanca filtri: Approfondimenti sulle tecniche del banco di filtri di Computer Vision Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto del colore: Comprendere la percezione e la rappresentazione nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFunzione di corrispondenza dei colori: Comprendere la sensibilità spettrale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata di Hadamard: Svelare il potere della trasformazione Hadamard nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello a colori: Comprendere lo spettro della visione artificiale: esplorare i modelli di colore Valutazione: 0 su 5 stelle0 valutazioniConsenso del campione casuale: Stima robusta nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniHashing geometrico: Algoritmi efficienti per il riconoscimento e la corrispondenza delle immagini Valutazione: 0 su 5 stelle0 valutazioni
Ebook correlati
Riduzione del rumore: Miglioramento della chiarezza, tecniche avanzate per la riduzione del rumore nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniAnti aliasing: Migliorare la chiarezza visiva nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRiconoscimento vocale audiovisivo: Progressi, applicazioni e approfondimenti Valutazione: 0 su 5 stelle0 valutazioniModello del sistema visivo umano: Comprendere la percezione e l'elaborazione Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRendering ad alta gamma dinamica: Sbloccare lo spettro visivo: tecniche avanzate nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFiltro adattivo: Migliorare la visione artificiale attraverso il filtraggio adattivo Valutazione: 0 su 5 stelle0 valutazioniMappatura dei colori: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniBande di colore: Esplorare le profondità della visione artificiale: svelare il mistero delle bande di colore Valutazione: 0 su 5 stelle0 valutazioniCompressione dati: Sbloccare l'efficienza nella visione artificiale con la compressione dei dati Valutazione: 0 su 5 stelle0 valutazioniRilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniProfilo colore: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRendering volumetrico: Esplorare il realismo visivo nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCompressione delle immagini: Tecniche efficienti per l'ottimizzazione dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniAlgoritmo di disegno di linee: Padroneggiare le tecniche per il rendering di immagini di precisione Valutazione: 0 su 5 stelle0 valutazioniRimozione delle linee nascoste: Svelare l'invisibile: i segreti della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFiltraggio anisotropico: Svelare la complessità visiva nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniIlluminazione globale: Visione avanzata: approfondimenti sull'illuminazione globale Valutazione: 0 su 5 stelle0 valutazioniGrafica computerizzata: Esplorando l'intersezione tra computer grafica e visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCorrezione gamma: Migliorare la chiarezza visiva nella visione artificiale: la tecnica di correzione gamma Valutazione: 0 su 5 stelle0 valutazioniSistema di gestione del colore: Ottimizzazione della percezione visiva negli ambienti digitali Valutazione: 0 su 5 stelle0 valutazioniCalcolo automatico di indici di qualità di flussi audio trasmessi su IP Valutazione: 0 su 5 stelle0 valutazioniNebbia a distanza: Esplorare la frontiera visiva: approfondimenti sulla nebbia a distanza della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniComputer grafica di vertice: Esplorando l'intersezione tra la computer grafica di vertice e la visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRiconoscimento automatico del bersaglio: Progressi nelle tecniche di visione artificiale per il riconoscimento del bersaglio Valutazione: 0 su 5 stelle0 valutazioniShader: Esplorare i regni visivi con Shader: un viaggio nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniPro Tools For Breakfast: Guida introduttiva al software più utilizzato negli studi di registrazione: Stefano Tumiati, #1 Valutazione: 0 su 5 stelle0 valutazioniStampa 3D - Guida passo dopo passo: La guida pratica per principianti e utenti! Valutazione: 0 su 5 stelle0 valutazioniSegmentazione delle immagini: Sbloccare insight grazie alla precisione dei pixel Valutazione: 0 su 5 stelle0 valutazioni
Intelligenza artificiale e semantica per voi
ANonniMus: Vecchi rivoluzionari contro giovani robot Valutazione: 0 su 5 stelle0 valutazioniGuida Intelligenza Artificiale Valutazione: 0 su 5 stelle0 valutazioniIl Terzo Like Valutazione: 0 su 5 stelle0 valutazioni
Recensioni su Dither
0 valutazioni0 recensioni
Anteprima del libro
Dither - Fouad Sabry
Capitolo 1: Dithering
Il dithering è un tipo di rumore intenzionale utilizzato per randomizzare l'errore di quantizzazione, impedendo così modelli su larga scala come le bande di colore nelle fotografie. Il dithering è comunemente impiegato nell'elaborazione di dati audio e video digitali ed è spesso uno dei passaggi finali nella masterizzazione dell'audio per un CD.
In genere, il dithering viene utilizzato per trasformare un'immagine in scala di grigi in bianco e nero in modo tale che la densità dei punti neri nell'immagine risultante si avvicini al livello medio di grigio dell'immagine originale.
… Una delle prime applicazioni del dithering avvenne durante la seconda guerra mondiale.
I bombardieri utilizzavano computer meccanici per la navigazione e il calcolo della traiettoria delle bombe.
Curiosamente, questi computer (scatole contenenti centinaia di ingranaggi e ingranaggi) si comportavano in modo più preciso a bordo dell'aeroplano e meno solidamente stabiliti.
Gli ingegneri hanno notato che le vibrazioni dell'aereo hanno ridotto al minimo l'errore causato dalle parti mobili appiccicose.
Invece di muoverti a scatti veloci, dovresti muoverti senza intoppi, si sono mossi con maggiore coerenza.
I motori vibranti in miniatura sono stati inclusi nei computer, Il termine dithering
deriva dal verbo inglese medio didderen
, che significa scuotere
. Oggi, quando si tocca un misuratore meccanico per migliorarne la precisione, si usa l'esitazione, I dizionari moderni definiscono l'itthering come uno stato mentale profondamente ansioso, confuso o agitato.
In quantità minuscole, Dither rende effettivamente un sistema digitale più analogico nel senso positivo del termine.
— Ken Pohlmann, Principi dell'audio digitale
Poco dopo la seconda guerra mondiale, il termine dithering è stato pubblicato in letteratura sul calcolo analogico e sulle armi ad azionamento idraulico.
Il dithering viene applicato in numerosi campi che includono l'elaborazione e l'analisi digitale. Queste applicazioni includono audio digitale, video digitale, fotografia digitale, sismologia, radar e sistemi di previsione meteorologica che richiedono l'elaborazione digitale del segnale.
La quantificazione produce errori. Se questa imprecisione è associata al segnale, il risultato può essere ciclico o prevedibile. In alcuni domini, in particolare quelli in cui il recettore è sensibile a tali distorsioni, gli errori ciclici si traducono in artefatti indesiderati. L'introduzione del dithering in queste aree trasforma l'errore in rumore casuale. L'industria audio ne è un esempio lampante. L'orecchio umano agisce in modo simile a una trasformata di Fourier in quanto rileva frequenze distinte.
In un sistema analogico, il segnale è continuo, mentre in un sistema digitale PCM, l'ampiezza del segnale è limitata a uno di un insieme fisso di valori o numeri. Questo metodo è noto come quantizzazione. Ogni valore codificato è un passo discreto; Se un segnale viene quantizzato senza dithering, ci sarà una distorsione di quantizzazione associata al segnale di ingresso originale... Per evitare ciò, il segnale viene ditherato
, una procedura che elimina matematicamente le armoniche e altre distorsioni altamente indesiderabili e le sostituisce con un livello costante e fisso di rumore.
Durante il processo di produzione, viene spesso utilizzato un numero maggiore di bit per rappresentare ogni campione; Questo deve essere ridotto a 16 bit per creare un compact disc.
Ci sono numerosi modi per raggiungere questo obiettivo. Si può, ad esempio, scartare i bit in più; Questa operazione è nota come troncamento. Inoltre, è possibile arrotondare i bit in eccesso al valore più vicino. Ognuna di queste strategie, tuttavia, produce errori prevedibili e calcolabili. Il dithering sostituisce queste imprecisioni con un livello di rumore continuo e fisso.
Esempi di esempi audio di troncamento a 6 bit
Sinusoide a 16 bit
ridotto a sei bit
ridotto a 6 bit
Hai problemi a riprodurre questi file? Vedere Supporto multimediale.
Prendiamo, ad esempio, una forma d'onda con i seguenti valori:
1 2 3 4 5 6 7 8
Se la forma d'onda viene diminuita del 20%, si ottengono i seguenti valori:
0.8 1.6 2.4 3.2 4.0 4.8 5.6 6.4
Se questi valori vengono abbreviati, i dati risultanti sono i seguenti:
0 1 2 3 4 4 5 6
Se invece questi valori vengono arrotondati, si ottengono i seguenti dati:
1 2 2 3 4 5 6 6
La tecnica di ridurre l'ampiezza di qualsiasi forma d'onda originale del 20% si traduce in errori consistenti. Si consideri un'onda sinusoidale che, per una porzione, soddisfi i parametri di cui sopra. Come mostrato nell'esempio precedente, ogni volta che il valore dell'onda sinusoidale raggiungeva 3,2, il risultato accorciato sarebbe sbagliato di 0,2. Ogni volta che il valore dell'onda sinusoidale raggiungeva 4,0, non ci sarebbe alcun errore perché il risultato accorciato sarebbe fuori di 0,0, come illustrato in precedenza. Durante il ciclo dell'onda sinusoidale, l'entità dell'errore varia regolarmente e ripetutamente. Questo errore si rivela specificamente come distorsione. Ciò che l'orecchio percepisce come distorsione è l'informazione aggiuntiva a frequenze discrete risultante da un errore di quantizzazione ricorrente.
Un possibile approccio potrebbe essere quello di arrotondare il numero a due cifre (ad esempio, 4,8) in entrambe le direzioni. Potrebbe essere arrotondato a cinque una volta e poi a quattro la volta successiva. Ciò renderebbe la media a lungo termine di 4,5 anziché 4, avvicinando il valore al suo valore reale nel tempo. Tuttavia, ciò si traduce ancora in un errore determinabile (anche se più complesso). Ogni due volte viene rilevato il valore 4,8, il risultato è un errore dello 0,2% e le altre volte l'errore è 0,8. Ciò si traduce comunque in un errore quantificato e ripetuto.
Un'opzione alternativa potrebbe essere quella di arrotondare 4,8 in modo che quattro volte su cinque venga arrotondato per eccesso a 5 e la quinta volta venga arrotondato per difetto a 4. A lungo termine, la media sarebbe esattamente di 4,8. Sfortunatamente, si verificano ancora guasti ricorrenti e prevedibili e questi difetti continuano a manifestarsi come distorsioni udibili.
Ciò si traduce nella soluzione del dithering. Invece di arrotondare per eccesso o per difetto in modo prevedibile e ripetitivo, è possibile arrotondare per eccesso o per difetto in modo casuale. Se una serie di numeri casuali compresi tra 0,0 e 0,9 (ad esempio, 0,6, 0,1, 0,3, 0,6, 0,9, ecc.) vengono creati e aggiunti a 4,8, due volte su dieci il risultato verrà troncato a 4 (se 0,0 o 0,1 viene aggiunto a 4,8) e otto volte su dieci il risultato verrà troncato a 5. Ogni condizione ha una probabilità del 20% di essere arrotondata a 4 e una probabilità dell'80% di essere arrotondata a 5. La media a lungo termine di questi risultati è 4,8 e il loro errore di quantizzazione è rumore casuale. Questo rumore è meno fastidioso per l'orecchio rispetto alla distorsione misurabile prodotta da altre soluzioni.
Prima della quantizzazione o della ri-quantizzazione, viene introdotto il dithering per disaccoppiare il rumore di quantizzazione dal segnale di ingresso e prevenire il comportamento non lineare (distorsione). La quantizzazione con una profondità di bit inferiore richiede un maggiore dithering. La tecnica provoca ancora una distorsione, ma la distorsione è casuale, quindi il rumore risultante è essenzialmente correlato al segnale desiderato.
Lipshitz e Vanderkooi hanno dimostrato in uno studio seminale pubblicato sull'AES Journal che diversi tipi di rumore con distinte funzioni di densità di probabilità (PDF) reagiscono in modo diverso quando vengono impiegati come segnali di dithering, il dithering può essere utilizzato per interrompere i cicli limite periodici, un problema tipico con i filtri digitali. Tipicamente, il rumore casuale è meno fastidioso dei toni armonici prodotti dai cicli limite.
Funzione della densità di probabilità rettangolare (RPDF) Qualsiasi valore all'interno dell'intervallo definito ha la stessa probabilità di verificarsi all'interno del rumore di dithering.
Funzione della densità di probabilità triangolare (TPDF) Il rumore di dithering ha una distribuzione triangolare; La probabilità che si verifichi è maggiore per i valori al centro dell'intervallo. È possibile ottenere una distribuzione triangolare combinando due sorgenti RPDF separate.
La distribuzione PDF gaussiana ha una distribuzione normale. Questa curva a campana o gaussiana è caratteristica del dithering generato da sorgenti analogiche come i preamplificatori microfonici. Se la profondità di bit di una registrazione è sufficiente, il rumore del preamplificatore sarà adeguato per il dithering della registrazione.
Il noise shaping è una procedura di filtraggio che modifica l'energia spettrale dell'errore di quantizzazione, spesso per deenfatizzare le frequenze a cui l'orecchio è più sensibile o per separare completamente le bande di segnale e rumore. Il fatto che il dithering sia inserito all'interno o all'esterno del ciclo di feedback del noise shaper influisce sul suo spettro finale se viene utilizzato. Se all'interno, il dithering viene considerato come parte del segnale di errore e formato in combinazione con l'errore di quantizzazione reale. Se si trova al di fuori della finestra di quantizzazione, il dithering viene trattato come parte del segnale originale e linearizza la quantizzazione senza essere modellato. In questo caso, il rumore di fondo finale è uguale alla somma dello spettro del dithering piatto