Modello del sistema visivo umano: Comprendere la percezione e l'elaborazione
Di Fouad Sabry
()
Info su questo ebook
Cos'è il modello del sistema visivo umano
Gli esperti nell'elaborazione delle immagini, nell'elaborazione video e nella visione artificiale fanno uso di un modello del sistema visivo umano per affrontare problemi biologici e psicologici processi non ancora completamente compresi. Un esempio di tale modello viene utilizzato per semplificare i comportamenti di un sistema estremamente complesso. Ogni volta che si verifica un miglioramento nella nostra comprensione del sistema visivo reale, il modello viene aggiornato.
Come trarrai vantaggio
(I) Approfondimenti e convalide sui seguenti argomenti:
Capitolo 1: Modello del sistema visivo umano
Capitolo 2: Compressione dei dati
Capitolo 3: Compressione delle immagini
Capitolo 4: Trasformazione della codifica
Capitolo 5: Illusione ottica
Capitolo 6: Sottocampionamento cromatico
Capitolo 7: Artefatto di compressione
Capitolo 8: Scala di grigi
Capitolo 9: Mappatura dei toni
Capitolo 10: Modello di aspetto del colore
(II) Rispondere alle principali domande del pubblico sul modello del sistema visivo umano.
(III) Esempi reali dell'utilizzo del modello del sistema visivo umano in molti campi.
A chi è rivolto questo libro
Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di modello del sistema visivo umano.
Leggi altro di Fouad Sabry
Tecnologie Emergenti Nella Scienza Dei Materiali [Italian]
Correlato a Modello del sistema visivo umano
Titoli di questa serie (100)
Gruppo congiunto di esperti fotografici: Sfruttare la potenza dei dati visivi con lo standard JPEG Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto del colore: Comprendere la percezione e la rappresentazione nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata di Hadamard: Svelare il potere della trasformazione Hadamard nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniIstogramma dell'immagine: Svelare intuizioni visive, esplorare le profondità degli istogrammi delle immagini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCompressione delle immagini: Tecniche efficienti per l'ottimizzazione dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDiffusione anisotropa: Miglioramento dell'analisi delle immagini attraverso la diffusione anisotropa Valutazione: 0 su 5 stelle0 valutazioniRiduzione del rumore: Miglioramento della chiarezza, tecniche avanzate per la riduzione del rumore nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFiltro adattivo: Migliorare la visione artificiale attraverso il filtraggio adattivo Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniIstogramma dei gradienti orientati: Svelare il regno visivo: esplorare l'istogramma dei gradienti orientati nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento dei bordi: Esplorare i confini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFunzione di corrispondenza dei colori: Comprendere la sensibilità spettrale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniEqualizzazione dell'istogramma: Miglioramento del contrasto dell'immagine per una migliore percezione visiva Valutazione: 0 su 5 stelle0 valutazioniContorno attivo: Avanzamento della visione artificiale con tecniche di contorno attivo Valutazione: 0 su 5 stelle0 valutazioniRetinex: Svelare i segreti della visione computazionale con Retinex Valutazione: 0 su 5 stelle0 valutazioniSistema di gestione del colore: Ottimizzazione della percezione visiva negli ambienti digitali Valutazione: 0 su 5 stelle0 valutazioniRidipintura: Colmare le lacune nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione affine: Sbloccare le prospettive visive: esplorare la trasformazione affine nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCorrezione gamma: Migliorare la chiarezza visiva nella visione artificiale: la tecnica di correzione gamma Valutazione: 0 su 5 stelle0 valutazioniModello del sistema visivo umano: Comprendere la percezione e l'elaborazione Valutazione: 0 su 5 stelle0 valutazioniModello a colori: Comprendere lo spettro della visione artificiale: esplorare i modelli di colore Valutazione: 0 su 5 stelle0 valutazioniMetodo di impostazione del livello: Avanzamento della visione artificiale, esplorazione del metodo dell'impostazione dei livelli Valutazione: 0 su 5 stelle0 valutazioniBanca filtri: Approfondimenti sulle tecniche del banco di filtri di Computer Vision Valutazione: 0 su 5 stelle0 valutazioniProfilo colore: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioni
Ebook correlati
Riconoscimento vocale audiovisivo: Progressi, applicazioni e approfondimenti Valutazione: 0 su 5 stelle0 valutazioniCompressione dati: Sbloccare l'efficienza nella visione artificiale con la compressione dei dati Valutazione: 0 su 5 stelle0 valutazioniCompressione delle immagini: Tecniche efficienti per l'ottimizzazione dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniRiconoscimento ottico del Braille: Potenziare l'accessibilità attraverso l'intelligenza visiva Valutazione: 0 su 5 stelle0 valutazioniTagli del grafico di visione artificiale: Esplorazione dei tagli grafici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSegmentazione delle immagini: Sbloccare insight grazie alla precisione dei pixel Valutazione: 0 su 5 stelle0 valutazioniAnnotazione automatica delle immagini: Migliorare la comprensione visiva attraverso il tagging automatico Valutazione: 0 su 5 stelle0 valutazioniGrafica computerizzata: Esplorando l'intersezione tra computer grafica e visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGrafica raster digitale: Svelare la potenza della grafica raster digitale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDither: Rumore visivo nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRendering volumetrico: Esplorare il realismo visivo nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMappatura dei colori: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniEditor di grafica raster: Trasformare le realtà visive: padroneggiare gli editor grafici raster nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSistema di gestione del colore: Ottimizzazione della percezione visiva negli ambienti digitali Valutazione: 0 su 5 stelle0 valutazioniRete di sensori visivi: Esplorare la potenza delle reti di sensori visivi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisualizza la sintesi: Esplorare le prospettive nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRealtà aumentata: Esplorando le frontiere della visione artificiale nella realtà aumentata Valutazione: 0 su 5 stelle0 valutazioniEditor di grafica vettoriale: Potenziare la creazione visiva con algoritmi avanzati Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale: Approfondimenti sul mondo della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGrafica raster: Comprendere i fondamenti della grafica raster nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRecupero delle immagini: Sbloccare la potenza dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniRendering ad alta gamma dinamica: Sbloccare lo spettro visivo: tecniche avanzate nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSistema di riconoscimento facciale: Sbloccare il potere dell'intelligenza visiva Valutazione: 0 su 5 stelle0 valutazioniRilevamento oggetti: Progressi, applicazioni e algoritmi Valutazione: 0 su 5 stelle0 valutazioniParola visiva: Sbloccare il potere della comprensione delle immagini Valutazione: 0 su 5 stelle0 valutazioniElaborazione delle immagini piramidali: Esplorare le profondità dell'analisi visiva Valutazione: 0 su 5 stelle0 valutazioniIl Data mining e gli algoritmi di classificazione Valutazione: 1 su 5 stelle1/5Classificazione delle immagini contestuali: Comprendere i dati visivi per una classificazione efficace Valutazione: 0 su 5 stelle0 valutazioniTexture Mapping: Esplorare la dimensionalità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioni
Intelligenza artificiale e semantica per voi
ANonniMus: Vecchi rivoluzionari contro giovani robot Valutazione: 0 su 5 stelle0 valutazioniSelf-Publishing del Futuro per Scrittori 2.0: Self-Publishing Facile Valutazione: 0 su 5 stelle0 valutazioniGuida Intelligenza Artificiale Valutazione: 0 su 5 stelle0 valutazioniIl Terzo Like Valutazione: 0 su 5 stelle0 valutazioni
Recensioni su Modello del sistema visivo umano
0 valutazioni0 recensioni
Anteprima del libro
Modello del sistema visivo umano - Fouad Sabry
Capitolo 1: Modello del sistema visivo umano
Gli esperti nel campo dell'elaborazione delle immagini, dell'elaborazione video e della visione artificiale utilizzano un modello del sistema visivo umano (modello HVS) per tenere conto dei processi biologici e psicologici che sono ancora poco compresi. Un modello di questo tipo viene impiegato per ridurre la complessità del comportamento del sistema. Il modello viene rivisto man mano che la nostra comprensione del sistema visivo reale cresce.
L'analisi della percezione visiva è nota come ricerca psicovisiva
.A questo punto,
È possibile manipolare la propria percezione e visione utilizzando un modello del sistema visivo umano. La televisione a colori, la compressione lossy e la televisione a tubo catodico (CRT) sono tutte applicazioni del paradigma HVS.
Un tempo si credeva che i requisiti di larghezza di banda della televisione a colori fossero troppo grandi per la tecnologia esistente. La risoluzione del colore dell'HVS è risultata essere di gran lunga inferiore alla sua risoluzione di luminosità, il che significa che il sottocampionamento della crominanza può essere utilizzato per comprimere più colore nel segnale.
I formati di compressione delle immagini con perdita di dati, come il JPEG, ne sono un altro esempio. Secondo il nostro modello HVS, non siamo in grado di distinguere i dettagli ad alta frequenza; di conseguenza, JPEG ci consente di quantizzare queste parti senza un notevole calo di qualità. Il filtro Bandstop viene utilizzato nella compressione audio per rimuovere le frequenze che gli esseri umani non possono sentire.
Durante il nostro passato evolutivo, quando gli esseri umani dovevano proteggersi o cercare cibo, abbiamo adattato diversi aspetti dell'HVS. Le proprietà HVS sono spesso visualizzate nelle illusioni ottiche.
A causa della carenza di bastoncelli, l'occhio umano funziona come un filtro passa-basso. per visualizzare le bande di Mach
Risoluzione del colore inaccettabile (meno coni nell'occhio umano rispetto ai bastoncelli)
Sensibilità al movimento
maggiore sensibilità verso l'ambiente circostante
Vedere un animale mimetizzato ha un effetto molto più profondo rispetto al semplice percepire la sua consistenza.
In 3D si può porre più enfasi sulla texture che sulla disparità.
Riconoscimento facciale integrato (i bambini sorridono ai volti)
Una profondità del viso invertita dall'aspetto normale (le caratteristiche del viso prevalgono sulle informazioni sulla profondità)
Anche con la bocca e gli occhi capovolti, il viso invertito appare normale.
Il cinema e la televisione utilizzano lo sfarfallio ad alte frequenze per indurre lo spettatore a percepire un'immagine continua sfruttando la persistenza della visione.
Per creare l'illusione di una frequenza di sfarfallio più elevata, i televisori interlacciati dipingono mezze immagini.
Diffusione del colore (crominanza a metà risoluzione della luminanza corrispondente alle proporzioni di coni e bastoncelli nell'occhio)
Comprimere un'immagine (difficile vedere le frequenze più alte quantizzate in modo più duro)
Stima del movimento (usa la luminanza e ignora il colore)
Filigrana e steganografia
{Fine Capitolo 1}
Capitolo 2: Compressione dei dati
Nella teoria dell'informazione, nella compressione dei dati, nella codifica della sorgente e in altri campi correlati: nel linguaggio comune, un dispositivo che si impegna nel processo di compressione dei dati è noto come codificatore, mentre un dispositivo che si impegna nell'inverso del processo, cioè la decompressione, è noto come decodificatore.
La compressione dei dati è il processo di riduzione delle dimensioni di un file di dati ed è un termine che viene utilizzato piuttosto spesso. La codifica di origine è un processo di codifica che avviene nell'origine dati originale, prima che i dati vengano archiviati o trasferiti. Questo processo viene definito nell'ambito della trasmissione dei dati. È importante non confondere la codifica sorgente con altri tipi di codifica, come la codifica dei canali, che viene utilizzata per il rilevamento e la correzione degli errori, o la codifica a linee, che è un metodo per mappare i dati su un segnale.
La compressione dei dati è vantaggiosa poiché riduce la quantità di spazio e larghezza di banda necessaria per archiviare e trasferire le informazioni. Le procedure di compressione e decompressione richiedono entrambe una quantità significativa di risorse computazionali. Il compromesso tra complessità spazio-temporale è qualcosa che deve essere considerato quando si comprimono i dati. Ad esempio, un metodo di compressione video potrebbe richiedere hardware costoso per consentire al video di essere decompresso abbastanza rapidamente da poter essere guardato durante la decompressione. Inoltre, l'opzione per decomprimere completamente il video prima di guardarlo potrebbe essere scomoda o richiedere spazio di archiviazione aggiuntivo. Quando si progettano schemi di compressione dei dati, i progettisti devono trovare un compromesso tra una serie di fattori diversi. Questi fattori includono il livello di compressione raggiunto, la quantità di distorsione introdotta (quando si utilizza la compressione dei dati con perdita di dati) e la quantità di risorse computazionali necessarie per comprimere e decomprimere i dati.
Al fine di rappresentare i dati senza perdere alcuna informazione nel processo, i metodi di compressione dei dati senza perdita di dati spesso utilizzano la ridondanza statistica. In questo modo si garantisce che il processo possa essere invertito. Poiché la stragrande maggioranza dei dati nel mondo reale ha una ridondanza statistica, la compressione senza perdita di dati è fattibile. Ad esempio, un'immagine può includere macchie di colore che non cambiano nel corso di più pixel; In questo caso, i dati possono essere registrati come 279 pixel rossi
piuttosto che come la notazione tradizionale di pixel rosso, pixel rosso,...
Questo è un esempio fondamentale della codifica run-length; Esistono molti altri metodi per ridurre le dimensioni di un file rimuovendo le informazioni ridondanti.
Le tecniche di compressione come Lempel-Ziv (LZ) sono oggi tra gli algoritmi più utilizzati per l'archiviazione dei dati senza perdita di dati. Le voci di tabella vengono sostituite per le stringhe ripetute di dati nella tecnica di compressione LZ, che è un modello di compressione basato su tabelle. Questa tabella viene creata dinamicamente per la maggior parte degli algoritmi LZ utilizzando i dati delle fasi precedenti dell'input. Nella maggior parte dei casi, la tabella stessa è codificata da Huffman. I codici basati sulla grammatica come questo sono in grado di comprimere con successo input sostanzialmente ripetitivi, come una raccolta di dati biologici della stessa specie o quasi imparentata, una massiccia raccolta di documenti versionati, archivi Internet e così via. Costruire una grammatica libera dal contesto che derivi una singola stringa è l'impresa fondamentale dei sistemi di codifica basati sulla grammatica. Sequitur e Re-Pair sono altre due tecniche per comprimere la grammatica che hanno applicazioni pratiche.
I modelli probabilistici, come la predizione per corrispondenza parziale, sono utilizzati nei più potenti compressori lossless sviluppati negli ultimi tempi. La modellazione statistica indiretta è un altro modo di pensare alla trasformata di Burrows-Wheeler, che si può anche prendere in considerazione.
Più o meno nello stesso periodo in cui le foto digitali si stavano diffondendo alla fine degli anni '80, sono stati sviluppati