Classificazione delle immagini contestuali: Comprendere i dati visivi per una classificazione efficace
Di Fouad Sabry
()
Info su questo ebook
Che cos'è la classificazione delle immagini contestuali
Un metodo di classificazione basato sulle informazioni contestuali contenute nelle immagini viene definito classificazione delle immagini contestuali. Questo metodo rientra nella categoria del riconoscimento di schemi nella visione artificiale. Un approccio "contestuale" è quello che si concentra sulla relazione tra i pixel che sono vicini tra loro, chiamata anche vicinato. La classificazione delle fotografie in base all'utilizzo delle informazioni contestuali è l'obiettivo di questo approccio.
Come trarrai vantaggio
(I) Approfondimenti e convalide sui seguenti argomenti:
Capitolo 1: Classificazione di immagini contestuali
Capitolo 2: Riconoscimento di pattern
Capitolo 3: Processo gaussiano
Capitolo 4: LPBoost
Capitolo 5: One-shot learning (visione artificiale)
Capitolo 6: Macchina vettoriale con supporto dei minimi quadrati
Capitolo 7: Diffrazione di Fraunhofer equazione
Capitolo 8: Simmetria nella meccanica quantistica
Capitolo 9: Modellazione gerarchica bayesiana
Capitolo 10: Sottoproblemi di Paden-Kahan
( II) Rispondere alle principali domande del pubblico sulla classificazione delle immagini contestuali.
(III) Esempi reali dell'utilizzo della classificazione delle immagini contestuali in molti campi.
Chi è questo libro per
Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di classificazione delle immagini contestuali.
Leggi altro di Fouad Sabry
Tecnologie Emergenti Nell'Energia [Italian]
Correlato a Classificazione delle immagini contestuali
Titoli di questa serie (100)
Equalizzazione dell'istogramma: Miglioramento del contrasto dell'immagine per una migliore percezione visiva Valutazione: 0 su 5 stelle0 valutazioniCorrezione gamma: Migliorare la chiarezza visiva nella visione artificiale: la tecnica di correzione gamma Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDiffusione anisotropa: Miglioramento dell'analisi delle immagini attraverso la diffusione anisotropa Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniIstogramma dell'immagine: Svelare intuizioni visive, esplorare le profondità degli istogrammi delle immagini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione affine: Sbloccare le prospettive visive: esplorare la trasformazione affine nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRetinex: Svelare i segreti della visione computazionale con Retinex Valutazione: 0 su 5 stelle0 valutazioniPercezione visiva: Approfondimenti sull'elaborazione visiva computazionale Valutazione: 0 su 5 stelle0 valutazioniRidipintura: Colmare le lacune nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCompressione delle immagini: Tecniche efficienti per l'ottimizzazione dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniVisione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento dei bordi: Esplorare i confini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSpazio colore: Esplorare lo spettro della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniBanca filtri: Approfondimenti sulle tecniche del banco di filtri di Computer Vision Valutazione: 0 su 5 stelle0 valutazioniGruppo congiunto di esperti fotografici: Sfruttare la potenza dei dati visivi con lo standard JPEG Valutazione: 0 su 5 stelle0 valutazioniTrasformata di Hadamard: Svelare il potere della trasformazione Hadamard nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello del sistema visivo umano: Comprendere la percezione e l'elaborazione Valutazione: 0 su 5 stelle0 valutazioniRiduzione del rumore: Miglioramento della chiarezza, tecniche avanzate per la riduzione del rumore nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniIstogramma dei gradienti orientati: Svelare il regno visivo: esplorare l'istogramma dei gradienti orientati nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFunzione di corrispondenza dei colori: Comprendere la sensibilità spettrale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento dei contorni: Svelare l'arte della percezione visiva nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello a colori: Comprendere lo spettro della visione artificiale: esplorare i modelli di colore Valutazione: 0 su 5 stelle0 valutazioniConsenso del campione casuale: Stima robusta nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento delle macchie: Scoprire modelli nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniFiltro adattivo: Migliorare la visione artificiale attraverso il filtraggio adattivo Valutazione: 0 su 5 stelle0 valutazioni
Ebook correlati
Segmentazione delle immagini: Sbloccare insight grazie alla precisione dei pixel Valutazione: 0 su 5 stelle0 valutazioniRegolazione del pacchetto: Ottimizzazione dei dati visivi per una ricostruzione precisa Valutazione: 0 su 5 stelle0 valutazioniTagli del grafico di visione artificiale: Esplorazione dei tagli grafici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniElaborazione delle immagini piramidali: Esplorare le profondità dell'analisi visiva Valutazione: 0 su 5 stelle0 valutazioniMosaicazione di documenti: Sbloccare intuizioni visive attraverso il mosaico di documenti Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniConsenso del campione casuale: Stima robusta nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento dei bordi: Esplorare i confini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFlusso ottico: Esplorazione di modelli visivi dinamici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniStima del movimento: Progressi e applicazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di feature invarianti di scala: Svelare il potere della trasformazione delle caratteristiche invarianti su scala nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGrafica di ray-tracing: Esplorazione del rendering fotorealistico nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniApprendimento delle caratteristiche geometriche: Sbloccare le intuizioni visive attraverso l'apprendimento delle caratteristiche geometriche Valutazione: 0 su 5 stelle0 valutazioniIlluminazione globale: Visione avanzata: approfondimenti sull'illuminazione globale Valutazione: 0 su 5 stelle0 valutazioniScala dello spazio: Esplorare le dimensioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniEditor di grafica raster: Trasformare le realtà visive: padroneggiare gli editor grafici raster nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModellazione e rendering basati su immagini: Esplorare il realismo visivo: tecniche di visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGrafica raster: Comprendere i fondamenti della grafica raster nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisualizza la sintesi: Esplorare le prospettive nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniAlgoritmo di disegno di linee: Padroneggiare le tecniche per il rendering di immagini di precisione Valutazione: 0 su 5 stelle0 valutazioniMappatura dei colori: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto attivo: Sbloccare la potenza dei modelli di aspetto attivo nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniComputer grafica della radiosità: Avanzamento della visualizzazione attraverso la radiosità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale: Approfondimenti sul mondo della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTexture Mapping: Esplorare la dimensionalità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGrafica raster digitale: Svelare la potenza della grafica raster digitale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRecupero di immagini basato sul contenuto: Sbloccare i database visivi Valutazione: 0 su 5 stelle0 valutazioni
Intelligenza artificiale e semantica per voi
Guida Intelligenza Artificiale Valutazione: 0 su 5 stelle0 valutazioniANonniMus: Vecchi rivoluzionari contro giovani robot Valutazione: 0 su 5 stelle0 valutazioniIl Terzo Like Valutazione: 0 su 5 stelle0 valutazioni
Recensioni su Classificazione delle immagini contestuali
0 valutazioni0 recensioni
Anteprima del libro
Classificazione delle immagini contestuali - Fouad Sabry
Capitolo 1: Classificazione contestuale delle immagini
La classificazione contestuale delle immagini, un sottocampo del riconoscimento dei modelli nella visione artificiale, è una tecnica di classificazione basata sulle informazioni contestuali nelle immagini. Il termine contestuale
indica che questo metodo enfatizza il legame tra i pixel circostanti, spesso noto come quartiere. L'obiettivo di questo metodo è classificare le foto utilizzando informazioni contestuali.
Analogamente all'elaborazione del linguaggio, una singola parola può avere diverse interpretazioni a meno che non venga fornito il contesto e le uniche parti informative sono i modelli di frase. Per le foto, vale la stessa idea. Determinare i modelli e i loro significati appropriati.
Come dimostra l'immagine qui sotto, se viene visualizzata solo una piccola sezione dell'immagine, è estremamente difficile determinare cosa raffigura l'immagine.
MouthAnche se viene esaminata un'altra area dell'immagine, l'immagine rimane impossibile da categorizzare.
Left eyeTuttavia, se miglioriamo il contesto dell'immagine, ha più senso riconoscerla.
Come dimostra l'immagine nella sua interezza di seguito, praticamente tutti possono classificarla con facilità.
Durante l'operazione di segmentazione, i sistemi che non utilizzano informazioni contestuali sono sensibili al rumore e ai cambiamenti, con il risultato di un gran numero di aree classificate in modo errato, che sono spesso di piccole dimensioni (ad esempio, un pixel).
Questo metodo è più resistente al rumore e alle grandi variazioni rispetto ad altri metodi poiché considera la continuità dei segmenti.
Diversi metodi per questa strategia sono descritti in dettaglio di seguito.
Questo metodo è abbastanza efficace contro luoghi che causano rumore minore. E queste piccole zone sono in genere composte da pochi o da un singolo pixel. Queste regioni ricevono l'etichetta più probabile. Tuttavia, questa strategia ha uno svantaggio. Le piccole regioni possono anche essere generate dalle regioni giuste anziché dal rumore, nel qual caso la strategia in realtà peggiora la classificazione. Questo metodo è ampiamente utilizzato nelle applicazioni di telerilevamento.
Ciò comporta due fasi di classificazione:
Etichettare ogni pixel e generare un nuovo vettore di feature per ogni pixel.
Utilizzare il vettore di funzionalità aggiornato e le informazioni contestuali per applicare l'etichetta finale.
Invece di utilizzare singoli pixel, i pixel adiacenti possono essere combinati in aree omogenee che traggono vantaggio dai dati contestuali. E fornire queste aree al classificatore.
In rari casi, i dati spettrali originali possono essere integrati da informazioni contestuali trasportate da pixel vicini, o addirittura sostituiti. Questo tipo di tecniche di pre-elaborazione è comunemente impiegato nel riconoscimento di immagini strutturate. I metodi tipici includono i valori medi, le varianze, la descrizione della trama, ecc.
Il classificatore assegna etichette ai pixel utilizzando il livello di grigio e l'area di pixel (informazioni contestuali). In questo caso, i dati sono una combinazione di informazioni spettrali e geografiche.
Il classificatore di errore minimo di Bayes viene utilizzato per la classificazione contestuale dei dati dell'immagine (noto anche come classificatore di Bayes naïve).
Visualizzare il pixel:
Un pixel è indicato come x_{0} .
L'intorno di ogni pixel x_{0} è un vettore e indicato come {\displaystyle N(x_{0})} .
I valori nel vettore di prossimità sono indicati come f(x_{i}) .
Ogni pixel è rappresentato da un vettore.
{\displaystyle \xi =\left(f(x_{0}),f(x_{1}),\ldots ,f(x_{k})\right)}{\displaystyle x_{i}\in N(x_{0});\quad i=1,\ldots ,k}Le etichette (classificazione) dei pixel nelle vicinanze {\displaystyle N(x_{0})} sono presentate come vettori
{\displaystyle \eta =\left(\theta _{0},\theta _{1},\ldots ,\theta _{k}\right)}{\displaystyle \theta _{i}\in \left\{\omega _{0},\omega _{1},\ldots ,\omega _{k}\right\}}\omega _{s} qui indica la classe assegnata.
Un vettore presenta le etichette nelle vicinanze {\displaystyle N(x_{0})} senza il pixel x_{0}
{\displaystyle {\hat {\eta }}=\left(\theta _{1},\theta _{2},\ldots ,\theta _{k}\right)}Il quartiere: la dimensione del quartiere.
Non ci sono restrizioni di dimensione, ma è considerato relativamente piccolo per ogni pixel x_{0} .
Una dimensione ragionevole del quartiere sarebbe 3 \times 3 di 4 o 8 connettività ( x_{0} è contrassegnato come rosso e posizionato al centro).
Comunità a 4 connettività, comunità a 8 connettività
Il calcolo:
Applica la classificazione dell'errore minimo su un pixel x_{0} , se la probabilità che una classe \omega _{r} presenti il pixel x_{0} è la più alta tra tutte, assegna \omega _{r} come sua classe.
{\displaystyle \theta _{0}=\omega _{r}\quad {\text{ if }}\quad P(\omega _{r}\mid f(x_{0}))=\max _{s=1,2,\ldots ,R}P(\omega _{s}\mid f(x_{0}))}Di seguito è riportata una descrizione della regola di classificazione contestuale: utilizza il vettore di funzionalità x_{1} anziché x_{0} .
{\displaystyle \theta _{0}=\omega _{r}\quad {\text{ if }}\quad P(\omega _{r}\mid \xi )=\max _{s=1,2,\ldots ,R}P(\omega _{s}\mid \xi )}Usa la formula di Bayes per calcolare la probabilità a posteriori {\displaystyle P(\omega _{s}\mid \xi )}
{\displaystyle P(\omega _{s}\mid \xi )={\frac {p(\xi \mid \omega _{s})P(\omega _{s})}{p\left(\xi \right)}}}Uguale al numero di pixel in un'immagine, anche il numero di vettori è uguale.
Per il classificatore utilizza un vettore corrispondente a ciascun pixel x_{i} e il vettore è formato dall'intorno del pixel.
Le procedure fondamentali per la categorizzazione contestuale delle immagini:
Calcola il vettore della feature \xi per ogni pixel.
Calcolare i parametri della distribuzione di probabilità {\displaystyle p(\xi \mid \omega _{s})} e {\displaystyle P(\omega _{s})}
Calcola le probabilità a posteriori {\displaystyle P(\omega _{r}\mid \xi )} e tutte le etichette \theta _{0} .
Ottenere il risultato della classificazione delle immagini.
L'abbinamento dei modelli è un'applicazione brute force
di questa strategia. L'obiettivo è stabilire una serie di modelli e quindi cercare piccoli componenti di immagine che corrispondano a un modello.
Questa tecnica è ad alta intensità computazionale e inefficace.
Mantiene un elenco completo di modelli durante l'intero processo e il numero di combinazioni possibili è incredibilmente alto.
Per un m\times n 'immagine pixel, potrebbe esserci un massimo di {\displaystyle 2^{m\times n}} combinazioni, si traduce in un calcolo intensivo.
Si tratta di una strategia dall'alto verso il basso, comunemente nota come ricerca su tabelle o su dizionario.
La catena di Markov è applicabile anche al riconoscimento di pattern. I pixel in un'immagine possono essere identificati come un insieme di variabili casuali, e quindi la catena di Markov di ordine inferiore può essere utilizzata per determinare la loro relazione. L'approccio tratta l'immagine come una linea virtuale e utilizza la probabilità condizionata.
La curva di Hilbert attraversa ogni pixel senza tornare a nessuno di essi due volte e mantiene una curva continua su tutta l'immagine. È rapido ed efficace.
La catena di Markov di ordine inferiore e le curve di riempimento dello spazio di Hilbert sopra menzionate trattano l'immagine come una struttura lineare. Tuttavia, le mesh di Markov terranno conto delle informazioni bidimensionali.
L'albero delle dipendenze è un metodo per approssimare le distribuzioni di probabilità tramite la dipendenza dall'albero.
{Fine Capitolo 1}
Capitolo 2: Riconoscimento dei modelli
Il processo di riconoscimento automatico di modelli e regolarità all'interno dei dati è noto come riconoscimento di modelli. L'analisi statistica dei dati, l'elaborazione dei segnali, l'analisi delle immagini, il recupero delle informazioni, la bioinformatica, la compressione dei dati, la computer grafica e l'apprendimento automatico sono solo alcuni dei campi che possono beneficiare del suo utilizzo. I campi della statistica e dell'ingegneria sono quelli in cui il riconoscimento dei modelli ha avuto il suo inizio; Alcuni metodi contemporanei di riconoscimento dei modelli prevedono l'uso dell'apprendimento automatico, reso possibile dalla crescente disponibilità di enormi quantità di dati e dalla maggiore capacità di calcolo. Entrambe queste attività possono essere considerate due facce dello stesso settore applicativo ed entrambe queste attività hanno visto una crescita significativa nel corso degli ultimi decenni.
L'addestramento per i sistemi di riconoscimento dei modelli avviene spesso utilizzando dati che sono stati classificati come addestramento
. Quando non sono disponibili dati etichettati, possono essere utilizzate tecniche alternative per identificare modelli che non erano noti prima. Sia il KDD che il data mining pongono una maggiore enfasi sulle tecniche di analisi non supervisionate e hanno una relazione più profonda con le applicazioni pratiche nell'industria. L'identificazione dei pattern pone una maggiore enfasi sul segnale