Scopri milioni di eBook, audiolibri e tanto altro ancora con una prova gratuita

Solo $11.99/mese al termine del periodo di prova. Cancella quando vuoi.

Classificazione delle immagini contestuali: Comprendere i dati visivi per una classificazione efficace
Classificazione delle immagini contestuali: Comprendere i dati visivi per una classificazione efficace
Classificazione delle immagini contestuali: Comprendere i dati visivi per una classificazione efficace
E-book154 pagine1 ora

Classificazione delle immagini contestuali: Comprendere i dati visivi per una classificazione efficace

Valutazione: 0 su 5 stelle

()

Leggi anteprima

Info su questo ebook

Che cos'è la classificazione delle immagini contestuali


Un metodo di classificazione basato sulle informazioni contestuali contenute nelle immagini viene definito classificazione delle immagini contestuali. Questo metodo rientra nella categoria del riconoscimento di schemi nella visione artificiale. Un approccio "contestuale" è quello che si concentra sulla relazione tra i pixel che sono vicini tra loro, chiamata anche vicinato. La classificazione delle fotografie in base all'utilizzo delle informazioni contestuali è l'obiettivo di questo approccio.


Come trarrai vantaggio


(I) Approfondimenti e convalide sui seguenti argomenti:


Capitolo 1: Classificazione di immagini contestuali


Capitolo 2: Riconoscimento di pattern


Capitolo 3: Processo gaussiano


Capitolo 4: LPBoost


Capitolo 5: One-shot learning (visione artificiale)


Capitolo 6: Macchina vettoriale con supporto dei minimi quadrati


Capitolo 7: Diffrazione di Fraunhofer equazione


Capitolo 8: Simmetria nella meccanica quantistica


Capitolo 9: Modellazione gerarchica bayesiana


Capitolo 10: Sottoproblemi di Paden-Kahan


( II) Rispondere alle principali domande del pubblico sulla classificazione delle immagini contestuali.


(III) Esempi reali dell'utilizzo della classificazione delle immagini contestuali in molti campi.


Chi è questo libro per


Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di classificazione delle immagini contestuali.


 


 

LinguaItaliano
Data di uscita5 mag 2024
Classificazione delle immagini contestuali: Comprendere i dati visivi per una classificazione efficace

Leggi altro di Fouad Sabry

Autori correlati

Correlato a Classificazione delle immagini contestuali

Titoli di questa serie (100)

Visualizza altri

Ebook correlati

Intelligenza artificiale e semantica per voi

Visualizza altri

Articoli correlati

Recensioni su Classificazione delle immagini contestuali

Valutazione: 0 su 5 stelle
0 valutazioni

0 valutazioni0 recensioni

Cosa ne pensi?

Tocca per valutare

La recensione deve contenere almeno 10 parole

    Anteprima del libro

    Classificazione delle immagini contestuali - Fouad Sabry

    Capitolo 1: Classificazione contestuale delle immagini

    La classificazione contestuale delle immagini, un sottocampo del riconoscimento dei modelli nella visione artificiale, è una tecnica di classificazione basata sulle informazioni contestuali nelle immagini. Il termine contestuale indica che questo metodo enfatizza il legame tra i pixel circostanti, spesso noto come quartiere. L'obiettivo di questo metodo è classificare le foto utilizzando informazioni contestuali.

    Analogamente all'elaborazione del linguaggio, una singola parola può avere diverse interpretazioni a meno che non venga fornito il contesto e le uniche parti informative sono i modelli di frase. Per le foto, vale la stessa idea. Determinare i modelli e i loro significati appropriati.

    Come dimostra l'immagine qui sotto, se viene visualizzata solo una piccola sezione dell'immagine, è estremamente difficile determinare cosa raffigura l'immagine.

    Mouth

    Anche se viene esaminata un'altra area dell'immagine, l'immagine rimane impossibile da categorizzare.

    Left eye

    Tuttavia, se miglioriamo il contesto dell'immagine, ha più senso riconoscerla.

    Come dimostra l'immagine nella sua interezza di seguito, praticamente tutti possono classificarla con facilità.

    Durante l'operazione di segmentazione, i sistemi che non utilizzano informazioni contestuali sono sensibili al rumore e ai cambiamenti, con il risultato di un gran numero di aree classificate in modo errato, che sono spesso di piccole dimensioni (ad esempio, un pixel).

    Questo metodo è più resistente al rumore e alle grandi variazioni rispetto ad altri metodi poiché considera la continuità dei segmenti.

    Diversi metodi per questa strategia sono descritti in dettaglio di seguito.

    Questo metodo è abbastanza efficace contro luoghi che causano rumore minore. E queste piccole zone sono in genere composte da pochi o da un singolo pixel. Queste regioni ricevono l'etichetta più probabile. Tuttavia, questa strategia ha uno svantaggio. Le piccole regioni possono anche essere generate dalle regioni giuste anziché dal rumore, nel qual caso la strategia in realtà peggiora la classificazione. Questo metodo è ampiamente utilizzato nelle applicazioni di telerilevamento.

    Ciò comporta due fasi di classificazione:

    Etichettare ogni pixel e generare un nuovo vettore di feature per ogni pixel.

    Utilizzare il vettore di funzionalità aggiornato e le informazioni contestuali per applicare l'etichetta finale.

    Invece di utilizzare singoli pixel, i pixel adiacenti possono essere combinati in aree omogenee che traggono vantaggio dai dati contestuali. E fornire queste aree al classificatore.

    In rari casi, i dati spettrali originali possono essere integrati da informazioni contestuali trasportate da pixel vicini, o addirittura sostituiti. Questo tipo di tecniche di pre-elaborazione è comunemente impiegato nel riconoscimento di immagini strutturate. I metodi tipici includono i valori medi, le varianze, la descrizione della trama, ecc.

    Il classificatore assegna etichette ai pixel utilizzando il livello di grigio e l'area di pixel (informazioni contestuali). In questo caso, i dati sono una combinazione di informazioni spettrali e geografiche.

    Il classificatore di errore minimo di Bayes viene utilizzato per la classificazione contestuale dei dati dell'immagine (noto anche come classificatore di Bayes naïve).

    Visualizzare il pixel:

    Un pixel è indicato come x_{0} .

    L'intorno di ogni pixel x_{0} è un vettore e indicato come {\displaystyle N(x_{0})} .

    I valori nel vettore di prossimità sono indicati come f(x_{i}) .

    Ogni pixel è rappresentato da un vettore.

    {\displaystyle \xi =\left(f(x_{0}),f(x_{1}),\ldots ,f(x_{k})\right)}{\displaystyle x_{i}\in N(x_{0});\quad i=1,\ldots ,k}

    Le etichette (classificazione) dei pixel nelle vicinanze {\displaystyle N(x_{0})} sono presentate come vettori

    {\displaystyle \eta =\left(\theta _{0},\theta _{1},\ldots ,\theta _{k}\right)}{\displaystyle \theta _{i}\in \left\{\omega _{0},\omega _{1},\ldots ,\omega _{k}\right\}}

    \omega _{s} qui indica la classe assegnata.

    Un vettore presenta le etichette nelle vicinanze {\displaystyle N(x_{0})} senza il pixel x_{0}

    {\displaystyle {\hat {\eta }}=\left(\theta _{1},\theta _{2},\ldots ,\theta _{k}\right)}

    Il quartiere: la dimensione del quartiere.

    Non ci sono restrizioni di dimensione, ma è considerato relativamente piccolo per ogni pixel x_{0} .

    Una dimensione ragionevole del quartiere sarebbe 3 \times 3 di 4 o 8 connettività ( x_{0} è contrassegnato come rosso e posizionato al centro).

    Comunità a 4 connettività, comunità a 8 connettività

    Il calcolo:

    Applica la classificazione dell'errore minimo su un pixel x_{0} , se la probabilità che una classe \omega _{r} presenti il pixel x_{0} è la più alta tra tutte, assegna \omega _{r} come sua classe.

    {\displaystyle \theta _{0}=\omega _{r}\quad {\text{ if }}\quad P(\omega _{r}\mid f(x_{0}))=\max _{s=1,2,\ldots ,R}P(\omega _{s}\mid f(x_{0}))}

    Di seguito è riportata una descrizione della regola di classificazione contestuale: utilizza il vettore di funzionalità x_{1} anziché x_{0} .

    {\displaystyle \theta _{0}=\omega _{r}\quad {\text{ if }}\quad P(\omega _{r}\mid \xi )=\max _{s=1,2,\ldots ,R}P(\omega _{s}\mid \xi )}

    Usa la formula di Bayes per calcolare la probabilità a posteriori {\displaystyle P(\omega _{s}\mid \xi )}

    {\displaystyle P(\omega _{s}\mid \xi )={\frac {p(\xi \mid \omega _{s})P(\omega _{s})}{p\left(\xi \right)}}}

    Uguale al numero di pixel in un'immagine, anche il numero di vettori è uguale.

    Per il classificatore utilizza un vettore corrispondente a ciascun pixel x_{i} e il vettore è formato dall'intorno del pixel.

    Le procedure fondamentali per la categorizzazione contestuale delle immagini:

    Calcola il vettore della feature \xi per ogni pixel.

    Calcolare i parametri della distribuzione di probabilità {\displaystyle p(\xi \mid \omega _{s})} e {\displaystyle P(\omega _{s})}

    Calcola le probabilità a posteriori {\displaystyle P(\omega _{r}\mid \xi )} e tutte le etichette \theta _{0} .

    Ottenere il risultato della classificazione delle immagini.

    L'abbinamento dei modelli è un'applicazione brute force di questa strategia. L'obiettivo è stabilire una serie di modelli e quindi cercare piccoli componenti di immagine che corrispondano a un modello.

    Questa tecnica è ad alta intensità computazionale e inefficace.

    Mantiene un elenco completo di modelli durante l'intero processo e il numero di combinazioni possibili è incredibilmente alto.

    Per un m\times n 'immagine pixel, potrebbe esserci un massimo di {\displaystyle 2^{m\times n}} combinazioni, si traduce in un calcolo intensivo.

    Si tratta di una strategia dall'alto verso il basso, comunemente nota come ricerca su tabelle o su dizionario.

    La catena di Markov è applicabile anche al riconoscimento di pattern. I pixel in un'immagine possono essere identificati come un insieme di variabili casuali, e quindi la catena di Markov di ordine inferiore può essere utilizzata per determinare la loro relazione. L'approccio tratta l'immagine come una linea virtuale e utilizza la probabilità condizionata.

    La curva di Hilbert attraversa ogni pixel senza tornare a nessuno di essi due volte e mantiene una curva continua su tutta l'immagine. È rapido ed efficace.

    La catena di Markov di ordine inferiore e le curve di riempimento dello spazio di Hilbert sopra menzionate trattano l'immagine come una struttura lineare. Tuttavia, le mesh di Markov terranno conto delle informazioni bidimensionali.

    L'albero delle dipendenze è un metodo per approssimare le distribuzioni di probabilità tramite la dipendenza dall'albero.

    {Fine Capitolo 1}

    Capitolo 2: Riconoscimento dei modelli

    Il processo di riconoscimento automatico di modelli e regolarità all'interno dei dati è noto come riconoscimento di modelli. L'analisi statistica dei dati, l'elaborazione dei segnali, l'analisi delle immagini, il recupero delle informazioni, la bioinformatica, la compressione dei dati, la computer grafica e l'apprendimento automatico sono solo alcuni dei campi che possono beneficiare del suo utilizzo. I campi della statistica e dell'ingegneria sono quelli in cui il riconoscimento dei modelli ha avuto il suo inizio; Alcuni metodi contemporanei di riconoscimento dei modelli prevedono l'uso dell'apprendimento automatico, reso possibile dalla crescente disponibilità di enormi quantità di dati e dalla maggiore capacità di calcolo. Entrambe queste attività possono essere considerate due facce dello stesso settore applicativo ed entrambe queste attività hanno visto una crescita significativa nel corso degli ultimi decenni.

    L'addestramento per i sistemi di riconoscimento dei modelli avviene spesso utilizzando dati che sono stati classificati come addestramento. Quando non sono disponibili dati etichettati, possono essere utilizzate tecniche alternative per identificare modelli che non erano noti prima. Sia il KDD che il data mining pongono una maggiore enfasi sulle tecniche di analisi non supervisionate e hanno una relazione più profonda con le applicazioni pratiche nell'industria. L'identificazione dei pattern pone una maggiore enfasi sul segnale

    Ti è piaciuta l'anteprima?
    Pagina 1 di 1