Scopri milioni di eBook, audiolibri e tanto altro ancora con una prova gratuita

Solo $11.99/mese al termine del periodo di prova. Cancella quando vuoi.

Rilevamento delle macchie: Scoprire modelli nei dati visivi
Rilevamento delle macchie: Scoprire modelli nei dati visivi
Rilevamento delle macchie: Scoprire modelli nei dati visivi
E-book145 pagine1 ora

Rilevamento delle macchie: Scoprire modelli nei dati visivi

Valutazione: 0 su 5 stelle

()

Leggi anteprima

Info su questo ebook

Che cos'è il rilevamento BLOB


Nel campo della visione artificiale, gli algoritmi di rilevamento dei blob sono progettati per identificare aree all'interno di un'immagine digitale che sono distinte dalle regioni che le circondano in termini di caratteristiche quali luminosità o caratteristiche di colore. In un senso più casuale, una macchia è una regione di un'immagine in cui certe qualità rimangono costanti o quasi costanti. Tutti i punti che compongono un blob potrebbero essere considerati in qualche modo paragonabili tra loro. L'uso della convoluzione è il metodo utilizzato più frequentemente per il rilevamento dei blob.


Come trarrai beneficio


(I) Approfondimenti e convalide sui seguenti argomenti:


Capitolo 1: Rilevamento dei BLOB


Capitolo 2: Rilevamento dei bordi


Capitolo 3: Rilevatore di bordi astuto


Capitolo 4: Trasformazione di feature invarianti di scala


Capitolo 5: Scalare lo spazio


Capitolo 6: Funzionalità (visione artificiale)


Capitolo 7: Differenza delle gaussiane


Capitolo 8: Rilevamento degli angoli


Capitolo 9: Rilevamento della cresta


Capitolo 10: Operatore di caratteristica invariante di scala


(II) Rispondere alle principali domande del pubblico sul rilevamento dei BLOB.


(III) Esempi reali dell'utilizzo del rilevamento dei blob in molti campi.


A chi è rivolto questo libro


Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di rilevamento di blob.

LinguaItaliano
Data di uscita1 mag 2024
Rilevamento delle macchie: Scoprire modelli nei dati visivi

Correlato a Rilevamento delle macchie

Titoli di questa serie (100)

Visualizza altri

Ebook correlati

Intelligenza artificiale e semantica per voi

Visualizza altri

Recensioni su Rilevamento delle macchie

Valutazione: 0 su 5 stelle
0 valutazioni

0 valutazioni0 recensioni

Cosa ne pensi?

Tocca per valutare

La recensione deve contenere almeno 10 parole

    Anteprima del libro

    Rilevamento delle macchie - Fouad Sabry

    Capitolo 1: Rilevamento BLOB

    L'obiettivo delle tecniche di rilevamento dei blob nella visione artificiale è quello di identificare le aree di un'immagine digitale che hanno caratteristiche significativamente diverse dall'ambiente circostante. Tutti i punti all'interno di un blob possono essere considerati in qualche modo simili tra loro, quindi il termine blob è usato per descrivere un'area di un'immagine in cui alcune qualità sono costanti o essenzialmente costanti. La convoluzione è la tecnica più usata per il rilevamento dei BLOB.

    I due tipi principali di rivelatori di blob sono gli approcci differenziali I, che si basano sulle derivate della funzione rispetto alla posizione, e (ii) i metodi degli estremi locali, che si concentrano sul rilevamento dei massimi e dei minimi locali della funzione. Questi rilevatori sono noti anche come operatori di punti di interesse o operatori di regioni di interesse secondo la nomenclatura più aggiornata del settore (vedi anche rilevamento di punti di interesse e rilevamento di angoli).

    Esistono diversi motivi per analizzare e perfezionare i rilevatori di BLOB. La motivazione principale è quella di integrare i dati forniti dai rilevatori di bordi e angoli fornendo maggiori informazioni sulle regioni. Nei primi studi sul campo, il rilevamento dei blob è stato utilizzato per isolare le sezioni rilevanti. Questi punti sull'immagine potrebbero fungere da indicatori di oggetti o porzioni di oggetti ai fini del riconoscimento e/o del tracciamento degli oggetti. L'analisi dell'istogramma è solo un'area in cui i descrittori BLOB possono essere utilizzati per l'identificazione dei picchi nel contesto della segmentazione. I descrittori BLOB sono spesso usati anche come elementi costitutivi fondamentali nei campi dell'analisi e del riconoscimento delle trame. Recentemente, i descrittori BLOB sono stati ampiamente utilizzati per indicare la presenza di funzionalità informative dell'immagine per il rilevamento di oggetti basati sull'aspetto in base alle statistiche delle immagini locali e come punti di interesse per la corrispondenza stereo di base ampia. Allo stesso modo, il rilevamento della cresta può essere utilizzato per indicare l'esistenza di elementi lineari.

    Il Laplaciano della distribuzione gaussiana è stato la base per uno dei primi e più diffusi rivelatori di blob (LoG).

    Data un'immagine di input f(x,y) , viene utilizzato un kernel gaussiano per convolgere questa immagine.

    {\displaystyle g(x,y,t)={\frac {1}{2\pi t}}e^{-{\frac {x^{2}+y^{2}}{2t}}}}

    ad una certa scala t per dare una rappresentazione dello spazio di scala

    L(x,y;t)\ =g(x,y,t)*f(x,y)

    .

    Quindi, l'output di un'operazione laplaciana

    \nabla ^{2}L=L_{xx}+L_{yy}

    , che di solito si traduce in forti risposte positive per macchie scure di raggio {\textstyle r^{2}=2t} (per un'immagine bidimensionale, {\textstyle r^{2}=dt} per un {\textstyle d} 'immagine -dimensionale) e forti risposte negative per macchie luminose di dimensioni simili.

    Quando si utilizza questo operatore su una singola scala, il problema fondamentale è, tuttavia, che la reazione dell'operatore dipende fortemente dalla correlazione tra le dimensioni delle strutture blob nel dominio dell'immagine e le dimensioni gaussiane del kernel pre-smoothing.

    Nel dominio dell'immagine, l'acquisizione automatica di BLOB di dimensioni variabili (sconosciute), pertanto è importante considerare più livelli contemporaneamente.

    Prendere in considerazione l'operatore Laplaciano normalizzato per la scala è una tecnica semplice per costruire un rilevatore di blob multiscala con selezione automatica della scala.

    {\displaystyle \nabla _{\mathrm {norm} }^{2}L=t\,(L_{xx}+L_{yy})}

    inoltre, per identificare gli estremi dello spazio di scala, che sono punti che sono simultaneamente massimi/minimi locali rispetto {\displaystyle \nabla _{\mathrm {norm} }^{2}L} sia allo spazio che alla scala (Lindeberg 1994, 1998).

    Così, data un'immagine di input bidimensionale discreta, viene calcolato f(x,y) un volume tridimensionale discreto dello spazio di scala L(x,y,t) e un punto viene considerato come un blob luminoso (scuro) se il valore in questo punto è maggiore (più piccolo) del valore in tutti i suoi 26 vicini.

    In questo modo, la selezione simultanea dei punti di interesse e delle ({\hat {x}},{\hat {y}}) scale {\hat {t}} viene eseguita in base a

    {\displaystyle ({\hat {x}},{\hat {y}};{\hat {t}})=\operatorname {argmaxminlocal} _{(x,y;t)}((\nabla _{\mathrm {norm} }^{2}L)(x,y;t))}

    .

    Tenere presente che questo concetto di BLOB definisce il termine in modo operativo semplice e matematicamente preciso, portando a una tecnica di identificazione dei BLOB efficace e affidabile.

    I blob definiti dai massimi dello spazio di scala dell'operatore laplaciano normalizzato hanno diverse qualità fondamentali, come le risposte che sono invarianti dal punto di vista traslazionale, le trasformazioni delle immagini per mezzo della rotazione e del ridimensionamento.

    Quindi, se si assume un massimo dello spazio di scala in un punto, (x_{0},y_{0};t_{0}) allora sotto un ridimensionamento dell'immagine di un fattore di scala s , ci sarà un massimo dello spazio di scala nell {\displaystyle \left(sx_{0},sy_{0};s^{2}t_{0}\right)} 'immagine riscalata (Lindeberg 1998).

    A causa della sua qualità estremamente pratica, l'argomento del rilevamento di blob laplaciani può essere esteso per includere, estremi locali nella distribuzione normalizzata in scala Altre applicazioni di Laplacian includono la selezione della scala, ad esempio, quando si rilevano gli angoli, il monitoraggio in base alla scala delle caratteristiche (Bretzner e Lindeberg 1998), nella corrispondenza delle immagini e nel riconoscimento degli oggetti utilizzando la trasformazione delle caratteristiche invarianti in scala (Lowe, 2004) e altri descrittori di immagini.

    Sia l'operatore laplaciano che altri rivelatori di punti di interesse nello spazio di scala simili hanno le loro caratteristiche di selezione della scala studiate in (Lindeberg 2013a). Altri rivelatori di punti di interesse nello spazio di scala, come il determinante dell'operatore Hessiano, hanno dimostrato di superare l'operatore laplaciano e la sua approssimazione della differenza di Gaussiana (Lindeberg 2013b, 2015) quando si tratta di corrispondenza basata su immagini utilizzando descrittori di immagini locali simili a SIFT.

    Dal fatto che la rappresentazione dello spazio L(x,y,t) di scala soddisfa l'equazione di diffusione

    \partial _{t}L={\frac {1}{2}}\nabla ^{2}L

    ne consegue che il laplaciano dell'operatore gaussiano \nabla ^{2}L(x,y,t) può anche essere calcolato come caso limite della differenza tra due immagini levigate gaussiane (rappresentazioni nello spazio di scala)

    {\displaystyle \nabla _{\mathrm {norm} }^{2}L(x,y;t)\approx {\frac {t}{\Delta t}}\left(L(x,y;t+\Delta t)-L(x,y;t)\right)}

    .

    Questo metodo è spesso indicato come la differenza del metodo Gaussians (DoG) nel campo della visione artificiale. Sebbene ci siano alcune sottili differenze, questo operatore può essere pensato come un'approssimazione dell'operatore laplaciano e condivide molte delle sue proprietà. Vedi (Lindeberg 2012, 2015) per una relazione esplicita tra l'operatore di differenza di gaussiana e il rivelatore di blob laplaciano normalizzato in scala. I blob possono anche essere identificati dagli estremi delle differenze gaussiane nello spazio di scala. L'algoritmo SIFT (Scale-Invariant Feature Transform) è un'implementazione di questa strategia; per ulteriori informazioni, vedere Lowe (2004).

    Prendendo in considerazione il determinante hessiano dopo averlo scalato, possiamo, noto anche come operatore di Monge-Ampère,

    {\displaystyle \det H_{\mathrm {norm} }L=t^{2}\left(L_{xx}L_{yy}-L_{xy}^{2}\right)}

    dove HL denota la matrice hessiana della rappresentazione scale-spazio L e quindi rilevando i massimi scale-space di questo operatore si ottiene un altro semplice rivelatore di blob differenziale con selezione automatica della scala che risponde anche alle selle (Lindeberg 1994, 1998)

    {\displaystyle ({\hat {x}},{\hat {y}};{\hat {t}})=\operatorname {argmaxlocal} _{(x,y;t)}((\det H_{\mathrm {norm} }L)(x,y;t))}

    .

    I punti ({\hat {x}},{\hat {y}}) e le scale  dei blob {\hat {t}} sono definiti anche da definizioni geometriche differenziali operative che portano a descrittori di blob che sono covarianti con traslazioni, trasformazioni di immagini per mezzo di rotazione e ridimensionamento.

    Per quanto riguarda la scelta delle scale, le qualità di selezione della scala per trasformazioni affini non euclidee sono marginalmente migliorate per i blob costruiti dagli estremi dello spazio di scala del determinante dell'Hessiana (DoH) (Lindeberg 1994), 1998, 2015).

    Il descrittore SURF (Bay et al.) utilizza il determinante normalizzato in scala dell'Hessian calcolato dalle wavelet di Haar come operatore del punto di interesse fondamentale.

    ) nel 2006 per l'uso nel riconoscimento dei modelli e nella corrispondenza delle immagini.

    Il determinante dell'operatore Hessian ha capacità di selezione di scala superiori sotto trasformazioni di immagini affini rispetto all'operatore Laplaciano, come mostrato in un'analisi completa delle rispettive proprietà di selezione pubblicata in (Lindeberg 2013a). Per la corrispondenza basata su immagini con descrittori di immagini locali simili a SIFT o SURF, è stato dimostrato in (Lindeberg 2013b, 2015) che il determinante dell'operatore Hessian si comporta significativamente meglio dell'operatore laplaciano o della sua approssimazione della differenza di Gaussiani, nonché migliore degli operatori di Harris o Harris-Laplace, portando a valori di efficienza più elevati e punteggi di precisione 1 più bassi.

    Per il rilevamento dei blob, è stato sviluppato un operatore ibrido tra il laplaciano e il determinante dell'Assia, in cui il determinante dell'Assia viene utilizzato per la selezione spaziale e il laplaciano normalizzato in scala viene utilizzato per la selezione della scala. (Mikolajczyk e Schmid 2004):

    {\displaystyle ({\hat {x}},{\hat {y}})=\operatorname {argmaxlocal} _{(x,y)}((\det HL)(x,y;t))}{\displaystyle {\hat {t}}=\operatorname {argmaxminlocal} _{t}((\nabla _{\mathrm {norm} }^{2}L)({\hat {x}},{\hat {y}};t))}

    Questo operatore ha trovato applicazione nell'analisi delle texture, nel riconoscimento degli oggetti e nella corrispondenza delle immagini.

    Questi rilevatori di BLOB con selezione automatica della scala producono descrittori BLOB affidabili contro le trasformazioni spaziali come traslazioni, rotazioni e ridimensionamenti uniformi. Tuttavia, le distorsioni prospettiche sono presenti anche nelle immagini che costituiscono l'input di un sistema di visione artificiale. La creazione di un rilevatore BLOB invariante per le trasformazioni affini è un modo logico per ottenere descrittori BLOB più resistenti alle trasformazioni prospettiche. Deformando iterativamente la forma del kernel di smoothing in modo che corrisponda alla struttura dell'immagine

    Ti è piaciuta l'anteprima?
    Pagina 1 di 1