Rilevamento delle macchie: Scoprire modelli nei dati visivi
Di Fouad Sabry
()
Info su questo ebook
Che cos'è il rilevamento BLOB
Nel campo della visione artificiale, gli algoritmi di rilevamento dei blob sono progettati per identificare aree all'interno di un'immagine digitale che sono distinte dalle regioni che le circondano in termini di caratteristiche quali luminosità o caratteristiche di colore. In un senso più casuale, una macchia è una regione di un'immagine in cui certe qualità rimangono costanti o quasi costanti. Tutti i punti che compongono un blob potrebbero essere considerati in qualche modo paragonabili tra loro. L'uso della convoluzione è il metodo utilizzato più frequentemente per il rilevamento dei blob.
Come trarrai beneficio
(I) Approfondimenti e convalide sui seguenti argomenti:
Capitolo 1: Rilevamento dei BLOB
Capitolo 2: Rilevamento dei bordi
Capitolo 3: Rilevatore di bordi astuto
Capitolo 4: Trasformazione di feature invarianti di scala
Capitolo 5: Scalare lo spazio
Capitolo 6: Funzionalità (visione artificiale)
Capitolo 7: Differenza delle gaussiane
Capitolo 8: Rilevamento degli angoli
Capitolo 9: Rilevamento della cresta
Capitolo 10: Operatore di caratteristica invariante di scala
(II) Rispondere alle principali domande del pubblico sul rilevamento dei BLOB.
(III) Esempi reali dell'utilizzo del rilevamento dei blob in molti campi.
A chi è rivolto questo libro
Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di rilevamento di blob.
Correlato a Rilevamento delle macchie
Titoli di questa serie (100)
Equalizzazione dell'istogramma: Miglioramento del contrasto dell'immagine per una migliore percezione visiva Valutazione: 0 su 5 stelle0 valutazioniVisione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRiduzione del rumore: Miglioramento della chiarezza, tecniche avanzate per la riduzione del rumore nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDiffusione anisotropa: Miglioramento dell'analisi delle immagini attraverso la diffusione anisotropa Valutazione: 0 su 5 stelle0 valutazioniRetinex: Svelare i segreti della visione computazionale con Retinex Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSistema di gestione del colore: Ottimizzazione della percezione visiva negli ambienti digitali Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniCorrezione gamma: Migliorare la chiarezza visiva nella visione artificiale: la tecnica di correzione gamma Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto del colore: Comprendere la percezione e la rappresentazione nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniScala dello spazio: Esplorare le dimensioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGruppo congiunto di esperti fotografici: Sfruttare la potenza dei dati visivi con lo standard JPEG Valutazione: 0 su 5 stelle0 valutazioniFunzione di corrispondenza dei colori: Comprendere la sensibilità spettrale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRidipintura: Colmare le lacune nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniIstogramma dell'immagine: Svelare intuizioni visive, esplorare le profondità degli istogrammi delle immagini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniConsenso del campione casuale: Stima robusta nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniModello a colori: Comprendere lo spettro della visione artificiale: esplorare i modelli di colore Valutazione: 0 su 5 stelle0 valutazioniSpazio colore: Esplorare lo spettro della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniStima della posa del corpo articolato: Sbloccare il movimento umano nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMappatura dei colori: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento delle macchie: Scoprire modelli nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniCompressione delle immagini: Tecniche efficienti per l'ottimizzazione dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniProfilo colore: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione affine: Sbloccare le prospettive visive: esplorare la trasformazione affine nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di feature invarianti di scala: Svelare il potere della trasformazione delle caratteristiche invarianti su scala nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioni
Ebook correlati
Trasformazione di feature invarianti di scala: Svelare il potere della trasformazione delle caratteristiche invarianti su scala nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento dei bordi: Esplorare i confini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniElaborazione delle immagini piramidali: Esplorare le profondità dell'analisi visiva Valutazione: 0 su 5 stelle0 valutazioniIstogramma dei gradienti orientati: Svelare il regno visivo: esplorare l'istogramma dei gradienti orientati nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMetodo di impostazione del livello: Avanzamento della visione artificiale, esplorazione del metodo dell'impostazione dei livelli Valutazione: 0 su 5 stelle0 valutazioniClassificazione delle immagini contestuali: Comprendere i dati visivi per una classificazione efficace Valutazione: 0 su 5 stelle0 valutazioniModello Borsa delle Parole: Sbloccare l'intelligenza visiva con il sacchetto di parole Valutazione: 0 su 5 stelle0 valutazioniModellazione e rendering basati su immagini: Esplorare il realismo visivo: tecniche di visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello di riflessione di Phong: Comprendere le interazioni della luce nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniStima del movimento: Progressi e applicazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGrafica di ray-tracing: Esplorazione del rendering fotorealistico nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMosaicazione di documenti: Sbloccare intuizioni visive attraverso il mosaico di documenti Valutazione: 0 su 5 stelle0 valutazioniCampo di movimento: Esplorando le dinamiche della visione artificiale: svelato il campo del movimento Valutazione: 0 su 5 stelle0 valutazioniRegolazione del pacchetto: Ottimizzazione dei dati visivi per una ricostruzione precisa Valutazione: 0 su 5 stelle0 valutazioniDeterminazione della superficie nascosta: Svelare i segreti della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFlusso ottico: Esplorazione di modelli visivi dinamici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVolume limite: Esplorazione della rappresentazione spaziale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniComputer grafica di vertice: Esplorando l'intersezione tra la computer grafica di vertice e la visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniHashing geometrico: Algoritmi efficienti per il riconoscimento e la corrispondenza delle immagini Valutazione: 0 su 5 stelle0 valutazioniPartizionamento binario dello spazio: Esplorazione del partizionamento binario dello spazio: fondamenti e applicazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniApprendimento delle caratteristiche geometriche: Sbloccare le intuizioni visive attraverso l'apprendimento delle caratteristiche geometriche Valutazione: 0 su 5 stelle0 valutazioniInterpolazione bilineare: Miglioramento della risoluzione e della chiarezza dell'immagine tramite l'interpolazione bilineare Valutazione: 0 su 5 stelle0 valutazioniPrimitivo geometrico: Esplorazione dei fondamenti e delle applicazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMappatura dei colori: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMappatura dei rilievi: Bump Mapping: esplorazione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioni
Intelligenza artificiale e semantica per voi
ANonniMus: Vecchi rivoluzionari contro giovani robot Valutazione: 0 su 5 stelle0 valutazioniIl Terzo Like Valutazione: 0 su 5 stelle0 valutazioniGuida Intelligenza Artificiale Valutazione: 0 su 5 stelle0 valutazioni
Recensioni su Rilevamento delle macchie
0 valutazioni0 recensioni
Anteprima del libro
Rilevamento delle macchie - Fouad Sabry
Capitolo 1: Rilevamento BLOB
L'obiettivo delle tecniche di rilevamento dei blob nella visione artificiale è quello di identificare le aree di un'immagine digitale che hanno caratteristiche significativamente diverse dall'ambiente circostante. Tutti i punti all'interno di un blob possono essere considerati in qualche modo simili tra loro, quindi il termine blob
è usato per descrivere un'area di un'immagine in cui alcune qualità sono costanti o essenzialmente costanti. La convoluzione è la tecnica più usata per il rilevamento dei BLOB.
I due tipi principali di rivelatori di blob sono gli approcci differenziali I, che si basano sulle derivate della funzione rispetto alla posizione, e (ii) i metodi degli estremi locali, che si concentrano sul rilevamento dei massimi e dei minimi locali della funzione. Questi rilevatori sono noti anche come operatori di punti di interesse o operatori di regioni di interesse secondo la nomenclatura più aggiornata del settore (vedi anche rilevamento di punti di interesse e rilevamento di angoli).
Esistono diversi motivi per analizzare e perfezionare i rilevatori di BLOB. La motivazione principale è quella di integrare i dati forniti dai rilevatori di bordi e angoli fornendo maggiori informazioni sulle regioni. Nei primi studi sul campo, il rilevamento dei blob è stato utilizzato per isolare le sezioni rilevanti. Questi punti sull'immagine potrebbero fungere da indicatori di oggetti o porzioni di oggetti ai fini del riconoscimento e/o del tracciamento degli oggetti. L'analisi dell'istogramma è solo un'area in cui i descrittori BLOB possono essere utilizzati per l'identificazione dei picchi nel contesto della segmentazione. I descrittori BLOB sono spesso usati anche come elementi costitutivi fondamentali nei campi dell'analisi e del riconoscimento delle trame. Recentemente, i descrittori BLOB sono stati ampiamente utilizzati per indicare la presenza di funzionalità informative dell'immagine per il rilevamento di oggetti basati sull'aspetto in base alle statistiche delle immagini locali e come punti di interesse per la corrispondenza stereo di base ampia. Allo stesso modo, il rilevamento della cresta può essere utilizzato per indicare l'esistenza di elementi lineari.
Il Laplaciano della distribuzione gaussiana è stato la base per uno dei primi e più diffusi rivelatori di blob (LoG).
Data un'immagine di input f(x,y) , viene utilizzato un kernel gaussiano per convolgere questa immagine.
{\displaystyle g(x,y,t)={\frac {1}{2\pi t}}e^{-{\frac {x^{2}+y^{2}}{2t}}}}ad una certa scala t per dare una rappresentazione dello spazio di scala
L(x,y;t)\ =g(x,y,t)*f(x,y).
Quindi, l'output di un'operazione laplaciana
\nabla ^{2}L=L_{xx}+L_{yy}, che di solito si traduce in forti risposte positive per macchie scure di raggio {\textstyle r^{2}=2t} (per un'immagine bidimensionale, {\textstyle r^{2}=dt} per un {\textstyle d} 'immagine -dimensionale) e forti risposte negative per macchie luminose di dimensioni simili.
Quando si utilizza questo operatore su una singola scala, il problema fondamentale è, tuttavia, che la reazione dell'operatore dipende fortemente dalla correlazione tra le dimensioni delle strutture blob nel dominio dell'immagine e le dimensioni gaussiane del kernel pre-smoothing.
Nel dominio dell'immagine, l'acquisizione automatica di BLOB di dimensioni variabili (sconosciute), pertanto è importante considerare più livelli contemporaneamente.
Prendere in considerazione l'operatore Laplaciano normalizzato per la scala è una tecnica semplice per costruire un rilevatore di blob multiscala con selezione automatica della scala.
{\displaystyle \nabla _{\mathrm {norm} }^{2}L=t\,(L_{xx}+L_{yy})}inoltre, per identificare gli estremi dello spazio di scala, che sono punti che sono simultaneamente massimi/minimi locali rispetto {\displaystyle \nabla _{\mathrm {norm} }^{2}L} sia allo spazio che alla scala (Lindeberg 1994, 1998).
Così, data un'immagine di input bidimensionale discreta, viene calcolato f(x,y) un volume tridimensionale discreto dello spazio di scala L(x,y,t) e un punto viene considerato come un blob luminoso (scuro) se il valore in questo punto è maggiore (più piccolo) del valore in tutti i suoi 26 vicini.
In questo modo, la selezione simultanea dei punti di interesse e delle ({\hat {x}},{\hat {y}}) scale {\hat {t}} viene eseguita in base a
{\displaystyle ({\hat {x}},{\hat {y}};{\hat {t}})=\operatorname {argmaxminlocal} _{(x,y;t)}((\nabla _{\mathrm {norm} }^{2}L)(x,y;t))}.
Tenere presente che questo concetto di BLOB definisce il termine in modo operativo semplice e matematicamente preciso, portando a una tecnica di identificazione dei BLOB efficace e affidabile.
I blob definiti dai massimi dello spazio di scala dell'operatore laplaciano normalizzato hanno diverse qualità fondamentali, come le risposte che sono invarianti dal punto di vista traslazionale, le trasformazioni delle immagini per mezzo della rotazione e del ridimensionamento.
Quindi, se si assume un massimo dello spazio di scala in un punto, (x_{0},y_{0};t_{0}) allora sotto un ridimensionamento dell'immagine di un fattore di scala s , ci sarà un massimo dello spazio di scala nell {\displaystyle \left(sx_{0},sy_{0};s^{2}t_{0}\right)} 'immagine riscalata (Lindeberg 1998).
A causa della sua qualità estremamente pratica, l'argomento del rilevamento di blob laplaciani può essere esteso per includere, estremi locali nella distribuzione normalizzata in scala Altre applicazioni di Laplacian includono la selezione della scala, ad esempio, quando si rilevano gli angoli, il monitoraggio in base alla scala delle caratteristiche (Bretzner e Lindeberg 1998), nella corrispondenza delle immagini e nel riconoscimento degli oggetti utilizzando la trasformazione delle caratteristiche invarianti in scala (Lowe, 2004) e altri descrittori di immagini.
Sia l'operatore laplaciano che altri rivelatori di punti di interesse nello spazio di scala simili hanno le loro caratteristiche di selezione della scala studiate in (Lindeberg 2013a). Altri rivelatori di punti di interesse nello spazio di scala, come il determinante dell'operatore Hessiano, hanno dimostrato di superare l'operatore laplaciano e la sua approssimazione della differenza di Gaussiana (Lindeberg 2013b, 2015) quando si tratta di corrispondenza basata su immagini utilizzando descrittori di immagini locali simili a SIFT.
Dal fatto che la rappresentazione dello spazio L(x,y,t) di scala soddisfa l'equazione di diffusione
\partial _{t}L={\frac {1}{2}}\nabla ^{2}Lne consegue che il laplaciano dell'operatore gaussiano \nabla ^{2}L(x,y,t) può anche essere calcolato come caso limite della differenza tra due immagini levigate gaussiane (rappresentazioni nello spazio di scala)
{\displaystyle \nabla _{\mathrm {norm} }^{2}L(x,y;t)\approx {\frac {t}{\Delta t}}\left(L(x,y;t+\Delta t)-L(x,y;t)\right)}.
Questo metodo è spesso indicato come la differenza del metodo Gaussians (DoG) nel campo della visione artificiale. Sebbene ci siano alcune sottili differenze, questo operatore può essere pensato come un'approssimazione dell'operatore laplaciano e condivide molte delle sue proprietà. Vedi (Lindeberg 2012, 2015) per una relazione esplicita tra l'operatore di differenza di gaussiana e il rivelatore di blob laplaciano normalizzato in scala. I blob possono anche essere identificati dagli estremi delle differenze gaussiane nello spazio di scala. L'algoritmo SIFT (Scale-Invariant Feature Transform) è un'implementazione di questa strategia; per ulteriori informazioni, vedere Lowe (2004).
Prendendo in considerazione il determinante hessiano dopo averlo scalato, possiamo, noto anche come operatore di Monge-Ampère,
{\displaystyle \det H_{\mathrm {norm} }L=t^{2}\left(L_{xx}L_{yy}-L_{xy}^{2}\right)}dove HL denota la matrice hessiana della rappresentazione scale-spazio L e quindi rilevando i massimi scale-space di questo operatore si ottiene un altro semplice rivelatore di blob differenziale con selezione automatica della scala che risponde anche alle selle (Lindeberg 1994, 1998)
{\displaystyle ({\hat {x}},{\hat {y}};{\hat {t}})=\operatorname {argmaxlocal} _{(x,y;t)}((\det H_{\mathrm {norm} }L)(x,y;t))}.
I punti ({\hat {x}},{\hat {y}}) e le scale dei blob {\hat {t}} sono definiti anche da definizioni geometriche differenziali operative che portano a descrittori di blob che sono covarianti con traslazioni, trasformazioni di immagini per mezzo di rotazione e ridimensionamento.
Per quanto riguarda la scelta delle scale, le qualità di selezione della scala per trasformazioni affini non euclidee sono marginalmente migliorate per i blob costruiti dagli estremi dello spazio di scala del determinante dell'Hessiana (DoH) (Lindeberg 1994), 1998, 2015).
Il descrittore SURF (Bay et al.) utilizza il determinante normalizzato in scala dell'Hessian calcolato dalle wavelet di Haar come operatore del punto di interesse fondamentale.
) nel 2006 per l'uso nel riconoscimento dei modelli e nella corrispondenza delle immagini.
Il determinante dell'operatore Hessian ha capacità di selezione di scala superiori sotto trasformazioni di immagini affini rispetto all'operatore Laplaciano, come mostrato in un'analisi completa delle rispettive proprietà di selezione pubblicata in (Lindeberg 2013a). Per la corrispondenza basata su immagini con descrittori di immagini locali simili a SIFT o SURF, è stato dimostrato in (Lindeberg 2013b, 2015) che il determinante dell'operatore Hessian si comporta significativamente meglio dell'operatore laplaciano o della sua approssimazione della differenza di Gaussiani, nonché migliore degli operatori di Harris o Harris-Laplace, portando a valori di efficienza più elevati e punteggi di precisione 1 più bassi.
Per il rilevamento dei blob, è stato sviluppato un operatore ibrido tra il laplaciano e il determinante dell'Assia, in cui il determinante dell'Assia viene utilizzato per la selezione spaziale e il laplaciano normalizzato in scala viene utilizzato per la selezione della scala. (Mikolajczyk e Schmid 2004)
:
Questo operatore ha trovato applicazione nell'analisi delle texture, nel riconoscimento degli oggetti e nella corrispondenza delle immagini.
Questi rilevatori di BLOB con selezione automatica della scala producono descrittori BLOB affidabili contro le trasformazioni spaziali come traslazioni, rotazioni e ridimensionamenti uniformi. Tuttavia, le distorsioni prospettiche sono presenti anche nelle immagini che costituiscono l'input di un sistema di visione artificiale. La creazione di un rilevatore BLOB invariante per le trasformazioni affini è un modo logico per ottenere descrittori BLOB più resistenti alle trasformazioni prospettiche. Deformando iterativamente la forma del kernel di smoothing in modo che corrisponda alla struttura dell'immagine