Rilevatore di bordi astuto: Svelare l'arte della percezione visiva
Di Fouad Sabry
()
Info su questo ebook
Che cos'è Rilevatore di bordi astuto
Questo operatore di rilevamento dei bordi è noto come Canny Edge Detector e utilizza un metodo a più fasi per identificare un'ampia varietà di bordi presenti nelle immagini. Nel 1986, John F. Canny fu colui che ebbe l'idea. Inoltre, Canny ha sviluppato una teoria computazionale del rilevamento dei bordi, che spiega la logica alla base dell'efficacia della tecnica.
Come trarrai vantaggio
(I) Approfondimenti e convalide sui seguenti argomenti:
Capitolo 1: Rilevatore di bordi Canny
Capitolo 2: Rilevamento di bordi
Capitolo 3: Operatore Sobel
Capitolo 4: Sfocatura gaussiana
Capitolo 5: Operatore Prewitt
Capitolo 6: Gradiente immagine
Capitolo 7: Rilevatore di bordi Deriche
Capitolo 8: Rilevamento compresso
Capitolo 9: Istogramma dei gradienti orientati
Capitolo 10: Rilevatore di regioni affini di Harris
(II) Rispondere alle domande più importanti del pubblico sul rilevatore di bordi Canny.
(III) Esempi reali dell'utilizzo del rilevatore di bordi Canny in molti campi.
A chi è rivolto questo libro
Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di Canny Edge Detector.
Correlato a Rilevatore di bordi astuto
Titoli di questa serie (100)
Equalizzazione dell'istogramma: Miglioramento del contrasto dell'immagine per una migliore percezione visiva Valutazione: 0 su 5 stelle0 valutazioniVisione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRiduzione del rumore: Miglioramento della chiarezza, tecniche avanzate per la riduzione del rumore nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDiffusione anisotropa: Miglioramento dell'analisi delle immagini attraverso la diffusione anisotropa Valutazione: 0 su 5 stelle0 valutazioniRetinex: Svelare i segreti della visione computazionale con Retinex Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSistema di gestione del colore: Ottimizzazione della percezione visiva negli ambienti digitali Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniCorrezione gamma: Migliorare la chiarezza visiva nella visione artificiale: la tecnica di correzione gamma Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto del colore: Comprendere la percezione e la rappresentazione nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniScala dello spazio: Esplorare le dimensioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGruppo congiunto di esperti fotografici: Sfruttare la potenza dei dati visivi con lo standard JPEG Valutazione: 0 su 5 stelle0 valutazioniFunzione di corrispondenza dei colori: Comprendere la sensibilità spettrale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRidipintura: Colmare le lacune nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniIstogramma dell'immagine: Svelare intuizioni visive, esplorare le profondità degli istogrammi delle immagini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniConsenso del campione casuale: Stima robusta nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniModello a colori: Comprendere lo spettro della visione artificiale: esplorare i modelli di colore Valutazione: 0 su 5 stelle0 valutazioniSpazio colore: Esplorare lo spettro della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniStima della posa del corpo articolato: Sbloccare il movimento umano nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMappatura dei colori: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento delle macchie: Scoprire modelli nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniCompressione delle immagini: Tecniche efficienti per l'ottimizzazione dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniProfilo colore: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione affine: Sbloccare le prospettive visive: esplorare la trasformazione affine nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di feature invarianti di scala: Svelare il potere della trasformazione delle caratteristiche invarianti su scala nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioni
Ebook correlati
Rilevamento dei bordi: Esplorare i confini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRegolazione del pacchetto: Ottimizzazione dei dati visivi per una ricostruzione precisa Valutazione: 0 su 5 stelle0 valutazioniTagli del grafico di visione artificiale: Esplorazione dei tagli grafici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniComputer grafica della radiosità: Avanzamento della visualizzazione attraverso la radiosità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniAlgoritmo di disegno di linee: Padroneggiare le tecniche per il rendering di immagini di precisione Valutazione: 0 su 5 stelle0 valutazioniModello di fotocamera stenopeica: Comprendere la prospettiva attraverso l'ottica computazionale Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDeterminazione della superficie nascosta: Svelare i segreti della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniAnti aliasing: Migliorare la chiarezza visiva nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSegmentazione delle immagini: Sbloccare insight grazie alla precisione dei pixel Valutazione: 0 su 5 stelle0 valutazioniGeometria descrittiva: Sbloccare il regno visivo: esplorare la geometria descrittiva nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFlusso ottico: Esplorazione di modelli visivi dinamici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCampo di movimento: Esplorando le dinamiche della visione artificiale: svelato il campo del movimento Valutazione: 0 su 5 stelle0 valutazioniContorno attivo: Avanzamento della visione artificiale con tecniche di contorno attivo Valutazione: 0 su 5 stelle0 valutazioniComputer grafica di vertice: Esplorando l'intersezione tra la computer grafica di vertice e la visione artificiale Valutazione: 0 su 5 stelle0 valutazioniIstogramma dei gradienti orientati: Svelare il regno visivo: esplorare l'istogramma dei gradienti orientati nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMetodo di impostazione del livello: Avanzamento della visione artificiale, esplorazione del metodo dell'impostazione dei livelli Valutazione: 0 su 5 stelle0 valutazioniEqualizzazione dell'istogramma: Miglioramento del contrasto dell'immagine per una migliore percezione visiva Valutazione: 0 su 5 stelle0 valutazioniMappatura dei colori: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniClassificazione delle immagini contestuali: Comprendere i dati visivi per una classificazione efficace Valutazione: 0 su 5 stelle0 valutazioniMappatura dei rilievi: Bump Mapping: esplorazione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGrafica di ray-tracing: Esplorazione del rendering fotorealistico nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniEditor di grafica raster: Trasformare le realtà visive: padroneggiare gli editor grafici raster nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMosaicazione di documenti: Sbloccare intuizioni visive attraverso il mosaico di documenti Valutazione: 0 su 5 stelle0 valutazioniAlgoritmo della linea di Bresenham: Rendering delle linee efficiente e pixel perfetto per la visione artificiale Valutazione: 0 su 5 stelle0 valutazioniIstogramma dell'immagine: Svelare intuizioni visive, esplorare le profondità degli istogrammi delle immagini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRimozione delle linee nascoste: Svelare l'invisibile: i segreti della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDiffusione anisotropa: Miglioramento dell'analisi delle immagini attraverso la diffusione anisotropa Valutazione: 0 su 5 stelle0 valutazioniDither: Rumore visivo nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioni
Intelligenza artificiale e semantica per voi
Il Terzo Like Valutazione: 0 su 5 stelle0 valutazioniGuida Intelligenza Artificiale Valutazione: 0 su 5 stelle0 valutazioniANonniMus: Vecchi rivoluzionari contro giovani robot Valutazione: 0 su 5 stelle0 valutazioni
Recensioni su Rilevatore di bordi astuto
0 valutazioni0 recensioni
Anteprima del libro
Rilevatore di bordi astuto - Fouad Sabry
Capitolo 1: Rilevatore di bordi astuti
Per rilevare un'ampia varietà di bordi nelle immagini, il rilevatore di bordi Canny utilizza un algoritmo a più stadi. John F. Canny lo ha creato nel 1986. Inoltre, Canny ha sviluppato una teoria computazionale del rilevamento dei bordi per far luce sull'efficacia del metodo.
Il rilevamento dei bordi astuti è un metodo per ridurre drasticamente la quantità di dati che devono essere elaborati estraendo informazioni strutturali utili da vari oggetti visivi. Ha trovato molto uso in diversi tipi di sistemi di visione artificiale. Come ha scoperto Canny, l'implementazione del rilevamento dei bordi su vari sistemi di visione ha requisiti simili. Di conseguenza, una soluzione per il rilevamento dei bordi che soddisfi queste esigenze può essere applicata ampiamente. In generale, il rilevamento dei bordi richiede quanto segue:
Il rilevamento dei bordi a basso errore richiede che il maggior numero possibile di bordi dell'immagine venga identificato correttamente.
Il punto di spigolo rilevato dall'operatore deve individuare con precisione il centro geometrico del bordo.
Per evitare di contrassegnare più istanze dello stesso bordo, è necessario ridurre al minimo il rumore dell'immagine.
Il calcolo delle variazioni, un metodo per scoprire la funzione che ottimizza un funzionale specificato, era lo strumento utilizzato da Canny per soddisfare queste condizioni. La funzione ottimale del rivelatore di Canny può essere approssimata dalla derivata prima di una distribuzione gaussiana, che è definita dalla somma di quattro termini esponenziali.
L'algoritmo di rilevamento dei bordi Canny è uno dei metodi di rilevamento dei bordi più precisi e offre un rilevamento buono e affidabile. È salito rapidamente alla ribalta come uno degli algoritmi di rilevamento dei bordi più utilizzati grazie alla sua efficacia nel soddisfare tutti e tre i criteri di rilevamento dei bordi e alla sua facilità di implementazione.
L'algoritmo di rilevamento dei bordi può essere semplificato in cinque fasi distinte:
Leviga l'immagine con un filtro gaussiano per eliminare il rumore.
Determinare le variazioni di intensità dell'immagine.
Per eliminare i falsi positivi dal rilevamento dei bordi, è possibile applicare una soglia di magnitudo del gradiente o la soppressione del limite inferiore.
Per identificare i possibili spigoli, utilizzare una doppia soglia.
Il tracciamento dei bordi basato sull'isteresi comporta la finalizzazione del rilevamento dei bordi bloccando i bordi deboli e non collegati.
Poiché il rumore dell'immagine influisce notevolmente sulla precisione di qualsiasi risultato di rilevamento dei bordi, per evitare un rilevamento errato, il rumore deve essere filtrato.
L'attenuazione dell'immagine, la convoluzione con un kernel di filtro gaussiano viene utilizzata per modificare un'immagine.
Il rilevatore di bordi sarà meno influenzato dal rumore evidente nell'immagine dopo l'applicazione di questo processo.
L'equazione per un kernel di filtro gaussiano di dimensione (2k+1)×(2k+1) è data da:
{\displaystyle H_{ij}={\frac {1}{2\pi \sigma ^{2}}}\exp \left(-{\frac {(i-(k+1))^{2}+(j-(k+1))^{2}}{2\sigma ^{2}}}\right);1\leq i,j\leq (2k+1)}Di seguito è riportato un esempio di filtro gaussiano 5×5, utilizzato per creare l'immagine successiva, con \sigma = 1.
Si noti che l'asterisco (*) indica una circonvoluzione.
\mathbf {B} ={\frac {1}{159}}{\begin{bmatrix}2&4&5&4&2\\4&9&12&9&4\\5&12&15&12&5\\4&9&12&9&4\\2&4&5&4&2\end{bmatrix}}*\mathbf {A} .È fondamentale tenere presente che l'efficienza del rivelatore sarà influenzata dalla scelta della dimensione del kernel gaussiano.
Inversamente proporzionale alle dimensioni, meno suscettibile al rumore è il rilevatore, il.
Inoltre, maggiore è la dimensione del kernel del filtro gaussiano, maggiore è l'errore di localizzazione quando si tenta di rilevare il bordo.
Un 5×5 è una buona dimensione per la maggior parte dei casi, tuttavia, questo cambierà a seconda delle circostanze a portata di mano.
Ci sono molti orientamenti possibili che il bordo di un'immagine può indicare, l'algoritmo di Canny per il riconoscimento del modello orizzontale impiega un quartetto di filtri, bordi sfocati sia verticalmente che diagonalmente.
Operatori per il rilevamento di archi (come Roberts), Prewitt o Sobel) restituisce un valore per la derivata prima nella direzione orizzontale (Gx) e nella direzione verticale (Gy).
L'angolo e la sfumatura di uno spigolo possono essere dedotti da questo:
\mathbf {G} ={\sqrt {{\mathbf {G} _{x}}^{2}+{\mathbf {G} _{y}}^{2}}}\mathbf {\Theta } =\operatorname {atan2} \left(\mathbf {G} _{y},\mathbf {G} _{x}\right) , dove hypot è la funzione inversa e atan2 è la funzione arcotangente con due argomenti, e G può essere calcolato come risultato.
La direzione del bordo viene arrotondata a uno dei quattro angoli: verticale, orizzontale, 30 gradi e 75 gradi, orizzontale e le due diagonali (0°, 45°, 90° e 135°).
Per ogni banda di colore, l'angolo in cui uno spigolo si incrocia sarà fissato, ad esempio, θ in [0°, 22,5°] o [157,5°, 180°] viene mappato a 0°.
La soglia del limite inferiore, nota anche come soppressione del cut-off minimo delle grandezze del gradiente, è un metodo di assottigliamento dei bordi.
Per individuare i punti in cui il valore di intensità cambia in modo più drastico, viene utilizzata una soppressione del limite inferiore. L'algoritmo di ogni pixel dell'immagine sfumata è:
Controlla l'intensità del bordo del pixel corrente rispetto alla sua forza del bordo nelle sfumature verso l'alto e verso il basso.
Ad esempio, se il pixel corrente punta nella direzione y, il suo valore verrà mantenuto se l'intensità del bordo è maggiore di quella di tutti gli altri pixel della maschera che puntano nella stessa direzione. Quando ciò non accade, il valore viene abbassato.
L'algoritmo, in alcune forme, separa le direzioni del gradiente in una manciata di categorie discrete prima di applicare un filtro 3x3 ai risultati intermedi (ovvero, la forza del bordo e le direzioni del gradiente). Se l'intensità della sfumatura del pixel centrale è inferiore alle magnitudini dei suoi due vicini, l'intensità del bordo del pixel centrale viene soppressa (impostata su 0) in corrispondenza di quel pixel. Ad esempio, se l'angolo di gradiente arrotondato è 0° (ad es.
Il punto è considerato sul bordo se la sua magnitudine del gradiente è maggiore delle magnitudini dei pixel nelle direzioni est e ovest (supponendo che il bordo sia nella direzione nord-sud), se l'angolo di gradiente arrotondato è di 90° (es.
Il punto è considerato sul bordo se l'ampiezza del suo gradiente è maggiore delle magnitudini ai pixel nelle direzioni nord e sud (supponendo che il bordo vada da est a ovest), se l'angolo di gradiente arrotondato è di 135° (es.
Se l'ampiezza del gradiente del punto è maggiore delle magnitudini dei pixel nelle direzioni nord-ovest e sud-est (supponendo che il bordo vada da nord-est a sud-ovest), allora il punto sarà considerato sul bordo, se l'angolo di gradiente arrotondato è di 45° (es.
Il punto è considerato sul bordo se la sua magnitudine del gradiente è maggiore delle magnitudini dei pixel nelle direzioni nord-est e sud-ovest (supponendo che il bordo vada da nord-ovest a sud-est).
Implementazioni più vicine al segno, tra due pixel adiacenti che si trovano alle estremità opposte della direzione del gradiente, viene utilizzata un'interpolazione lineare.
Ad esempio, se l'angolo della sfumatura è compreso tra 89° e 180°, è possibile