Rilevamento dei bordi: Esplorare i confini nella visione artificiale
Di Fouad Sabry
()
Info su questo ebook
Cos'è il rilevamento dei bordi
Il rilevamento dei bordi è una raccolta di tecniche matematiche mirate a riconoscere i bordi, definiti come curve in un'immagine digitale alle quali la luminosità l'immagine cambia bruscamente o, più formalmente, contiene delle discontinuità. La difficoltà di scoprire discontinuità nei segnali unidimensionali viene definita rilevamento del passo, mentre il problema di trovare discontinuità del segnale nel tempo viene definito rilevamento del cambiamento. Entrambe queste tecniche vengono utilizzate per trovare discontinuità nei segnali. Il metodo di rilevamento dei bordi è uno strumento essenziale nei campi dell'elaborazione delle immagini, della visione artificiale e della visione artificiale, in particolare nelle aree del rilevamento e dell'estrazione delle caratteristiche.
Come trarrai vantaggio
(I) Approfondimenti e convalide sui seguenti argomenti:
Capitolo 1: Rilevamento dei bordi
Capitolo 2: Elaborazione delle immagini digitali
Capitolo 3: Operatore Sobel
Capitolo 4: Croce di Roberts
Capitolo 5: Rilevatore di bordi Canny
Capitolo 6: Algoritmo di Marr-Hildreth
Capitolo 7: Trasformazione di caratteristiche invarianti di scala
Capitolo 8: Operatore di Laplace discreto
Capitolo 9: Spazio di scala
Capitolo 10: Operatore di Prewitt
(II) Rispondere alle principali domande del pubblico sul rilevamento dei bordi.
(III) Esempi reali dell'utilizzo del rilevamento dei bordi in molti campi.
A chi è rivolto questo libro
Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di rilevamento dei bordi.
Leggi altro di Fouad Sabry
Tecnologie Emergenti In Optoelettronica [Italian]
Correlato a Rilevamento dei bordi
Titoli di questa serie (100)
Equalizzazione dell'istogramma: Miglioramento del contrasto dell'immagine per una migliore percezione visiva Valutazione: 0 su 5 stelle0 valutazioniVisione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRiduzione del rumore: Miglioramento della chiarezza, tecniche avanzate per la riduzione del rumore nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDiffusione anisotropa: Miglioramento dell'analisi delle immagini attraverso la diffusione anisotropa Valutazione: 0 su 5 stelle0 valutazioniRetinex: Svelare i segreti della visione computazionale con Retinex Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSistema di gestione del colore: Ottimizzazione della percezione visiva negli ambienti digitali Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniCorrezione gamma: Migliorare la chiarezza visiva nella visione artificiale: la tecnica di correzione gamma Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto del colore: Comprendere la percezione e la rappresentazione nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniScala dello spazio: Esplorare le dimensioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGruppo congiunto di esperti fotografici: Sfruttare la potenza dei dati visivi con lo standard JPEG Valutazione: 0 su 5 stelle0 valutazioniFunzione di corrispondenza dei colori: Comprendere la sensibilità spettrale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRidipintura: Colmare le lacune nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniIstogramma dell'immagine: Svelare intuizioni visive, esplorare le profondità degli istogrammi delle immagini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniConsenso del campione casuale: Stima robusta nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniModello a colori: Comprendere lo spettro della visione artificiale: esplorare i modelli di colore Valutazione: 0 su 5 stelle0 valutazioniSpazio colore: Esplorare lo spettro della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniStima della posa del corpo articolato: Sbloccare il movimento umano nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMappatura dei colori: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento delle macchie: Scoprire modelli nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniCompressione delle immagini: Tecniche efficienti per l'ottimizzazione dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniProfilo colore: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione affine: Sbloccare le prospettive visive: esplorare la trasformazione affine nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di feature invarianti di scala: Svelare il potere della trasformazione delle caratteristiche invarianti su scala nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioni
Ebook correlati
Rilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniRilevamento delle macchie: Scoprire modelli nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniElaborazione delle immagini piramidali: Esplorare le profondità dell'analisi visiva Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di feature invarianti di scala: Svelare il potere della trasformazione delle caratteristiche invarianti su scala nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniClassificazione delle immagini contestuali: Comprendere i dati visivi per una classificazione efficace Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDeterminazione della superficie nascosta: Svelare i segreti della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCampo di movimento: Esplorando le dinamiche della visione artificiale: svelato il campo del movimento Valutazione: 0 su 5 stelle0 valutazioniGrafica di ray-tracing: Esplorazione del rendering fotorealistico nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniComputer grafica di vertice: Esplorando l'intersezione tra la computer grafica di vertice e la visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSegmentazione delle immagini: Sbloccare insight grazie alla precisione dei pixel Valutazione: 0 su 5 stelle0 valutazioniMetodo di impostazione del livello: Avanzamento della visione artificiale, esplorazione del metodo dell'impostazione dei livelli Valutazione: 0 su 5 stelle0 valutazioniRegolazione del pacchetto: Ottimizzazione dei dati visivi per una ricostruzione precisa Valutazione: 0 su 5 stelle0 valutazioniFlusso ottico: Esplorazione di modelli visivi dinamici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniContorno attivo: Avanzamento della visione artificiale con tecniche di contorno attivo Valutazione: 0 su 5 stelle0 valutazioniIstogramma dei gradienti orientati: Svelare il regno visivo: esplorare l'istogramma dei gradienti orientati nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniComputer grafica della radiosità: Avanzamento della visualizzazione attraverso la radiosità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVolume limite: Esplorazione della rappresentazione spaziale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniApprendimento delle caratteristiche geometriche: Sbloccare le intuizioni visive attraverso l'apprendimento delle caratteristiche geometriche Valutazione: 0 su 5 stelle0 valutazioniRimozione delle linee nascoste: Svelare l'invisibile: i segreti della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello di riflessione di Phong: Comprendere le interazioni della luce nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMappatura dei colori: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTagli del grafico di visione artificiale: Esplorazione dei tagli grafici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModellazione e rendering basati su immagini: Esplorare il realismo visivo: tecniche di visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniMappatura dei rilievi: Bump Mapping: esplorazione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMosaicazione di documenti: Sbloccare intuizioni visive attraverso il mosaico di documenti Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioni
Intelligenza artificiale e semantica per voi
ANonniMus: Vecchi rivoluzionari contro giovani robot Valutazione: 0 su 5 stelle0 valutazioniIl Terzo Like Valutazione: 0 su 5 stelle0 valutazioniGuida Intelligenza Artificiale Valutazione: 0 su 5 stelle0 valutazioni
Recensioni su Rilevamento dei bordi
0 valutazioni0 recensioni
Anteprima del libro
Rilevamento dei bordi - Fouad Sabry
Capitolo 1: Rilevamento dei bordi
Il rilevamento dei bordi è una raccolta di tecniche matematiche progettate per trovare transizioni nette nella luminosità nelle immagini digitali, a volte note come bordi
. La ricerca di discontinuità nei segnali unidimensionali è chiamata rilevamento del passo, mentre la ricerca di segnali variabili nel tempo è chiamata rilevamento del cambiamento. Nei campi della visione artificiale, della visione artificiale e dell'elaborazione delle immagini, il rilevamento dei bordi svolge un ruolo cruciale, soprattutto nei processi di identificazione ed estrazione delle caratteristiche.
L'acquisizione di eventi significativi e cambiamenti negli attributi del mondo richiede il rilevamento di improvvisi cambiamenti nella luminosità dell'immagine. I cambiamenti di contrasto in un'immagine possono essere spiegati da alcuni presupposti standard su come si formano le immagini:
una discontinuità di profondità, Interruzioni orientazionali nelle superfici, spostamenti nella struttura atomica del materiale e
sottili cambiamenti nell'illuminazione della scena.
L'applicazione di un rilevatore di bordi a un'immagine può potenzialmente produrre un insieme di curve connesse che rappresentano i bordi degli oggetti, i bordi delle marche di superficie e i bordi di eventuali interruzioni nell'orientamento della superficie. Al fine di preservare gli importanti aspetti strutturali di un'immagine senza complicare eccessivamente l'elaborazione, è possibile applicare un metodo di rilevamento dei bordi all'immagine per ridurre considerevolmente la quantità di dati da elaborare, filtrando le informazioni che potrebbero essere ritenute meno rilevanti. Se il processo di rilevamento dei bordi è efficace, decifrare il contenuto informativo dell'immagine può essere molto meno difficile. Tuttavia, margini così perfetti non sono sempre ottenibili da foto del mondo reale moderatamente complesse.
La frammentazione, in cui le curve dei bordi non sono collegate, i segmenti di bordo mancanti e i falsi bordi non correlati a occorrenze rilevanti nell'immagine ostacolano l'interpretazione dei dati dei bordi derivati da immagini non banali.
Il rilevamento dei bordi è un primo passo cruciale in molti tipi di analisi delle immagini, riconoscimento di modelli e visione artificiale.
Gli spigoli derivati da una rappresentazione 2D di una scena 3D possono essere dipendenti dal punto di vista o indipendenti dal punto di vista a seconda del modo in cui è stata creata la rappresentazione 2D. I bordi indipendenti dalla prospettiva dell'osservatore spesso rivelano informazioni sulla forma e la consistenza degli oggetti tridimensionali. Un bordo che dipende dalla prospettiva dell'osservatore potrebbe spostarsi in base alla sua posizione nell'immagine, riflettendo fattori come l'occlusione degli oggetti.
La linea in cui due blocchi di colore adiacenti si incontrano è un esempio di bordo comune. Al contrario, una linea (che può essere recuperata da un rilevatore di creste) può consistere solo di pochi pixel di un colore distinto su uno sfondo altrimenti uniforme. Di conseguenza, uno spigolo può esistere su entrambi i lati di una linea.
Sebbene i bordi perfetti siano stati oggetto di alcune ricerche, le fotografie naturali raramente producono bordi dei gradini veramente perfetti. Al contrario, sono in genere influenzati da almeno uno dei seguenti elementi:
Sfocatura della messa a fuoco dovuta alle limitazioni della profondità di campo e della funzione di diffusione dei punti.
Sfocatura penombrale dovuta alle ombre proiettate da sorgenti luminose che non svaniscono.
Proiettare ombre su una superficie piana
Diversi studiosi hanno fatto il passo più semplice oltre il modello ideale del bordo del gradino descrivendo gli effetti della sfocatura dei bordi utilizzando un bordo del gradino levigato gaussiano (una funzione di errore).
Pertanto, un'immagine unidimensionale f che ha esattamente un bordo posizionato in corrispondenza x=0 può essere modellata come:
{\displaystyle f(x)={\frac {I_{r}-I_{\ell }}{2}}\left(\operatorname {erf} \left({\frac {x}{{\sqrt {2}}\sigma }}\right)+1\right)+I_{\ell }.}Verso il margine sinistro, l'intensità è {\displaystyle I_{\ell }=\lim _{x\rightarrow -\infty }f(x)} , e a destra del bordo è I_{r}=\lim _{x\rightarrow \infty }f(x) .
Il parametro di scala \sigma è chiamato scala di sfocatura del bordo.
Il valore ideale per questo parametro di scala è quello che tiene conto della qualità dell'immagine in modo che i bordi autentici dell'immagine non vadano persi durante il processo.
Si consideri il seguente segnale unidimensionale come esempio del motivo per cui il rilevamento dei bordi non è un processo semplice. Sembra naturale supporre che il quarto e il quinto pixel in questo esempio debbano essere separati da una linea.
Sarebbe meno ovvio che ci fosse un bordo nella regione corrispondente se la differenza di intensità tra il quarto e il quinto pixel fosse minore e se le differenze di intensità tra i pixel confinanti successivi fossero maggiori. Inoltre, c'è la possibilità di sostenere che questo caso presenta molteplici vantaggi.
Pertanto, non è sempre facile definire una soglia precisa per quanta differenza di intensità deve esserci tra due pixel adiacenti per poter dichiarare che dovrebbe esserci un bordo tra questi pixel. Di conseguenza, a meno che gli oggetti della scena non siano abbastanza semplici e l'illuminazione possa essere calibrata con attenzione, il rilevamento dei bordi può essere un compito non banale (vedi ad esempio, i bordi estratti dall'immagine con la ragazza sopra).
Esistono molti metodi di rilevamento dei bordi, tuttavia possono essere suddivisi in approcci basati sulla ricerca o basati sullo zero-crossing. I metodi basati sulla ricerca trovano gli spigoli stimando prima l'orientamento locale del bordo, in genere la direzione del gradiente, e quindi cercando i massimi direzionali locali dell'intensità del bordo, che è in genere un'espressione derivata del primo ordine come l'ampiezza del gradiente. Gli approcci basati sul passaggio per lo zero spesso cercano i passaggi per lo zero del laplaciano o i passaggi per lo zero di un'espressione differenziale non lineare, entrambi generati dall'immagine, per localizzare gli spigoli. Nella maggior parte dei casi, una fase di levigatura, spesso una fase di levigatura gaussiana, viene implementata come fase di pre-elaborazione prima che venga eseguito il rilevamento effettivo dei bordi (vedere anche riduzione del rumore).
Vengono utilizzati diversi filtri di levigatura e la resistenza dei bordi viene quantificata in modi leggermente diversi tra gli algoritmi di rilevamento dei bordi riportati. Poiché molte strategie di rilevamento dei bordi si concentrano sul calcolo dei gradienti dell'immagine, i filtri impiegati per stimare tali gradienti negli assi x e y potrebbero variare notevolmente tra gli approcci.
Una varietà di tecniche di rilevamento dei bordi sono discusse in (Ziou e Tabbone 1998); Date le condizioni di rilevamento, localizzazione e riduzione al minimo di molte risposte a un singolo bordo, John Canny ha esplorato la sfida matematica di progettare un filtro di levigatura efficace. In queste condizioni, ha dimostrato, il miglior filtro è la somma di quattro termini esponenziali. Ha anche dimostrato che le derivate gaussiane del primo ordine forniscono una buona approssimazione a questo filtro. Dati i filtri di presmoothing, i punti di bordo sono definiti come posizioni in cui l'ampiezza del gradiente raggiunge un massimo locale lungo l'asse del gradiente, un concetto che Canny ha presentato in precedenza. Haralick per prima cosa suggerì di cercare il passaggio per lo zero della derivata seconda lungo la direzione del gradiente. Una recente interpretazione variazionale geometrica dell'operatore, che lo collega al rivelatore di bordo Marr-Hildreth (attraversamento dello zero del Laplaciano), è stata scoperta in meno di due decenni. Ron Kimmel e Alfred Bruckstein hanno fatto questa osservazione. I rilevatori di bordi con prestazioni migliori rispetto al Canny tendono a richiedere più tempo di calcolo o più parametri.
Vladimiro A.
Kovalevsky, e un filtro di diluizione a rampa di sua progettazione.
Per rilevare un bordo tra due pixel vicini che hanno la stessa luminosità ma colori diversi,