Apprendimento delle caratteristiche geometriche: Sbloccare le intuizioni visive attraverso l'apprendimento delle caratteristiche geometriche
Di Fouad Sabry
()
Info su questo ebook
Cos'è l'apprendimento delle caratteristiche geometriche
L'apprendimento delle caratteristiche geometriche è una tecnica che combina l'apprendimento automatico e la visione artificiale per risolvere compiti visivi. L'obiettivo principale di questo metodo è trovare un insieme di caratteristiche rappresentative della forma geometrica per rappresentare un oggetto raccogliendo caratteristiche geometriche dalle immagini e apprendendole utilizzando metodi efficienti di apprendimento automatico. Gli esseri umani risolvono compiti visivi e possono dare una risposta rapida all'ambiente estraendo informazioni percettive da ciò che vedono. I ricercatori simulano la capacità umana di riconoscere gli oggetti per risolvere problemi di visione artificiale. Ad esempio, M. Mata et al. (2002) hanno applicato tecniche di apprendimento delle caratteristiche ai compiti di navigazione del robot mobile per evitare ostacoli. Hanno utilizzato algoritmi genetici per apprendere caratteristiche e riconoscere oggetti (figure). I metodi di apprendimento delle caratteristiche geometriche possono non solo risolvere problemi di riconoscimento ma anche prevedere azioni successive analizzando una serie di immagini sensoriali di input sequenziali, solitamente alcune caratteristiche di estrazione delle immagini. Attraverso l'apprendimento si danno alcune ipotesi sull'azione successiva e in base alla probabilità di ciascuna ipotesi si dà l'azione più probabile. Questa tecnica è ampiamente utilizzata nel campo dell'intelligenza artificiale.
Come trarrai vantaggio
(I) Approfondimenti e convalide sui seguenti argomenti:
Capitolo 1: Apprendimento delle caratteristiche geometriche
Capitolo 2: Riconoscimento di modelli
Capitolo 3: Trasformata di Hough
Capitolo 4: Funzione di perdita
Capitolo 5: Aspettative-Algoritmo di massimizzazione
Capitolo 6: Campionamento di rifiuto
Capitolo 7: Elaborazione degli array
Capitolo 8: Codificatore automatico
Capitolo 9: Approssimazione stocastica
Capitolo 10: Rilevamento della scacchiera
(II) Rispondere alle principali domande del pubblico sull'apprendimento delle caratteristiche geometriche.
(III ) Esempi reali dell'utilizzo dell'apprendimento delle caratteristiche geometriche in molti campi.
A chi è rivolto questo libro
Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che vogliono andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di apprendimento delle caratteristiche geometriche.
Leggi altro di Fouad Sabry
Tecnologie Emergenti Nell'Energia [Italian]
Correlato a Apprendimento delle caratteristiche geometriche
Titoli di questa serie (100)
Equalizzazione dell'istogramma: Miglioramento del contrasto dell'immagine per una migliore percezione visiva Valutazione: 0 su 5 stelle0 valutazioniCorrezione gamma: Migliorare la chiarezza visiva nella visione artificiale: la tecnica di correzione gamma Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDiffusione anisotropa: Miglioramento dell'analisi delle immagini attraverso la diffusione anisotropa Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniIstogramma dell'immagine: Svelare intuizioni visive, esplorare le profondità degli istogrammi delle immagini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione affine: Sbloccare le prospettive visive: esplorare la trasformazione affine nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRetinex: Svelare i segreti della visione computazionale con Retinex Valutazione: 0 su 5 stelle0 valutazioniPercezione visiva: Approfondimenti sull'elaborazione visiva computazionale Valutazione: 0 su 5 stelle0 valutazioniRidipintura: Colmare le lacune nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCompressione delle immagini: Tecniche efficienti per l'ottimizzazione dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniVisione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento dei bordi: Esplorare i confini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSpazio colore: Esplorare lo spettro della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniBanca filtri: Approfondimenti sulle tecniche del banco di filtri di Computer Vision Valutazione: 0 su 5 stelle0 valutazioniGruppo congiunto di esperti fotografici: Sfruttare la potenza dei dati visivi con lo standard JPEG Valutazione: 0 su 5 stelle0 valutazioniTrasformata di Hadamard: Svelare il potere della trasformazione Hadamard nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello del sistema visivo umano: Comprendere la percezione e l'elaborazione Valutazione: 0 su 5 stelle0 valutazioniRiduzione del rumore: Miglioramento della chiarezza, tecniche avanzate per la riduzione del rumore nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniIstogramma dei gradienti orientati: Svelare il regno visivo: esplorare l'istogramma dei gradienti orientati nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFunzione di corrispondenza dei colori: Comprendere la sensibilità spettrale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento dei contorni: Svelare l'arte della percezione visiva nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello a colori: Comprendere lo spettro della visione artificiale: esplorare i modelli di colore Valutazione: 0 su 5 stelle0 valutazioniConsenso del campione casuale: Stima robusta nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento delle macchie: Scoprire modelli nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniFiltro adattivo: Migliorare la visione artificiale attraverso il filtraggio adattivo Valutazione: 0 su 5 stelle0 valutazioni
Ebook correlati
Segmentazione delle immagini: Sbloccare insight grazie alla precisione dei pixel Valutazione: 0 su 5 stelle0 valutazioniClassificazione delle immagini contestuali: Comprendere i dati visivi per una classificazione efficace Valutazione: 0 su 5 stelle0 valutazioniRilevamento oggetti: Progressi, applicazioni e algoritmi Valutazione: 0 su 5 stelle0 valutazioniElaborazione delle immagini piramidali: Esplorare le profondità dell'analisi visiva Valutazione: 0 su 5 stelle0 valutazioniStima della posa del corpo articolato: Sbloccare il movimento umano nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSistema di riconoscimento facciale: Sbloccare il potere dell'intelligenza visiva Valutazione: 0 su 5 stelle0 valutazioniHashing geometrico: Algoritmi efficienti per il riconoscimento e la corrispondenza delle immagini Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale: Approfondimenti sul mondo della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento dei bordi: Esplorare i confini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGeometria computazionale: Esplorazione di intuizioni geometriche per la visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di feature invarianti di scala: Svelare il potere della trasformazione delle caratteristiche invarianti su scala nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniEigenface: Esplorare le profondità del riconoscimento visivo con Eigenface Valutazione: 0 su 5 stelle0 valutazioniRecupero di immagini basato sul contenuto: Sbloccare i database visivi Valutazione: 0 su 5 stelle0 valutazioniRegolazione del pacchetto: Ottimizzazione dei dati visivi per una ricostruzione precisa Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto attivo: Sbloccare la potenza dei modelli di aspetto attivo nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniIstogramma dei gradienti orientati: Svelare il regno visivo: esplorare l'istogramma dei gradienti orientati nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSuperficie procedurale: Esplorazione della generazione e dell'analisi delle texture nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGrafica di ray-tracing: Esplorazione del rendering fotorealistico nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRete di sensori visivi: Esplorare la potenza delle reti di sensori visivi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTagli del grafico di visione artificiale: Esplorazione dei tagli grafici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento delle macchie: Scoprire modelli nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniMosaicazione di documenti: Sbloccare intuizioni visive attraverso il mosaico di documenti Valutazione: 0 su 5 stelle0 valutazioniModellazione e rendering basati su immagini: Esplorare il realismo visivo: tecniche di visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisualizza la sintesi: Esplorare le prospettive nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniPrimitivo geometrico: Esplorazione dei fondamenti e delle applicazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGenerazione di maglie: Progressi e applicazioni nella generazione di mesh per la visione artificiale Valutazione: 0 su 5 stelle0 valutazioni
Intelligenza artificiale e semantica per voi
Guida Intelligenza Artificiale Valutazione: 0 su 5 stelle0 valutazioniANonniMus: Vecchi rivoluzionari contro giovani robot Valutazione: 0 su 5 stelle0 valutazioniIl Terzo Like Valutazione: 0 su 5 stelle0 valutazioni
Recensioni su Apprendimento delle caratteristiche geometriche
0 valutazioni0 recensioni
Anteprima del libro
Apprendimento delle caratteristiche geometriche - Fouad Sabry
Capitolo 1: Apprendimento delle caratteristiche geometriche
L'apprendimento automatico e la visione artificiale si uniscono in un metodo chiamato apprendimento delle caratteristiche geometriche, che viene utilizzato per completare le attività visive. Estraendo le caratteristiche geometriche dalle foto e imparandole con metodi di apprendimento automatico efficaci, questo metodo cerca di stabilire un insieme di caratteristiche rappresentative della forma geometrica per descrivere un oggetto. Raccogliendo informazioni percettive da ciò che vedono, gli esseri umani sono in grado di risolvere problemi visivi e rispondere rapidamente all'ambiente circostante. Al fine di affrontare i problemi di visione artificiale, i ricercatori hanno iniziato a modellare le strategie di riconoscimento degli oggetti umani. Per aiutare i robot mobili a navigare in sicurezza, ricercatori come M. Mata et al. (2002) hanno utilizzato metodi di apprendimento delle funzionalità. Gli algoritmi genetici sono stati utilizzati per l'apprendimento delle caratteristiche e il riconoscimento degli oggetti (figure). Studiando una sequenza di immagini sensoriali in ingresso, in genere estraendone caratteristiche, gli approcci di apprendimento delle caratteristiche geometriche sono in grado non solo di gestire i problemi di riconoscimento, ma anche di anticipare i comportamenti futuri. Il processo di apprendimento fornisce una serie di ipotesi sul passaggio successivo, quindi classifica le ipotesi in ordine di probabilità per determinare la linea d'azione più probabile. Il campo dell'intelligenza artificiale fa ampio uso di questo metodo.
Le immagini includono caratteristiche geometriche uniche che possono essere estratte utilizzando tecniche di apprendimento delle caratteristiche geometriche. Gli oggetti possono avere qualità geometriche perché sono costituiti da una serie di parti geometriche come punti, linee, curve e superfici. Le tecniche di rilevamento delle caratteristiche sono in grado di identificare caratteristiche come angoli, bordi, macchie, creste, punti salienti e altre aree prominenti della trama di un'immagine.
Caratteristiche primitive
Gli angoli degli oggetti sono un elemento di design semplice ma cruciale. Le cose complesse, in particolare, spesso presentano caratteristiche d'angolo contrastanti. Il rilevamento degli angoli è un metodo per isolare i quattro angoli di un oggetto. Cho e Dunn definirono un angolo con un nuovo approccio, basato sulla separazione e sull'angolo di due linee parallele. In questo nuovo approccio, le feature sono definite come la somma parametrizzata di molti sottocomponenti.
I bordi di un'immagine sono i suoi elementi strutturali distintivi in un'unica dimensione. Denotano i limiti tra aree visive distinte. Il rilevamento dei bordi è un metodo per individuare in modo rapido e preciso i contorni di un oggetto.
Il metodo di rilevamento dei BLOB viene usato per identificare i BLOB, che sono aree nelle fotografie.
Da un punto di vista applicativo, una cresta può essere interpretata come una curva simmetrica unidimensionale. Vedere anche: Metodo di rilevamento per le creste.
per l'attenzione del rivelatore di salienza di Kadir-Brady sulle caratteristiche salienti, la trama dell'immagine
Caratteristiche composte
Composizione geometrica
Più feature di base, ad esempio spigoli, angoli o blob, vengono combinate per formare un'unica feature di componente geometrico. Di seguito mostriamo come il punto di riferimento può essere utilizzato per calcolare il vettore necessario per estrarre l'elemento geometrico in posizione x:
\textstyle \ x_{{i}}=x_{{i-1}}+\sigma _{{i-1}}d_{{i}}{\begin{bmatrix}\cos(\theta _{{i-1}}+\phi _{{i}})\\\sin(\theta _{{i-1}}+\phi _{{i}})\end{bmatrix}}\textstyle \ \theta _{{i}}=\theta _{{i-1}}+\Delta \theta _{{i}}\textstyle \ \sigma _{{i}}=\sigma _{{i-1}}\Delta \sigma _{{i}}Le posizioni degli elementi sono indicate con il simbolo x, \textstyle \theta indica l'orientamento, \textstyle \sigma indica la scala intrinseca.
Composizione booleana
Altre due feature, primitive o altre feature composte, costituiscono una feature composta booleana. Le caratteristiche booleane possono essere suddivise in due categorie: caratteristiche congiuntive il cui valore è il prodotto di due sotto-caratteristiche e caratteristiche disgiuntive il cui valore è il massimo delle due sotto-caratteristiche.
Segen è stato il primo a riflettere sul concetto di spazio caratteristico
nel campo della visione artificiale. Per rappresentare le relazioni geometriche tra i tratti regionali, ha utilizzato un grafo a più livelli.
Il riconoscimento degli oggetti nelle immagini può essere insegnato con un numero qualsiasi di tecniche di apprendimento disponibili. È possibile aggiungere nuovi tipi di oggetti al tuo repertorio durante il processo di apprendimento.
Rilevamento degli angoli
Raccordo curva
Rilevamento dei bordi
Estrazione di strutture globali
Istogrammi delle caratteristiche
Rilevamento della linea
Etichettatura di parti interconnesse
Texture dell'immagine
Stima del movimento
1.Ottenere una nuova immagine di allenamento I
.
2. Valutare l'esito alla luce dell'algoritmo di riconoscimento. Le nuove classi di oggetti vengono riconosciute se il risultato è positivo.
algoritmo di riconoscimento
Trovare le caratteristiche che distinguono una classe da un'altra è l'obiettivo primario di ogni programma di riconoscimento.
Quindi usando l'equazione sottostante per massimizzare la caratteristica \textstyle \ f_{{max}}
\textstyle \ I_{{max}}={\underset {f}{max}}{\underset {C}{max}}I(C,F_{{f}})\textstyle \ I(C,F_{{f}})=-{\underset {C}{\sum }}{\underset {F_{{f}}}{\sum }}BEL(F_{{f}},C)\log {\frac {BEL(C,F_{{f}})}{BEL(F_{{f}})BEL(C)}}Valutazione del valore di un'immagine \textstyle \ f_{{max}} e, \textstyle \ f_{{f_{{max}}}} inoltre, per adattare un attributo a una regione specifica:
\textstyle \ f_{{f_{{(p)}}}}(I)={\underset {x\in I}{max}}f_{{f_{{(p)}}}}(x)Dove \textstyle f_{{f_{{(p)}}}}(x) è definito come
\textstyle f_{{f_{{(p)}}}}(I)=max\left\{0,{\frac {f(p)^{T})f(x)}{\left\|f(p)\right\|\left\|f(x)\right\|}}\right\}valutazione
Esistono cinque categorie di valutazione dei risultati del riconoscimento: corretto, errato, ambiguo, confuso e ignorante. Queste categorie consentono di determinare se le classi possono essere riconosciute dopo il riconoscimento delle funzionalità. Aggiungere una nuova immagine di training una volta che la valutazione è accurata. Nel caso in cui il riconoscimento non abbia successo, si raccomanda che i nodi delle caratteristiche massimizzino il loro potere distintivo, misurato dalla distanza di Kolmogorov-Smirnoff (KSD).
\textstyle KSD_{{a,b}}(X)={\underset {\alpha }{max}}\left|cdf(\alpha |a)-cdf(\alpha |b)\right|3.Algoritmo per l'acquisizione di feature L'approccio di apprendimento delle feature viene quindi utilizzato per testare l'accuratezza del riconoscimento della rete bayesiana dopo che la feature è stata identificata.
L'obiettivo principale di un metodo di apprendimento delle funzionalità è individuare una nuova funzionalità da un'immagine di esempio con cui valutare se le classi sono state riconosciute correttamente o meno. Ci sono due scenari da considerare: usando l'immagine di esempio, cercare nuove funzionalità della classe reale e della classe errata. Una classe viene riconosciuta e la procedura deve terminare se viene individuata una nuova funzionalità della classe reale e la classe errata non viene individuata. Rimuovere le funzionalità dalla rete bayesiana che possono essere utilizzate per riconoscere la classe false se vengono trovate nell'immagine di esempio ma non nella classe effettiva.
La procedura di test viene attuata utilizzando una rete bayesiana.
D ha usato un concetto chiamato probabilmente approssimativamente corretto (PAC) per.
Questo approccio è stato utilizzato da Roth (2002) per creare una teoria dell'apprendimento senza distribuzione per la visione artificiale.
La creazione di un metodo di apprendimento efficiente dal punto di vista delle funzionalità è stata fondamentale per il successo di questa ipotesi.
Lo scopo di questo algoritmo è quello di riconoscere un oggetto in un'immagine in base alle sue caratteristiche geometriche.
I vettori di feature vengono utilizzati come input e un 1 alla fine indica l'esito positivo del rilevamento dell'oggetto, mentre uno 0 indica un errore.
L'idea chiave alla base di questo metodo di apprendimento è quella di accumulare caratteristiche in grado di descrivere fedelmente l'elemento attraverso una funzione, e quindi mettere alla prova tale funzione riconoscendo un oggetto in un'immagine.
L'algoritmo di apprendimento mira a prevedere se il concetto di destinazione appreso \textstyle f_{{T}}(X) appartiene a una classe, dove X è lo spazio dell'istanza e i parametri vengono testati per vedere se sono accurati.
Una volta apprese le caratteristiche, queste possono essere utilizzate per valutare l'efficacia degli algoritmi di apprendimento. D. Roth ha utilizzato due algoritmi di apprendimento:
1.L'algoritmo dei nodi sparsi su un albero (SNoT)
SNoW-Treno
Fase iniziale: iniziale l'insieme di elementi \textstyle F_{{t}}=\phi che si collegano alla destinazione t per tutti \textstyle t\in T .
T è un insieme di oggetti target i cui elementi devono \textstyle t_{{1}} essere \textstyle t_{{k}}
Impostare il peso iniziale e collegare l'elemento all'obiettivo se l'impostazione T contiene solo l'elemento che condivide un insieme di elementi attivi.
Valutare i bersagli : confrontare i bersagli \textstyle {\underset {i\in e}{\sum }}w_{{i}}^{{t}} con \textstyle \theta _{{t}} , dove \textstyle w_{{i}}^{{t}} è il peso su una posizione che collega gli elementi i al bersaglio t.
theta t è la soglia desiderata, non t.
Regolare l'importanza in base ai risultati dell'analisi.
Esistono due casi: previsto positivo su esempio negativo ( \textstyle {\underset {i\in e}{\sum }}w_{{i}}^{{t}}>\theta _{{t}} e le destinazioni non sono nell'elenco delle funzionalità attive) e previsto negativo sull'esempio positivo ( \textstyle {\underset {i\in e}{\sum }}w_{{i}}^{{t}}\leq \theta _{{t}} e le destinazioni sono nell'elenco delle funzionalità attive).
Valutazione SNoW
Applicare la stessa funzione valutativa descritta nella frase precedente a ciascun obiettivo.
Predizione: selezionare il nodo con i processi terminali più attivi.
Sistema di supporto vettoriale
Lo scopo principale di SVM è quello di trovare un iperpiano per separare l'insieme dei campioni, \textstyle (x_{{i}},y_{{i}}) dove \textstyle x_{i} è un vettore di input che è una selezione di elementi