Rilevamento oggetti: Progressi, applicazioni e algoritmi
Di Fouad Sabry
()
Info su questo ebook
Che cos'è il rilevamento degli oggetti
Il campo della tecnologia informatica noto come rilevamento degli oggetti è strettamente associato alla visione artificiale e all'elaborazione delle immagini. Il suo obiettivo primario è identificare istanze di oggetti semantici appartenenti a una classe specifica all'interno di immagini e video digitali. Nel campo del rilevamento di oggetti, il rilevamento dei volti e il rilevamento dei pedoni sono due aree che hanno ricevuto ampia attenzione. Il rilevamento degli oggetti è utile in un'ampia varietà di applicazioni di visione artificiale, tra cui il recupero di immagini e la videosorveglianza, tra gli altri.
Come trarrai vantaggio
(I ) Approfondimenti e convalide sui seguenti argomenti:
Capitolo 1: Rilevamento di oggetti
Capitolo 2: Visione artificiale
Capitolo 3: Segmentazione delle immagini
Capitolo 4: Corrispondenza dei modelli
Capitolo 5: Riconoscimento braille ottico
Capitolo 6: Apprendimento profondo
Capitolo 7: Rete neurale convoluzionale
Capitolo 8: DeepDream
Capitolo 9: Mappa di salienza
Capitolo 10: Rilevamento di piccoli oggetti
(II) Rispondere alle principali domande del pubblico sul rilevamento di oggetti .
(III) Esempi reali dell'utilizzo del rilevamento di oggetti in molti campi.
A chi è rivolto questo libro
Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di rilevamento di oggetti.
Correlato a Rilevamento oggetti
Titoli di questa serie (100)
Equalizzazione dell'istogramma: Miglioramento del contrasto dell'immagine per una migliore percezione visiva Valutazione: 0 su 5 stelle0 valutazioniVisione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRiduzione del rumore: Miglioramento della chiarezza, tecniche avanzate per la riduzione del rumore nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDiffusione anisotropa: Miglioramento dell'analisi delle immagini attraverso la diffusione anisotropa Valutazione: 0 su 5 stelle0 valutazioniRetinex: Svelare i segreti della visione computazionale con Retinex Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSistema di gestione del colore: Ottimizzazione della percezione visiva negli ambienti digitali Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniCorrezione gamma: Migliorare la chiarezza visiva nella visione artificiale: la tecnica di correzione gamma Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto del colore: Comprendere la percezione e la rappresentazione nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniScala dello spazio: Esplorare le dimensioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGruppo congiunto di esperti fotografici: Sfruttare la potenza dei dati visivi con lo standard JPEG Valutazione: 0 su 5 stelle0 valutazioniFunzione di corrispondenza dei colori: Comprendere la sensibilità spettrale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRidipintura: Colmare le lacune nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniIstogramma dell'immagine: Svelare intuizioni visive, esplorare le profondità degli istogrammi delle immagini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniConsenso del campione casuale: Stima robusta nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniModello a colori: Comprendere lo spettro della visione artificiale: esplorare i modelli di colore Valutazione: 0 su 5 stelle0 valutazioniSpazio colore: Esplorare lo spettro della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniStima della posa del corpo articolato: Sbloccare il movimento umano nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMappatura dei colori: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento delle macchie: Scoprire modelli nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniCompressione delle immagini: Tecniche efficienti per l'ottimizzazione dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniProfilo colore: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione affine: Sbloccare le prospettive visive: esplorare la trasformazione affine nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di feature invarianti di scala: Svelare il potere della trasformazione delle caratteristiche invarianti su scala nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioni
Ebook correlati
Visione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRiconoscimento ottico del Braille: Potenziare l'accessibilità attraverso l'intelligenza visiva Valutazione: 0 su 5 stelle0 valutazioniRete di sensori visivi: Esplorare la potenza delle reti di sensori visivi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSistema di riconoscimento facciale: Sbloccare il potere dell'intelligenza visiva Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale: Approfondimenti sul mondo della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniStima della posa del corpo articolato: Sbloccare il movimento umano nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRecupero delle immagini: Sbloccare la potenza dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniSoftware Afelio: Sbloccare la visione: esplorare le profondità del software Aphelion Valutazione: 0 su 5 stelle0 valutazioniAnnotazione automatica delle immagini: Migliorare la comprensione visiva attraverso il tagging automatico Valutazione: 0 su 5 stelle0 valutazioniSegmentazione delle immagini: Sbloccare insight grazie alla precisione dei pixel Valutazione: 0 su 5 stelle0 valutazioniRecupero di immagini basato sul contenuto: Sbloccare i database visivi Valutazione: 0 su 5 stelle0 valutazioniRicerca inversa delle immagini: Svelare i segreti del riconoscimento visivo Valutazione: 0 su 5 stelle0 valutazioniVisualizza la sintesi: Esplorare le prospettive nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniApprendimento delle caratteristiche geometriche: Sbloccare le intuizioni visive attraverso l'apprendimento delle caratteristiche geometriche Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto attivo: Sbloccare la potenza dei modelli di aspetto attivo nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFotocamera intelligente: Rivoluzionare la percezione visiva con la visione artificiale Valutazione: 0 su 5 stelle0 valutazioniAI nel Business: Guida Pratica all'Uso dell'Intelligenza Artificiale in Diverse Settori Valutazione: 0 su 5 stelle0 valutazioniGrafica di ray-tracing: Esplorazione del rendering fotorealistico nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVirtual Experience: La realtà virtuale nel mondo dell’arte Valutazione: 0 su 5 stelle0 valutazioniElaborazione delle immagini piramidali: Esplorare le profondità dell'analisi visiva Valutazione: 0 su 5 stelle0 valutazioniFlusso ottico: Esplorazione di modelli visivi dinamici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniL'era dell'Intelligenza Artificiale: Come l'AI sta rivoluzionando le nostre vite Valutazione: 0 su 5 stelle0 valutazioniRiconoscimento dell'iride: Prospettive illuminanti sul riconoscimento dell'iride nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniComputer grafica tridimensionale: Esplorare l'intersezione tra visione e mondi virtuali Valutazione: 0 su 5 stelle0 valutazioniFotografia Digitale: Dalle Compatte alle Reflex: Nuova Edizione Valutazione: 5 su 5 stelle5/5Riconoscimento dei gesti: Sbloccare il linguaggio del movimento Valutazione: 0 su 5 stelle0 valutazioni
Intelligenza artificiale e semantica per voi
Il Terzo Like Valutazione: 0 su 5 stelle0 valutazioniGuida Intelligenza Artificiale Valutazione: 0 su 5 stelle0 valutazioniANonniMus: Vecchi rivoluzionari contro giovani robot Valutazione: 0 su 5 stelle0 valutazioni
Recensioni su Rilevamento oggetti
0 valutazioni0 recensioni
Anteprima del libro
Rilevamento oggetti - Fouad Sabry
Capitolo 1: Rilevamento di oggetti
Il rilevamento di oggetti è un sottocampo della visione artificiale e dell'elaborazione delle immagini che cerca di identificare soggetti riconoscibili in immagini e video digitali in base alle loro caratteristiche. Il riconoscimento facciale e il conteggio delle persone sono due esempi di sottocampi di rilevamento di oggetti ben studiati. Le applicazioni del rilevamento di oggetti nella visione artificiale vanno dal recupero delle immagini alla sorveglianza.
Le applicazioni comuni nel campo della visione artificiale includono l'annotazione delle immagini, il rilevamento dei volti, il riconoscimento dei volti e la co-segmentazione degli oggetti nei video. Viene anche utilizzato per tracciare cose come la palla in una partita di calcio, la mazza da cricket in una partita di cricket o una persona in un videogioco.
L'attività di rilevamento degli oggetti è in genere resa molto più impegnativa dal fatto che le immagini di prova vengono campionate da una diversa distribuzione dei dati. Poiché le etichette non richiedono alcun intervento umano, il rilevamento di oggetti tra domini viene utilizzato in molti contesti diversi, inclusa la guida autonoma.
Le classi di oggetti possono essere distinte l'una dall'altra in base a caratteristiche condivise; Ad esempio, tutti i cerchi condividono la proprietà di essere sferici. Le caratteristiche univoche vengono utilizzate per determinare la classe di un oggetto. Nel caso dei cerchi, ad esempio, cerchiamo oggetti che si trovano a un certo raggio da un determinato punto. La stessa logica si applica alla ricerca di quadrati, che richiede oggetti con angoli perpendicolari e lati di uguale lunghezza. Le caratteristiche facciali come gli occhi, il naso e le labbra, così come quelle non anatomiche come il colore della pelle e la distanza tra gli occhi, vengono utilizzate in modo simile per l'identificazione del volto.
I metodi di rilevamento degli oggetti possono essere classificati come basati su reti neurali o non neurali. Per classificare i dati senza ricorrere alle reti neurali, è necessario prima definire le caratteristiche con uno dei seguenti approcci. Tuttavia, le tecniche neurali, tipicamente basate su reti neurali convoluzionali, possono eseguire il rilevamento di oggetti end-to-end senza richiedere la definizione di caratteristiche (CNN).
L'uso di metodi non neurali:
Riconoscimento di oggetti utilizzando il framework Viola-Jones con funzionalità Haar
Trasformazione per feature invarianti di scala (SIFT)
Caratteristiche dell'istogramma a gradiente orientato (HOG)
Metodi basati su reti neurali:
Proposte per Regione (R-CNN,)
Un rilevatore multi-box individuale (SSD)
Quando lo vedi, lo sai (YOLO)
Una rete neurale con ottimizzazione una tantum per l'identificazione di oggetti (RefineDet)
Retina-Rete
Reti convoluzionali deformabili
{Fine Capitolo 1}
Capitolo 2: Visione artificiale
Lo studio di come i computer possano derivare conoscenze di alto livello da immagini o video digitali è al centro dell'area scientifica multidisciplinare della visione artificiale. Da un punto di vista tecnologico, indaga e tenta di automatizzare le attività che rientrano nelle capacità del sistema visivo umano.
Le attività associate alla visione artificiale includono tecniche per ottenere, elaborare, analizzare e comprendere immagini digitali, nonché l'estrazione di dati ad alta dimensione dall'ambiente fisico al fine di creare informazioni numeriche o simboliche, come i giudizi.
La visione artificiale è un sottocampo dell'informatica che indaga le basi teoriche dei sistemi artificiali progettati per derivare informazioni dalle immagini. I dati visivi possono essere presentati in una varietà di formati, tra cui sequenze video, immagini ottenute da diverse telecamere, dati multidimensionali ottenuti da uno scanner 3D o da apparecchiature di scansione medica e così via. L'obiettivo del campo tecnico noto come visione artificiale è quello di implementare le idee e i modelli che ha sviluppato nel processo di costruzione di sistemi di visione artificiale.
I campi della ricostruzione della scena, del rilevamento di oggetti, del rilevamento di eventi, del tracciamento video, del riconoscimento di oggetti, della stima della posa 3D, dell'apprendimento, dell'indicizzazione, della stima del movimento, dell'asservimento visivo, della modellazione di scene 3D e del ripristino delle immagini sono tutti sottodomini della visione artificiale. Altri sottodomini della visione artificiale includono la modellazione di scene 3D.
La visione artificiale è uno studio multidisciplinare che esamina il modo in cui i computer possono essere programmati per estrarre conoscenze di alto livello da immagini o filmati digitali. Quest'area si concentra su come insegnare ai computer a comprendere ciò che viene loro mostrato. Dal punto di vista dell'ingegneria, l'obiettivo è trovare il modo di automatizzare le operazioni che possono già essere eseguite dal sistema visivo umano. La visione artificiale è un campo di studio nel campo della tecnologia dell'informazione che si concentra sull'applicazione di teorie e modelli esistenti al processo di costruzione di sistemi di visione artificiale.
Alla fine degli anni '60, i college che erano all'avanguardia nell'intelligenza artificiale sono stati i primi a sperimentare la visione artificiale. Il suo scopo era quello di funzionare in modo simile a quello del sistema visivo umano, con l'obiettivo finale di infondere nei robot un comportamento intelligente. Negli anni '90, molte delle aree di studio che erano state studiate in precedenza sono diventate più attive delle altre. Lo studio delle ricostruzioni tridimensionali proiettive ha portato a una comprensione più profonda di come calibrare una telecamera. Divenne chiaro, con l'introduzione delle tecniche di ottimizzazione per la calibrazione della fotocamera, che un numero significativo di concetti era stato precedentemente studiato dalla disciplina della teoria della regolazione del fascio della fotogrammetria. Questo è venuto alla luce come risultato di questo sviluppo. Ciò ha portato allo sviluppo di tecniche per la realizzazione di ricostruzioni tridimensionali sparse di scene utilizzando diverse fotografie. Sia il problema della densa corrispondenza stereo che lo sviluppo di ulteriori approcci stereo multi-view hanno visto un certo grado di movimento in avanti. Allo stesso tempo, sono state utilizzate molte varianti di taglio grafico per risolvere il problema della segmentazione dell'immagine. Questo decennio è stato particolarmente significativo in quanto è stata la prima volta che i metodi di apprendimento statistico sono stati utilizzati nella pratica per il compito di riconoscere i volti nelle fotografie (vedi Eigenface). Le aree della computer grafica e della visione artificiale sono diventate più intrecciate negli ultimi anni, il che ha portato a un grande aumento della quantità di collaborazione che ha avuto luogo tra i due. Questo presentava le prime forme di rendering del campo luminoso, lo stitching dell'immagine panoramica, il morphing dell'immagine, l'interpolazione della vista e il rendering basato sull'immagine. L'area della visione artificiale ha ricevuto una nuova prospettiva di vita grazie allo sviluppo di algoritmi basati sul deep learning. L'accuratezza degli algoritmi di deep learning su numerosi set di dati di visione artificiale di riferimento per attività che vanno dalla classificazione al flusso ottico ha superato quella degli approcci precedenti. Queste attività includono la segmentazione delle immagini e il flusso ottico.
La visione artificiale a stato solido è fortemente connessa a una serie di altre discipline, tra cui la fisica. La stragrande maggioranza dei sistemi di visione artificiale si basa su sensori di immagine, che sono dispositivi in grado di rilevare le radiazioni elettromagnetiche. Questa radiazione si manifesta comunemente come luce visibile o infrarossa. La fisica quantistica è stata utilizzata nello sviluppo dei sensori. La disciplina scientifica della fisica fornisce una spiegazione per il metodo attraverso il quale la luce interagisce con le superfici. Il comportamento dell'ottica, che è una componente fondamentale della maggior parte dei sistemi di imaging, può essere spiegato dalla fisica. Al fine di offrire una conoscenza completa del processo attraverso il quale si forma un'immagine, sofisticati sensori di immagine hanno bisogno dell'uso della meccanica quantistica. La visione artificiale può anche essere utilizzata per risolvere una varietà di problemi di misurazione che sorgono in fisica, come quelli che coinvolgono il movimento dei fluidi.
La disciplina scientifica della neurobiologia, in particolare lo studio del sistema visivo biologico. Gli occhi, i neuroni e le regioni del cervello che sono dedicati all'elaborazione degli input visivi sia negli esseri umani che in diversi animali sono stati oggetto di una notevole quantità di ricerche nel corso dell'ultimo secolo. Di conseguenza, è emersa una descrizione semplice ma complessa del modo in cui funzionano i sistemi di visione reali
per completare vari compiti relativi alla visione. Come conseguenza di queste scoperte, è emerso un sottocampo della visione artificiale in cui i sistemi artificiali hanno lo scopo di imitare l'elaborazione e il comportamento dei sistemi biologici, con vari gradi di somiglianza biologica. Molti degli approcci basati sull'apprendimento che sono stati creati nell'ambito della visione artificiale hanno le loro radici nella biologia. Alcuni esempi di questi metodi basati sull'apprendimento includono l'analisi e la categorizzazione di immagini e funzionalità basate sulla rete neurale e sul deep learning.
Alcune branche della ricerca sulla visione artificiale sono molto simili allo studio della visione biologica. Molti rami della ricerca sull'IA sono anche molto simili allo studio della coscienza umana e all'applicazione delle conoscenze acquisite in precedenza per interpretare, integrare e utilizzare l'input visivo. Lo studio e la modellizzazione dei meccanismi fisiologici che sono alla base della percezione visiva nell'uomo e in altri animali è di competenza della disciplina accademica della visione biologica. D'altra parte, la visione artificiale è lo studio e la descrizione dei processi che vengono implementati nel software e nell'hardware che sono alla base dei sistemi di visione artificiale. La collaborazione interdisciplinare tra le scienze della visione biologica e della visione artificiale si è dimostrata