Scopri milioni di eBook, audiolibri e tanto altro ancora con una prova gratuita

Solo $11.99/mese al termine del periodo di prova. Cancella quando vuoi.

Rilevamento oggetti: Progressi, applicazioni e algoritmi
Rilevamento oggetti: Progressi, applicazioni e algoritmi
Rilevamento oggetti: Progressi, applicazioni e algoritmi
E-book143 pagine1 ora

Rilevamento oggetti: Progressi, applicazioni e algoritmi

Valutazione: 0 su 5 stelle

()

Leggi anteprima

Info su questo ebook

Che cos'è il rilevamento degli oggetti


Il campo della tecnologia informatica noto come rilevamento degli oggetti è strettamente associato alla visione artificiale e all'elaborazione delle immagini. Il suo obiettivo primario è identificare istanze di oggetti semantici appartenenti a una classe specifica all'interno di immagini e video digitali. Nel campo del rilevamento di oggetti, il rilevamento dei volti e il rilevamento dei pedoni sono due aree che hanno ricevuto ampia attenzione. Il rilevamento degli oggetti è utile in un'ampia varietà di applicazioni di visione artificiale, tra cui il recupero di immagini e la videosorveglianza, tra gli altri.


Come trarrai vantaggio


(I ) Approfondimenti e convalide sui seguenti argomenti:


Capitolo 1: Rilevamento di oggetti


Capitolo 2: Visione artificiale


Capitolo 3: Segmentazione delle immagini


Capitolo 4: Corrispondenza dei modelli


Capitolo 5: Riconoscimento braille ottico


Capitolo 6: Apprendimento profondo


Capitolo 7: Rete neurale convoluzionale


Capitolo 8: DeepDream


Capitolo 9: Mappa di salienza


Capitolo 10: Rilevamento di piccoli oggetti


(II) Rispondere alle principali domande del pubblico sul rilevamento di oggetti .


(III) Esempi reali dell'utilizzo del rilevamento di oggetti in molti campi.


A chi è rivolto questo libro


Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di rilevamento di oggetti.


 


 

LinguaItaliano
Data di uscita4 mag 2024
Rilevamento oggetti: Progressi, applicazioni e algoritmi

Correlato a Rilevamento oggetti

Titoli di questa serie (100)

Visualizza altri

Ebook correlati

Intelligenza artificiale e semantica per voi

Visualizza altri

Articoli correlati

Recensioni su Rilevamento oggetti

Valutazione: 0 su 5 stelle
0 valutazioni

0 valutazioni0 recensioni

Cosa ne pensi?

Tocca per valutare

La recensione deve contenere almeno 10 parole

    Anteprima del libro

    Rilevamento oggetti - Fouad Sabry

    Capitolo 1: Rilevamento di oggetti

    Il rilevamento di oggetti è un sottocampo della visione artificiale e dell'elaborazione delle immagini che cerca di identificare soggetti riconoscibili in immagini e video digitali in base alle loro caratteristiche. Il riconoscimento facciale e il conteggio delle persone sono due esempi di sottocampi di rilevamento di oggetti ben studiati. Le applicazioni del rilevamento di oggetti nella visione artificiale vanno dal recupero delle immagini alla sorveglianza.

    Le applicazioni comuni nel campo della visione artificiale includono l'annotazione delle immagini, il rilevamento dei volti, il riconoscimento dei volti e la co-segmentazione degli oggetti nei video. Viene anche utilizzato per tracciare cose come la palla in una partita di calcio, la mazza da cricket in una partita di cricket o una persona in un videogioco.

    L'attività di rilevamento degli oggetti è in genere resa molto più impegnativa dal fatto che le immagini di prova vengono campionate da una diversa distribuzione dei dati. Poiché le etichette non richiedono alcun intervento umano, il rilevamento di oggetti tra domini viene utilizzato in molti contesti diversi, inclusa la guida autonoma.

    Le classi di oggetti possono essere distinte l'una dall'altra in base a caratteristiche condivise; Ad esempio, tutti i cerchi condividono la proprietà di essere sferici. Le caratteristiche univoche vengono utilizzate per determinare la classe di un oggetto. Nel caso dei cerchi, ad esempio, cerchiamo oggetti che si trovano a un certo raggio da un determinato punto. La stessa logica si applica alla ricerca di quadrati, che richiede oggetti con angoli perpendicolari e lati di uguale lunghezza. Le caratteristiche facciali come gli occhi, il naso e le labbra, così come quelle non anatomiche come il colore della pelle e la distanza tra gli occhi, vengono utilizzate in modo simile per l'identificazione del volto.

    I metodi di rilevamento degli oggetti possono essere classificati come basati su reti neurali o non neurali. Per classificare i dati senza ricorrere alle reti neurali, è necessario prima definire le caratteristiche con uno dei seguenti approcci. Tuttavia, le tecniche neurali, tipicamente basate su reti neurali convoluzionali, possono eseguire il rilevamento di oggetti end-to-end senza richiedere la definizione di caratteristiche (CNN).

    L'uso di metodi non neurali:

    Riconoscimento di oggetti utilizzando il framework Viola-Jones con funzionalità Haar

    Trasformazione per feature invarianti di scala (SIFT)

    Caratteristiche dell'istogramma a gradiente orientato (HOG)

    Metodi basati su reti neurali:

    Proposte per Regione (R-CNN,)

    Un rilevatore multi-box individuale (SSD)

    Quando lo vedi, lo sai (YOLO)

    Una rete neurale con ottimizzazione una tantum per l'identificazione di oggetti (RefineDet)

    Retina-Rete

    Reti convoluzionali deformabili

    {Fine Capitolo 1}

    Capitolo 2: Visione artificiale

    Lo studio di come i computer possano derivare conoscenze di alto livello da immagini o video digitali è al centro dell'area scientifica multidisciplinare della visione artificiale. Da un punto di vista tecnologico, indaga e tenta di automatizzare le attività che rientrano nelle capacità del sistema visivo umano.

    Le attività associate alla visione artificiale includono tecniche per ottenere, elaborare, analizzare e comprendere immagini digitali, nonché l'estrazione di dati ad alta dimensione dall'ambiente fisico al fine di creare informazioni numeriche o simboliche, come i giudizi.

    La visione artificiale è un sottocampo dell'informatica che indaga le basi teoriche dei sistemi artificiali progettati per derivare informazioni dalle immagini. I dati visivi possono essere presentati in una varietà di formati, tra cui sequenze video, immagini ottenute da diverse telecamere, dati multidimensionali ottenuti da uno scanner 3D o da apparecchiature di scansione medica e così via. L'obiettivo del campo tecnico noto come visione artificiale è quello di implementare le idee e i modelli che ha sviluppato nel processo di costruzione di sistemi di visione artificiale.

    I campi della ricostruzione della scena, del rilevamento di oggetti, del rilevamento di eventi, del tracciamento video, del riconoscimento di oggetti, della stima della posa 3D, dell'apprendimento, dell'indicizzazione, della stima del movimento, dell'asservimento visivo, della modellazione di scene 3D e del ripristino delle immagini sono tutti sottodomini della visione artificiale. Altri sottodomini della visione artificiale includono la modellazione di scene 3D.

    La visione artificiale è uno studio multidisciplinare che esamina il modo in cui i computer possono essere programmati per estrarre conoscenze di alto livello da immagini o filmati digitali. Quest'area si concentra su come insegnare ai computer a comprendere ciò che viene loro mostrato. Dal punto di vista dell'ingegneria, l'obiettivo è trovare il modo di automatizzare le operazioni che possono già essere eseguite dal sistema visivo umano. La visione artificiale è un campo di studio nel campo della tecnologia dell'informazione che si concentra sull'applicazione di teorie e modelli esistenti al processo di costruzione di sistemi di visione artificiale.

    Alla fine degli anni '60, i college che erano all'avanguardia nell'intelligenza artificiale sono stati i primi a sperimentare la visione artificiale. Il suo scopo era quello di funzionare in modo simile a quello del sistema visivo umano, con l'obiettivo finale di infondere nei robot un comportamento intelligente. Negli anni '90, molte delle aree di studio che erano state studiate in precedenza sono diventate più attive delle altre. Lo studio delle ricostruzioni tridimensionali proiettive ha portato a una comprensione più profonda di come calibrare una telecamera. Divenne chiaro, con l'introduzione delle tecniche di ottimizzazione per la calibrazione della fotocamera, che un numero significativo di concetti era stato precedentemente studiato dalla disciplina della teoria della regolazione del fascio della fotogrammetria. Questo è venuto alla luce come risultato di questo sviluppo. Ciò ha portato allo sviluppo di tecniche per la realizzazione di ricostruzioni tridimensionali sparse di scene utilizzando diverse fotografie. Sia il problema della densa corrispondenza stereo che lo sviluppo di ulteriori approcci stereo multi-view hanno visto un certo grado di movimento in avanti. Allo stesso tempo, sono state utilizzate molte varianti di taglio grafico per risolvere il problema della segmentazione dell'immagine. Questo decennio è stato particolarmente significativo in quanto è stata la prima volta che i metodi di apprendimento statistico sono stati utilizzati nella pratica per il compito di riconoscere i volti nelle fotografie (vedi Eigenface). Le aree della computer grafica e della visione artificiale sono diventate più intrecciate negli ultimi anni, il che ha portato a un grande aumento della quantità di collaborazione che ha avuto luogo tra i due. Questo presentava le prime forme di rendering del campo luminoso, lo stitching dell'immagine panoramica, il morphing dell'immagine, l'interpolazione della vista e il rendering basato sull'immagine. L'area della visione artificiale ha ricevuto una nuova prospettiva di vita grazie allo sviluppo di algoritmi basati sul deep learning. L'accuratezza degli algoritmi di deep learning su numerosi set di dati di visione artificiale di riferimento per attività che vanno dalla classificazione al flusso ottico ha superato quella degli approcci precedenti. Queste attività includono la segmentazione delle immagini e il flusso ottico.

    La visione artificiale a stato solido è fortemente connessa a una serie di altre discipline, tra cui la fisica. La stragrande maggioranza dei sistemi di visione artificiale si basa su sensori di immagine, che sono dispositivi in grado di rilevare le radiazioni elettromagnetiche. Questa radiazione si manifesta comunemente come luce visibile o infrarossa. La fisica quantistica è stata utilizzata nello sviluppo dei sensori. La disciplina scientifica della fisica fornisce una spiegazione per il metodo attraverso il quale la luce interagisce con le superfici. Il comportamento dell'ottica, che è una componente fondamentale della maggior parte dei sistemi di imaging, può essere spiegato dalla fisica. Al fine di offrire una conoscenza completa del processo attraverso il quale si forma un'immagine, sofisticati sensori di immagine hanno bisogno dell'uso della meccanica quantistica. La visione artificiale può anche essere utilizzata per risolvere una varietà di problemi di misurazione che sorgono in fisica, come quelli che coinvolgono il movimento dei fluidi.

    La disciplina scientifica della neurobiologia, in particolare lo studio del sistema visivo biologico. Gli occhi, i neuroni e le regioni del cervello che sono dedicati all'elaborazione degli input visivi sia negli esseri umani che in diversi animali sono stati oggetto di una notevole quantità di ricerche nel corso dell'ultimo secolo. Di conseguenza, è emersa una descrizione semplice ma complessa del modo in cui funzionano i sistemi di visione reali per completare vari compiti relativi alla visione. Come conseguenza di queste scoperte, è emerso un sottocampo della visione artificiale in cui i sistemi artificiali hanno lo scopo di imitare l'elaborazione e il comportamento dei sistemi biologici, con vari gradi di somiglianza biologica. Molti degli approcci basati sull'apprendimento che sono stati creati nell'ambito della visione artificiale hanno le loro radici nella biologia. Alcuni esempi di questi metodi basati sull'apprendimento includono l'analisi e la categorizzazione di immagini e funzionalità basate sulla rete neurale e sul deep learning.

    Alcune branche della ricerca sulla visione artificiale sono molto simili allo studio della visione biologica. Molti rami della ricerca sull'IA sono anche molto simili allo studio della coscienza umana e all'applicazione delle conoscenze acquisite in precedenza per interpretare, integrare e utilizzare l'input visivo. Lo studio e la modellizzazione dei meccanismi fisiologici che sono alla base della percezione visiva nell'uomo e in altri animali è di competenza della disciplina accademica della visione biologica. D'altra parte, la visione artificiale è lo studio e la descrizione dei processi che vengono implementati nel software e nell'hardware che sono alla base dei sistemi di visione artificiale. La collaborazione interdisciplinare tra le scienze della visione biologica e della visione artificiale si è dimostrata

    Ti è piaciuta l'anteprima?
    Pagina 1 di 1