Scopri milioni di eBook, audiolibri e tanto altro ancora con una prova gratuita

Solo $11.99/mese al termine del periodo di prova. Cancella quando vuoi.

Riconoscimento automatico del bersaglio: Progressi nelle tecniche di visione artificiale per il riconoscimento del bersaglio
Riconoscimento automatico del bersaglio: Progressi nelle tecniche di visione artificiale per il riconoscimento del bersaglio
Riconoscimento automatico del bersaglio: Progressi nelle tecniche di visione artificiale per il riconoscimento del bersaglio
E-book183 pagine2 ore

Riconoscimento automatico del bersaglio: Progressi nelle tecniche di visione artificiale per il riconoscimento del bersaglio

Valutazione: 0 su 5 stelle

()

Leggi anteprima

Info su questo ebook

Cos'è il riconoscimento automatico del bersaglio


La capacità di un algoritmo o di un dispositivo di riconoscere bersagli o altri oggetti in base ai dati acquisiti dai sensori viene definita riconoscimento automatico del bersaglio, un abbreviazione di queste funzionalità.


Come trarrai vantaggio


(I) Approfondimenti e convalide sui seguenti argomenti:


Capitolo 1: Riconoscimento automatico del bersaglio


Capitolo 2: Visione artificiale


Capitolo 3: Radar


Capitolo 4: Radar Doppler


Capitolo 5: Radar ad apertura sintetica


Capitolo 6: Radar per immagini


Capitolo 7: Beamforming


Capitolo 8: Radar Pulse-Doppler


Capitolo 9 : Radar passivo


Capitolo 10: Radar ad apertura sintetica inversa


(II) Rispondere alle principali domande del pubblico sul riconoscimento automatico del bersaglio.


(III) Mondo reale esempi di utilizzo del riconoscimento automatico del bersaglio in molti campi.


A chi è rivolto questo libro


Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che vogliono andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di riconoscimento automatico del bersaglio.


 


 

LinguaItaliano
Data di uscita4 mag 2024
Riconoscimento automatico del bersaglio: Progressi nelle tecniche di visione artificiale per il riconoscimento del bersaglio

Correlato a Riconoscimento automatico del bersaglio

Titoli di questa serie (100)

Visualizza altri

Ebook correlati

Intelligenza artificiale e semantica per voi

Visualizza altri

Articoli correlati

Recensioni su Riconoscimento automatico del bersaglio

Valutazione: 0 su 5 stelle
0 valutazioni

0 valutazioni0 recensioni

Cosa ne pensi?

Tocca per valutare

La recensione deve contenere almeno 10 parole

    Anteprima del libro

    Riconoscimento automatico del bersaglio - Fouad Sabry

    Capitolo 1: Riconoscimento automatico del bersaglio

    Il termine riconoscimento automatico del bersaglio (ATR) si riferisce alla capacità di un algoritmo o di un dispositivo di identificare un bersaglio o un altro oggetto dai dati del sensore.

    Agli albori del radar, gli operatori dovevano ascoltare le rappresentazioni audio dei segnali ricevuti e utilizzare il loro addestramento per determinare che tipo di bersaglio veniva illuminato. Nonostante i risultati di questi esperti umani, sono stati e sono in fase di sviluppo metodi automatizzati per migliorare l'accuratezza e la velocità della classificazione. Animali, esseri umani e vegetazione disordinata sono solo alcuni dei bersagli biologici che possono essere identificati con la tecnologia ATR. Le aree di applicazione vanno dal riconoscimento di oggetti sul campo alla riduzione del rumore degli uccelli sul radar meteorologico Doppler.

    I possibili usi militari includono un identificatore facile da implementare come un transponder IFF, nonché sistemi più complessi come UAV e missili da crociera. I potenziali usi dell'ATR nell'arena domestica stanno attirando sempre più attenzione. Una varietà di applicazioni, dai veicoli automatizzati ai sistemi di sicurezza in grado di rilevare oggetti o persone sui binari della metropolitana, alla sicurezza delle frontiere, hanno beneficiato degli studi ATR.

    Quasi da quando esiste il radar, i bersagli sono stati riconosciuti. Gli operatori radar usavano la rappresentazione acustica del segnale riflesso per identificare i bombardieri e i caccia nemici (vedi Radar nella seconda guerra mondiale).

    Per molto tempo, gli operatori hanno ascoltato il segnale in banda base per identificare i bersagli. Gli operatori radar addestrati possono utilizzare questo segnale per determinare il tipo di veicolo utilizzato per illuminare il bersaglio, le dimensioni del bersaglio e possibilmente anche la presenza di bersagli biologici. Ma ci sono molte restrizioni su questo metodo. C'è un'alta probabilità di errore a causa della componente decisionale umana, della necessità che l'operatore sia addestrato per il suono di ogni bersaglio e della possibilità che il bersaglio non sia più udibile se viaggia ad alta velocità. Questo concetto di rappresentazione uditiva del segnale, tuttavia, ha gettato le basi per la classificazione automatica del bersaglio. Le caratteristiche del segnale in banda base che sono state utilizzate in altre applicazioni audio, come il riconoscimento vocale, sono state incorporate in una serie di schemi di classificazione che sono stati sviluppati.

    La portata di un oggetto può essere calcolata utilizzando il radar cronometrando il tempo necessario al segnale per tornare dal bersaglio che il segnale illumina. L'effetto Doppler descrive la modifica della frequenza causata dal movimento di tale oggetto. Uno spostamento di frequenza può essere causato dalla vibrazione o dalla rotazione di un oggetto oltre che dal movimento di traslazione dell'intero oggetto. In questo caso, il segnale Doppler verrà modulato. L'effetto micro-Doppler si riferisce all'effetto Doppler aggiuntivo responsabile della modulazione del segnale. Al fine di creare algoritmi per ATR, questa modulazione può avere una firma riconoscibile. Quando il bersaglio è in movimento, l'effetto micro-Doppler causerà un segnale variabile nel tempo e nella frequenza.

    Poiché la trasformata di Fourier non tiene conto del tempo, l'analisi di questo segnale con una trasformata di Fourier non è sufficiente. La trasformata di Fourier a breve termine è l'approccio più semplice per ottenere una funzione frequenza-tempo (STFT). I domini della frequenza e del tempo possono essere rappresentati simultaneamente utilizzando metodi più robusti come la trasformata di Gabor o la funzione di distribuzione di Wigner (WVD). Tuttavia, la risoluzione in frequenza e la risoluzione in tempo saranno sempre compromesse in questi approcci.

    Dopo che questi dati spettrali sono stati estratti, possono essere confrontati con un database contenente informazioni sui bersagli che il sistema identificherà per determinare quale sia effettivamente il bersaglio illuminato. Al fine di determinare quale target nella libreria si adatta meglio al modello costruito utilizzando il segnale ricevuto, viene utilizzato un metodo di stima statistica come la massima verosimiglianza (ML), il voto a maggioranza (MV) o il massimo a posteriori (MAP).

    I sistemi automatizzati di riconoscimento del bersaglio che utilizzano le funzionalità audio del riconoscimento vocale per determinare l'identità di un bersaglio sono stati oggetto di ricerca. Alcuni esempi di questi coefficienti sono:

    Coefficienti LPC, o codici predittivi lineari

    Coefficienti di predizione lineare e codifica nello spettro cepstrale

    Coefficienti cepstrali basati sulle frequenze mel (MFCC).

    Questi coefficienti vengono derivati da un segnale in banda base elaborato e viene quindi utilizzato un metodo statistico per determinare quale destinazione nel database è più simile ai coefficienti derivati. Il sistema e il caso d'uso devono essere presi in considerazione quando si decide quali funzionalità e schema decisionale implementare.

    Le caratteristiche di classificazione del bersaglio non sono limitate ai coefficienti motivati dal linguaggio umano. L'ATR può essere ottenuto utilizzando numerosi set di funzionalità e vari metodi di rilevamento.

    Lo sviluppo di un database di addestramento è necessario per automatizzare il rilevamento dei target. Tipicamente, l'algoritmo ATR viene alimentato con dati sperimentali raccolti dopo che il bersaglio è stato determinato.

    Il diagramma di flusso rappresenta un tipo di algoritmo di rilevamento. Questa tecnica prende M blocchi di dati, li modella utilizzando un modello di miscela gaussiana e quindi utilizza le caratteristiche estratte (come i coefficienti LPC o MFCC) per trarre conclusioni (GMM). Dopo aver adattato i dati a un modello, le probabilità condizionali vengono calcolate per ogni destinazione nel set di training. In questo caso, abbiamo M blocchi di dati da esaminare. In questo modo verranno generate M probabilità individuali, una per ogni destinazione del database. Utilizzando queste probabilità, viene effettuata una determinazione di massima verosimiglianza su quale sia effettivamente il bersaglio. È stato dimostrato che questa tecnica è in grado di determinare in modo affidabile la presenza di un massimo di tre persone, nonché di distinguere tra i tipi di veicoli (veicoli su ruote o cingolati, ad esempio).

    Un approccio basato sulla CNN per il riconoscimento degli obiettivi

    Il riconoscimento del bersaglio utilizzando una rete neurale convoluzionale (CNN) può superare gli approcci più tradizionali. Dopo l'addestramento su immagini sintetiche, si è dimostrato utile per riconoscere bersagli (come carri armati) in immagini a infrarossi di scene reali. Il grado di realismo delle immagini sintetiche è molto importante quando si tenta di riconoscere scene reali dal set di test a causa dei vincoli del set di addestramento.

    Sette livelli di convoluzione, tre livelli di pooling massimo e un livello Softmax fungono da spina dorsale dell'architettura di rete CNN complessiva. Dopo il secondo, il quarto e il quinto livello di convoluzione ci sono i livelli di pooling massimi. Prima del risultato finale, viene applicata una media globale di pooling. Leaky ReLU viene utilizzato come funzione di attivazione non lineare in tutti gli strati di convoluzione.

    {Fine Capitolo 1}

    Capitolo 2: Visione artificiale

    Lo studio di come i computer possano derivare conoscenze di alto livello da immagini o video digitali è al centro dell'area scientifica multidisciplinare della visione artificiale. Da un punto di vista tecnologico, indaga e tenta di automatizzare le attività che rientrano nelle capacità del sistema visivo umano.

    Le attività associate alla visione artificiale includono tecniche per ottenere, elaborare, analizzare e comprendere immagini digitali, nonché l'estrazione di dati ad alta dimensione dall'ambiente fisico al fine di creare informazioni numeriche o simboliche, come i giudizi.

    La visione artificiale è un sottocampo dell'informatica che indaga le basi teoriche dei sistemi artificiali progettati per derivare informazioni dalle immagini. I dati visivi possono essere presentati in una varietà di formati, tra cui sequenze video, immagini ottenute da diverse telecamere, dati multidimensionali ottenuti da uno scanner 3D o da apparecchiature di scansione medica e così via. L'obiettivo del campo tecnico noto come visione artificiale è quello di implementare le idee e i modelli che ha sviluppato nel processo di costruzione di sistemi di visione artificiale.

    I campi della ricostruzione della scena, del rilevamento di oggetti, del rilevamento di eventi, del tracciamento video, del riconoscimento di oggetti, della stima della posa 3D, dell'apprendimento, dell'indicizzazione, della stima del movimento, dell'asservimento visivo, della modellazione di scene 3D e del ripristino delle immagini sono tutti sottodomini della visione artificiale. Altri sottodomini della visione artificiale includono la modellazione di scene 3D.

    La visione artificiale è uno studio multidisciplinare che esamina il modo in cui i computer possono essere programmati per estrarre conoscenze di alto livello da immagini o filmati digitali. Quest'area si concentra su come insegnare ai computer a comprendere ciò che viene loro mostrato. Dal punto di vista dell'ingegneria, l'obiettivo è trovare il modo di automatizzare le operazioni che possono già essere eseguite dal sistema visivo umano. La visione artificiale è un campo di studio nel campo della tecnologia dell'informazione che si concentra sull'applicazione di teorie e modelli esistenti al processo di costruzione di sistemi di visione artificiale.

    Alla fine degli anni '60, i college che erano all'avanguardia nell'intelligenza artificiale sono stati i primi a sperimentare la visione artificiale. Il suo scopo era quello di funzionare in modo simile a quello del sistema visivo umano, con l'obiettivo finale di infondere nei robot un comportamento intelligente. Negli anni '90, molte delle aree di studio che erano state studiate in precedenza sono diventate più attive delle altre. Lo studio delle ricostruzioni tridimensionali proiettive ha portato a una comprensione più profonda di come calibrare una telecamera. Divenne chiaro, con l'introduzione delle tecniche di ottimizzazione per la calibrazione della fotocamera, che un numero significativo di concetti era stato precedentemente studiato dalla disciplina della teoria della regolazione del fascio della fotogrammetria. Questo è venuto alla luce come risultato di questo sviluppo. Ciò ha portato allo sviluppo di tecniche per la realizzazione di ricostruzioni tridimensionali sparse di scene utilizzando diverse fotografie. Sia il problema della densa corrispondenza stereo che lo sviluppo di ulteriori approcci stereo multi-view hanno visto un certo grado di movimento in avanti. Allo stesso tempo, sono state utilizzate molte varianti di taglio grafico per risolvere il problema della segmentazione dell'immagine. Questo decennio è stato particolarmente significativo in quanto è stata la prima volta che i metodi di apprendimento statistico sono stati utilizzati nella pratica per il compito di riconoscere i volti nelle fotografie (vedi Eigenface). Le aree della computer grafica e della visione artificiale sono diventate più intrecciate negli ultimi anni, il che ha portato a un grande aumento della quantità di collaborazione che ha avuto luogo tra i due. Questo presentava le prime forme di rendering del campo luminoso, lo stitching dell'immagine panoramica, il morphing dell'immagine, l'interpolazione della vista e il rendering basato sull'immagine. L'area della visione artificiale ha ricevuto una nuova prospettiva di vita grazie allo sviluppo di algoritmi basati sul deep learning. L'accuratezza degli algoritmi di deep learning su numerosi set di dati di visione artificiale di riferimento per attività che vanno dalla classificazione al flusso ottico ha superato quella degli approcci precedenti. Queste attività includono la segmentazione delle immagini e il flusso ottico.

    La visione artificiale a stato solido è fortemente connessa a una serie di altre discipline, tra cui la fisica. La stragrande maggioranza dei sistemi di visione artificiale si basa su sensori di immagine, che sono dispositivi in grado di rilevare le radiazioni elettromagnetiche. Questa radiazione si manifesta comunemente come luce visibile o infrarossa. La fisica quantistica è stata utilizzata nello sviluppo dei sensori. La disciplina scientifica della fisica fornisce una spiegazione per il metodo attraverso il quale la luce interagisce con le superfici. Il comportamento dell'ottica, che è una componente fondamentale della maggior parte dei sistemi di imaging, può essere spiegato dalla fisica. Al fine di offrire una conoscenza completa del processo attraverso il quale si forma un'immagine, sofisticati sensori di immagine hanno bisogno dell'uso della meccanica quantistica. La visione artificiale può anche essere utilizzata per risolvere una varietà di problemi di misurazione che sorgono in fisica, come quelli che coinvolgono il movimento dei fluidi.

    La disciplina scientifica della neurobiologia, in particolare lo studio del sistema visivo biologico. Gli occhi, i neuroni e le regioni del cervello che sono dedicati all'elaborazione degli input visivi sia negli esseri umani che in diversi animali sono stati oggetto di una notevole quantità di ricerche nel corso dell'ultimo secolo. Di conseguenza, è emersa una descrizione semplice ma complessa del modo in cui funzionano i sistemi di visione reali per completare vari compiti relativi alla visione. Come conseguenza

    Ti è piaciuta l'anteprima?
    Pagina 1 di 1