Stima del movimento: Progressi e applicazioni nella visione artificiale
Di Fouad Sabry
()
Info su questo ebook
What is Motion Estimation
In computer vision and image processing, motion estimation is the process of determining motion vectors that describe the transformation from one 2D image to another; usually from adjacent frames in a video sequence. It is an ill-posed problem as the motion happens in three dimensions (3D) but the images are a projection of the 3D scene onto a 2D plane. The motion vectors may relate to the whole image or specific parts, such as rectangular blocks, arbitrary shaped patches or even per pixel. The motion vectors may be represented by a translational model or many other models that can approximate the motion of a real video camera, such as rotation and translation in all three dimensions and zoom.
How you will benefit
(I) Insights, and validations about the following topics:
Chapter 1: Motion_estimation
Chapter 2: Motion_compensation
Chapter 3: Block-matching_algorithm
Chapter 4: H.261
Chapter 5: H.262/MPEG-2_Part_2
Chapter 6: Advanced_Video_Coding
Chapter 7: Global_motion_compensation
Chapter 8: Block-matching_and_3D_filtering
Chapter 9: Video_compression_picture_types
Chapter 10: Video_super-resolution
(II) Answering the public top questions about motion estimation.
(III) Real world examples for the usage of motion estimation in many fields.
Who this book is for
Professionals, undergraduate and graduate students, enthusiasts, hobbyists, and those who want to go beyond basic knowledge or information for any kind of Motion Estimation.
Correlato a Stima del movimento
Titoli di questa serie (100)
Istogramma dell'immagine: Svelare intuizioni visive, esplorare le profondità degli istogrammi delle immagini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRiduzione del rumore: Miglioramento della chiarezza, tecniche avanzate per la riduzione del rumore nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCorrezione gamma: Migliorare la chiarezza visiva nella visione artificiale: la tecnica di correzione gamma Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniModello del sistema visivo umano: Comprendere la percezione e l'elaborazione Valutazione: 0 su 5 stelle0 valutazioniSpazio colore: Esplorare lo spettro della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRetinex: Svelare i segreti della visione computazionale con Retinex Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRidipintura: Colmare le lacune nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDiffusione anisotropa: Miglioramento dell'analisi delle immagini attraverso la diffusione anisotropa Valutazione: 0 su 5 stelle0 valutazioniVisione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniContorno attivo: Avanzamento della visione artificiale con tecniche di contorno attivo Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento dei contorni: Svelare l'arte della percezione visiva nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniPercezione visiva: Approfondimenti sull'elaborazione visiva computazionale Valutazione: 0 su 5 stelle0 valutazioniFiltro adattivo: Migliorare la visione artificiale attraverso il filtraggio adattivo Valutazione: 0 su 5 stelle0 valutazioniGruppo congiunto di esperti fotografici: Sfruttare la potenza dei dati visivi con lo standard JPEG Valutazione: 0 su 5 stelle0 valutazioniEqualizzazione dell'istogramma: Miglioramento del contrasto dell'immagine per una migliore percezione visiva Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniTrasformazione affine: Sbloccare le prospettive visive: esplorare la trasformazione affine nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniBanca filtri: Approfondimenti sulle tecniche del banco di filtri di Computer Vision Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto del colore: Comprendere la percezione e la rappresentazione nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFunzione di corrispondenza dei colori: Comprendere la sensibilità spettrale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata di Hadamard: Svelare il potere della trasformazione Hadamard nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello a colori: Comprendere lo spettro della visione artificiale: esplorare i modelli di colore Valutazione: 0 su 5 stelle0 valutazioniConsenso del campione casuale: Stima robusta nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniHashing geometrico: Algoritmi efficienti per il riconoscimento e la corrispondenza delle immagini Valutazione: 0 su 5 stelle0 valutazioni
Ebook correlati
Flusso ottico: Esplorazione di modelli visivi dinamici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisualizza la sintesi: Esplorare le prospettive nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto attivo: Sbloccare la potenza dei modelli di aspetto attivo nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCampo di movimento: Esplorando le dinamiche della visione artificiale: svelato il campo del movimento Valutazione: 0 su 5 stelle0 valutazioniSegmentazione delle immagini: Sbloccare insight grazie alla precisione dei pixel Valutazione: 0 su 5 stelle0 valutazioniIlluminazione globale: Visione avanzata: approfondimenti sull'illuminazione globale Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTagli del grafico di visione artificiale: Esplorazione dei tagli grafici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGrafica di ray-tracing: Esplorazione del rendering fotorealistico nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRegolazione del pacchetto: Ottimizzazione dei dati visivi per una ricostruzione precisa Valutazione: 0 su 5 stelle0 valutazioniRendering volumetrico: Esplorare il realismo visivo nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModellazione e rendering basati su immagini: Esplorare il realismo visivo: tecniche di visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMosaicazione di documenti: Sbloccare intuizioni visive attraverso il mosaico di documenti Valutazione: 0 su 5 stelle0 valutazioniMappatura dei colori: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniElaborazione delle immagini piramidali: Esplorare le profondità dell'analisi visiva Valutazione: 0 su 5 stelle0 valutazioniStima della posa del corpo articolato: Sbloccare il movimento umano nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRendering di grafica computerizzata: Esplorare il realismo visivo: approfondimenti sulla computer grafica Valutazione: 0 su 5 stelle0 valutazioniClassificazione delle immagini contestuali: Comprendere i dati visivi per una classificazione efficace Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale: Approfondimenti sul mondo della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCompressione delle immagini: Tecniche efficienti per l'ottimizzazione dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniSuperficie procedurale: Esplorazione della generazione e dell'analisi delle texture nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniEditor di grafica vettoriale: Potenziare la creazione visiva con algoritmi avanzati Valutazione: 0 su 5 stelle0 valutazioniShader: Esplorare i regni visivi con Shader: un viaggio nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGrafica raster digitale: Svelare la potenza della grafica raster digitale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniEditor di grafica raster: Trasformare le realtà visive: padroneggiare gli editor grafici raster nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFotografia digitale con smartphone: Guida per scattare foto migliori in modalità manuale Valutazione: 0 su 5 stelle0 valutazioniNebbia a distanza: Esplorare la frontiera visiva: approfondimenti sulla nebbia a distanza della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniComputer grafica poligonale: Esplorando l'intersezione tra la computer grafica poligonale e la visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRendering della scansione: Esplorare il realismo visivo attraverso le tecniche di rendering della scansione Valutazione: 0 su 5 stelle0 valutazioni
Intelligenza artificiale e semantica per voi
ANonniMus: Vecchi rivoluzionari contro giovani robot Valutazione: 0 su 5 stelle0 valutazioniGuida Intelligenza Artificiale Valutazione: 0 su 5 stelle0 valutazioniIl Terzo Like Valutazione: 0 su 5 stelle0 valutazioni
Recensioni su Stima del movimento
0 valutazioni0 recensioni
Anteprima del libro
Stima del movimento - Fouad Sabry
Capitolo 1: Stima del movimento
La stima della quantità di movimento tra due immagini 2D, in genere da fotogrammi successivi in una sequenza video, è nota come stima del movimento. Il movimento avviene in tre dimensioni, ma le immagini sono proiezioni della scena tridimensionale su un piano bidimensionale, il che rende questo un problema mal posto. La stima del movimento può essere eseguita sull'intera immagine (stima globale del movimento) o su regioni più piccole o singoli pixel. Il modello traslazionale è solo uno dei tanti che possono essere utilizzati per rappresentare i vettori di movimento, che possono includere elementi come la rotazione, la traslazione in tutte e tre le dimensioni e lo zoom avanti e indietro.
La stima del movimento e il flusso ottico sono spesso usati in modo intercambiabile, ma significano la stessa cosa. Anche la registrazione dell'immagine e la corrispondenza stereo sono correlate in questo modo. In realtà, ognuna di queste espressioni descrive un metodo per individuare le caratteristiche corrispondenti in foto fisse o fotogrammi video successivi. I punti in due fotografie (fotogrammi) della stessa scena o oggetto del mondo reale sono tipicamente
lo stesso punto nello spazio e nel tempo. La metrica corrispondente, una misura di quanto sono simili due punti dell'immagine, deve essere definita prima di poter iniziare la stima del movimento. Non c'è una risposta universalmente corretta qui; Piuttosto, la metrica di corrispondenza ottimale dipenderà dallo scopo del movimento stimato e dall'approccio di ottimizzazione utilizzato durante la fase di stima.
In base alla posizione dello stesso macroblocco o di un macroblocco comparabile in un'immagine diversa, nota come immagine di riferimento, viene creato un vettore di movimento per rappresentare il macroblocco in questione nell'immagine originale.
Secondo lo standard H.264/MPEG-4 AVC, il vettore di movimento è definito come:
Le coordinate dell'immagine decodificata sono sfalsate rispetto alle coordinate dell'immagine di riferimento tramite un vettore bidimensionale chiamato vettore di movimento, che viene utilizzato per la previsione inter.
Sia l'approccio basato su pixel (diretto
) che quello basato su feature (indiretto
) possono essere utilizzati per individuare i vettori di movimento (indiretti
). Due documenti, uno per ogni lato di una controversia ben nota, sono stati scritti nel tentativo di raggiungere una soluzione.
Algoritmo per l'abbinamento dei blocchi
Tecniche basate sulla correlazione di fase e sul dominio della frequenza
Algoritmi ricorsivi di pixel
Flusso ottico
Le tecniche indirette impiegano funzionalità come il rilevamento degli angoli per trovare corrispondenze in fotogrammi adiacenti, in genere mediante l'applicazione di una funzione statistica su una regione piccola o grande. L'obiettivo della funzione statistica è quello di filtrare le corrispondenze di movimento errate.
RANSAC è un esempio di utile funzione statistica.
Si potrebbe obiettare che la definizione dei criteri di corrispondenza è un passo necessario praticamente in qualsiasi approccio. L'unica vera distinzione è tra il confronto di ogni pixel (come con il quadrato della differenza) e poi il riepilogo su una regione locale dell'immagine (come con gli approcci basati sulle caratteristiche) o viceversa (movimento di base del blocco e movimento basato sul filtro). Un nuovo metodo di corrispondenza dei criteri funziona riassumendo prima un'area locale dell'immagine in ogni posizione del pixel (usando una trasformazione di feature come la trasformazione laplaciana), quindi confrontando i due set di riepiloghi. Mentre alcuni criteri di corrispondenza possono eliminare coppie di elementi di dati che non appartengono realmente insieme pur avendo un punteggio di corrispondenza elevato, altri criteri di corrispondenza non possono.
Nella visione artificiale e nell'elaborazione delle immagini, la stima del movimento affine viene utilizzata per calcolare un'approssimazione approssimativa del movimento relativo di due immagini o fotogrammi. Presuppone che il movimento possa essere rappresentato da una trasformazione lineare seguita da una traslazione e rotazione (trasformazione affine).
La compensazione del movimento è il processo di utilizzo dei vettori di movimento di un'immagine per generare una nuova trasformazione.
La stima e la compensazione del movimento sono componenti essenziali della compressione video perché consentono l'uso della ridondanza temporale. Quasi tutti gli standard di codifica video, incluso il più recente HEVC, utilizzano la stima e la compensazione del movimento basate su blocchi.
La ricostruzione della geometria 3D di una scena a partire da immagini di telecamere in movimento è l'obiettivo della localizzazione e della mappatura simultanee.
{Fine Capitolo 1}
Capitolo 2: Compensazione del movimento
Quando si prevede il fotogramma successivo di un video in base ai fotogrammi precedenti e successivi, la compensazione del movimento è una tecnica algoritmica utilizzata per tenere conto del movimento della fotocamera e/o dell'oggetto. Viene utilizzato per creare file MPEG-2 e altri formati di compressione video attraverso la codifica dei dati video. Utilizzando la trasformazione da un'immagine di riferimento all'immagine corrente, la compensazione del movimento fornisce una descrizione dell'immagine. Il periodo temporale dell'immagine a cui si fa riferimento non è limitato. L'efficienza di compressione è migliorata quando è possibile sintetizzare nuove immagini da quelle vecchie con elevata precisione.
Negli standard di codifica video, la compensazione del movimento e la trasformata discreta del coseno sono le due tecniche di compressione video (DCT) più importanti. La compensazione del movimento a blocchi (BMC) o la codifica ibrida DCT con compensazione del movimento (MC-DCT) è comunemente utilizzata nella maggior parte degli standard di codifica video, come i formati H.26x e MPEG (MC DCT).
La correzione del movimento sfrutta il fatto che la fotocamera o un oggetto nel fotogramma che cambia posizione è spesso l'unica differenza tra i fotogrammi successivi di un filmato. Ciò significa che è molto probabile che i dati utilizzati per rappresentare un fotogramma in un clip video siano identici ai dati utilizzati per rappresentare il fotogramma successivo.
Quando si utilizza la compensazione del movimento, un flusso video avrà alcuni fotogrammi completi (di riferimento) e i fotogrammi rimanenti conterranno solo i dati necessari per trasformarli in uno nell'altro.
Di seguito è riportata una descrizione grafica semplificata del funzionamento della compensazione del movimento. Sono state scattate due fotogrammi consecutivi dal film Elephants Dream. Poiché include meno informazioni, la differenza inferiore (compensata dal movimento) tra due fotogrammi si comprime molto meglio delle altre immagini. Pertanto, i dati necessari per codificare un frame compensato saranno significativamente inferiori a quelli necessari per codificare un frame di differenza. Ciò significa anche che è anche possibile codificare le informazioni utilizzando l'immagine della differenza al costo di una minore efficienza di compressione, ma risparmiando complessità di codifica senza codifica compensata dal movimento; È un dato di fatto che la codifica compensata dal movimento (insieme alla stima del movimento, alla compensazione del movimento) occupa oltre il 90% della complessità della codifica.
Le immagini in MPEG sono anticipate all'indietro rispetto ai fotogrammi precedenti (fotogrammi P) o in avanti rispetto