Campo di movimento: Esplorando le dinamiche della visione artificiale: svelato il campo del movimento
Di Fouad Sabry
()
Info su questo ebook
Cos'è il campo di movimento
Nella visione artificiale, il campo di movimento è una rappresentazione ideale del movimento nello spazio tridimensionale (3D) così come viene proiettato sull'immagine di una telecamera . Dato un modello di fotocamera semplificato, ogni punto nell'immagine è presente la proiezione di un punto della scena 3D ma la posizione della proiezione di un punto fisso nello spazio può variare nel tempo. Il campo di movimento può essere formalmente definito come la derivata temporale della posizione dell'immagine di tutti i punti dell'immagine dato che corrispondono a punti 3D fissi. Ciò significa che il campo di movimento può essere rappresentato come una funzione che mappa le coordinate dell'immagine su un vettore bidimensionale. Il campo di movimento è una descrizione ideale del movimento 3D proiettato, nel senso che può essere definito formalmente, ma in pratica è normalmente possibile determinare solo un'approssimazione del campo di movimento dai dati dell'immagine.
Come trarrai vantaggio
(I) Approfondimenti e convalide sui seguenti argomenti:
Capitolo 1: Campo di movimento
Capitolo 2 : Regola della catena
Capitolo 3: Curl (matematica)
Capitolo 4: Sistema di coordinate polari
Capitolo 5: Teorema di Green
Capitolo 6: Elemento linea
Capitolo 7: Matrice della fotocamera
Capitolo 8: Modello della fotocamera stenopeica
Capitolo 9: Derivazione delle equazioni di Navier-Stokes
Capitolo 10: Meccanica lagrangiana relativistica
(II) Rispondere alle principali domande del pubblico sul campo di movimento.
(III) Esempi reali per l'utilizzo del campo di movimento in molti campi .
A chi è rivolto questo libro
Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di campo di movimento.
Correlato a Campo di movimento
Titoli di questa serie (100)
Istogramma dell'immagine: Svelare intuizioni visive, esplorare le profondità degli istogrammi delle immagini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRiduzione del rumore: Miglioramento della chiarezza, tecniche avanzate per la riduzione del rumore nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCorrezione gamma: Migliorare la chiarezza visiva nella visione artificiale: la tecnica di correzione gamma Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniModello del sistema visivo umano: Comprendere la percezione e l'elaborazione Valutazione: 0 su 5 stelle0 valutazioniSpazio colore: Esplorare lo spettro della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRetinex: Svelare i segreti della visione computazionale con Retinex Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRidipintura: Colmare le lacune nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDiffusione anisotropa: Miglioramento dell'analisi delle immagini attraverso la diffusione anisotropa Valutazione: 0 su 5 stelle0 valutazioniVisione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniContorno attivo: Avanzamento della visione artificiale con tecniche di contorno attivo Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento dei contorni: Svelare l'arte della percezione visiva nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniPercezione visiva: Approfondimenti sull'elaborazione visiva computazionale Valutazione: 0 su 5 stelle0 valutazioniFiltro adattivo: Migliorare la visione artificiale attraverso il filtraggio adattivo Valutazione: 0 su 5 stelle0 valutazioniGruppo congiunto di esperti fotografici: Sfruttare la potenza dei dati visivi con lo standard JPEG Valutazione: 0 su 5 stelle0 valutazioniEqualizzazione dell'istogramma: Miglioramento del contrasto dell'immagine per una migliore percezione visiva Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniTrasformazione affine: Sbloccare le prospettive visive: esplorare la trasformazione affine nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniBanca filtri: Approfondimenti sulle tecniche del banco di filtri di Computer Vision Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto del colore: Comprendere la percezione e la rappresentazione nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFunzione di corrispondenza dei colori: Comprendere la sensibilità spettrale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata di Hadamard: Svelare il potere della trasformazione Hadamard nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello a colori: Comprendere lo spettro della visione artificiale: esplorare i modelli di colore Valutazione: 0 su 5 stelle0 valutazioniConsenso del campione casuale: Stima robusta nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniHashing geometrico: Algoritmi efficienti per il riconoscimento e la corrispondenza delle immagini Valutazione: 0 su 5 stelle0 valutazioni
Ebook correlati
Stima del movimento: Progressi e applicazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFlusso ottico: Esplorazione di modelli visivi dinamici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello di fotocamera stenopeica: Comprendere la prospettiva attraverso l'ottica computazionale Valutazione: 0 su 5 stelle0 valutazioniSuperficie procedurale: Esplorazione della generazione e dell'analisi delle texture nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMetodo di impostazione del livello: Avanzamento della visione artificiale, esplorazione del metodo dell'impostazione dei livelli Valutazione: 0 su 5 stelle0 valutazioniGrafica di ray-tracing: Esplorazione del rendering fotorealistico nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRegolazione del pacchetto: Ottimizzazione dei dati visivi per una ricostruzione precisa Valutazione: 0 su 5 stelle0 valutazioniStima della posa del corpo articolato: Sbloccare il movimento umano nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisualizza la sintesi: Esplorare le prospettive nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniRilevamento dei bordi: Esplorare i confini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto attivo: Sbloccare la potenza dei modelli di aspetto attivo nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniComputer grafica della radiosità: Avanzamento della visualizzazione attraverso la radiosità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModello di riflessione di Phong: Comprendere le interazioni della luce nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniModellazione e rendering basati su immagini: Esplorare il realismo visivo: tecniche di visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCorrelazione incrociata: Sbloccare i modelli nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniComputer grafica bidimensionale: Esplorazione del regno visivo: computer grafica bidimensionale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniContorno attivo: Avanzamento della visione artificiale con tecniche di contorno attivo Valutazione: 0 su 5 stelle0 valutazioniGeometria Epipolare: Sbloccare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMosaicazione di documenti: Sbloccare intuizioni visive attraverso il mosaico di documenti Valutazione: 0 su 5 stelle0 valutazioniIlluminazione globale: Visione avanzata: approfondimenti sull'illuminazione globale Valutazione: 0 su 5 stelle0 valutazioniScala dello spazio: Esplorare le dimensioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione lineare diretta: Applicazioni pratiche e tecniche nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniLe 10 equazioni più belle della Fisica Valutazione: 0 su 5 stelle0 valutazioniTensore trifocale: Esplorare la profondità, il movimento e la struttura nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioni
Intelligenza artificiale e semantica per voi
ANonniMus: Vecchi rivoluzionari contro giovani robot Valutazione: 0 su 5 stelle0 valutazioniGuida Intelligenza Artificiale Valutazione: 0 su 5 stelle0 valutazioniIl Terzo Like Valutazione: 0 su 5 stelle0 valutazioni
Recensioni su Campo di movimento
0 valutazioni0 recensioni
Anteprima del libro
Campo di movimento - Fouad Sabry
Capitolo 1: Campo di movimento
Il campo di movimento è la proiezione perfetta del movimento 3D sull'immagine di una telecamera ed è ampiamente utilizzato nella visione artificiale.
Supponendo un modello di fotocamera minimamente complesso, ogni punto (y_{{1}},y_{{2}}) dell'immagine è la proiezione di un punto nella scena 3D, ma la posizione della proiezione di un punto fisso nello spazio può variare nel tempo.
Dato che tutti i punti dell'immagine corrispondono a coordinate 3D fisse, il campo di movimento può essere formalmente definito come la derivata temporale della posizione dell'immagine di tutti i punti dell'immagine.
Il campo di movimento può quindi essere espresso come una funzione che trasforma le coordinate dell'immagine in un vettore bidimensionale.
Formalmente parlando, il campo di movimento è la descrizione perfetta del movimento 3D proiettato, ma in pratica di solito è possibile stimare il campo di movimento solo dai dati dell'immagine.
Un modello di camera mappa ogni punto (x_{{1}},x_{{2}},x_{{3}}) nello spazio 3D in un punto dell'immagine 2D (y_{{1}},y_{{2}}) in base ad alcune funzioni di mappatura {\displaystyle m_{1},m_{2}} :
{\displaystyle {\begin{pmatrix}y_{1}\\y_{2}\end{pmatrix}}={\begin{pmatrix}m_{1}(x_{1},x_{2},x_{3})\\m_{2}(x_{1},x_{2},x_{3})\end{pmatrix}}}Per una scena dinamica, in cui gli oggetti sono in movimento l'uno rispetto all'altro, in cui gli oggetti subiscono una deformazione e in cui la fotocamera stessa è in movimento rispetto alla scena, un punto fisso nello spazio 3D viene mappato in diversi punti dell'immagine. Il risultato della differenziazione temporale dell'espressione precedente è
{\displaystyle {\begin{pmatrix}{\frac {dy_{1}}{dt}}\\[2mm]{\frac {dy_{2}}{dt}}\end{pmatrix}}={\begin{pmatrix}{\frac {dm_{1}(x_{1},x_{2},x_{3})}{dt}}\\[2mm]{\frac {dm_{2}(x_{1},x_{2},x_{3})}{dt}}\end{pmatrix}}={\begin{pmatrix}{\frac {dm_{1}}{dx_{1}}}&{\frac {dm_{1}}{dx_{2}}}&{\frac {dm_{1}}{dx_{3}}}\\[2mm]{\frac {dm_{2}}{dx_{1}}}&{\frac {dm_{2}}{dx_{2}}}&{\frac {dm_{2}}{dx_{3}}}\end{pmatrix}}\,{\begin{pmatrix}{\frac {dx_{1}}{dt}}\\[2mm]{\frac {dx_{2}}{dt}}\\[2mm]{\frac {dx_{3}}{dt}}\end{pmatrix}}}Qui
{\displaystyle \mathbf {u} ={\begin{pmatrix}{\frac {dy_{1}}{dt}}\\[2mm]{\frac {dy_{2}}{dt}}\end{pmatrix}}}è il campo di moto e il vettore u dipende sia dalla posizione dell'immagine che (y_{{1}},y_{{2}}) dal tempo t.
Similmente {\displaystyle \mathbf {x'} ={\begin{pmatrix}{\frac {dx_{1}}{dt}}\\[2mm]{\frac {dx_{2}}{dt}}\\[2mm]{\frac {dx_{3}}{dt}}\end{pmatrix}}}
rappresenta il movimento del punto 3D in relazione al campo di movimento, e
{\displaystyle \mathbf {u} =\mathbf {M} \,\mathbf {x} '}dove {\mathbf {M}} è la matrice dipendente dalla posizione dell'immagine 2\times 3
{\displaystyle \mathbf {M} ={\begin{pmatrix}{\frac {dm_{1}}{dx_{1}}}&{\frac {dm_{1}}{dx_{2}}}&{\frac {dm_{1}}{dx_{3}}}\\[2mm]{\frac {dm_{2}}{dx_{1}}}&{\frac {dm_{2}}{dx_{2}}}&{\frac {dm_{2}}{dx_{3}}}\end{pmatrix}}}In base a questa connessione, il campo di movimento, in una posizione fissa nell'immagine, è invariante ai moti 3D che giace nello spazio nullo di {\mathbf {M}} .
Ad esempio, tutti i componenti di movimento nello spazio 3D che sono perpendicolari al punto focale della videocamera non verranno rilevati da una videocamera stenopeica.
Il campo di movimento \mathbf {v} è definito come:
{\displaystyle \mathbf {v} =f{\frac {Z\mathbf {V} -V_{z}\mathbf {P} }{Z^{2}}}}dove
{\displaystyle \mathbf {V} =-\mathbf {T} -\mathbf {\omega } \times \mathbf {P} } .
dove
\mathbf {P} è un punto della scena in cui Z è la distanza da quel punto della scena.
\mathbf {V} è il movimento relativo tra la telecamera e la scena, \mathbf {T} è la componente traslazionale del movimento, e
\mathbf {\omega } è la velocità angolare del moto.
Come spiegato in precedenza, il campo di movimento è una creazione teorica basata sul presupposto che la direzione del movimento per ogni pixel di un'immagine possa essere determinata. Tuttavia, in realtà, le misurazioni sui dati dell'immagine possono servire solo come approssimazione del campo di movimento sottostante. Il problema è che, nella maggior parte dei casi, la mobilità di ogni punto dell'immagine è unica e deve essere valutata localmente utilizzando una sorta di operazione di vicinato sui dati dell'immagine. Pertanto, per alcuni tipi di quartieri, un'approssimazione, generalmente indicata come flusso ottico, deve essere utilizzata al posto del vero campo di moto. Un quartiere con un'intensità costante, ad esempio, può corrispondere a un campo di moto che non è zero, ma il flusso ottico in tale regione sarebbe zero perché nessun movimento locale dell'immagine sarebbe misurabile. Allo stesso modo, il flusso ottico può registrare solo la componente normale di un campo di movimento, anche se un intorno che è intrinsecamente unidimensionale (come un bordo o una linea) può corrispondere a qualsiasi campo di movimento. Il rumore dell'immagine, l'occlusione 3D e l'aliasing temporale sono tutti fattori che sorgono naturalmente in qualsiasi tecnica di misurazione del flusso ottico e portano a discrepanze tra i campi di movimento misurati e quelli effettivi.
Per riassumere, il campo di movimento è un'approssimazione del flusso ottico perché è impossibile misurare con precisione il campo di movimento per tutte le posizioni dell'immagine. Il flusso ottico può essere calcolato in diversi modi, ognuno dei quali tiene conto di una serie unica di criteri per determinare l'accuratezza di una stima ottica.
{Fine Capitolo 1}
Capitolo 2: Regola della catena
In matematica, la regola della catena è un'espressione matematica che può essere utilizzata per definire la derivata della combinazione di due funzioni differenziabili, f e g, in termini di derivate di f e g.
Più precisamente, se {\displaystyle h=f\circ g} è la funzione tale che {\displaystyle h(x)=f(g(x))} per ogni x, se questo è il caso, la regola della catena è, usando la notazione di Lagrange, {\displaystyle h'(x)=f'(g(x))g'(x).}
o, equivalentemente,
{\displaystyle h'=(f\circ g)'=(f'\circ g)\cdot g'.}La regola della catena può anche essere enunciata usando la notazione usata da Leibniz. Se una variabile, z, dipende da un'altra variabile, y, ed entrambe le variabili dipendono da una terza variabile, x (cioè, y e z sono variabili dipendenti), allora anche z dipende da x tramite l'uso della variabile y come intermediario. In questo caso particolare, la regola della catena è indicata come
{\displaystyle {\frac {dz}{dx}}={\frac {dz}{dy}}\cdot {\frac {dy}{dx}},}e
{\displaystyle \left.{\frac {dz}{dx}}\right|_{x}=\left.{\frac {dz}{dy}}\right|_{y(x)}\cdot \left.{\frac {dy}{dx}}\right|_{x},}allo scopo di segnalare in quali punti i derivati devono essere valutati.
Quando si tratta di integrazione, la regola di sostituzione è quella che corrisponde alla regola della catena.
Intuitivamente, la regola della catena afferma che se si conosce il tasso istantaneo di variazione di z rispetto a y e quello di y rispetto a x, allora si è in grado di calcolare il tasso di variazione istantaneo di z rispetto a x come prodotto dei due tassi di variazione. Se si conosce il tasso istantaneo di variazione di z rispetto a x, allora si è in grado di calcolare il tasso istantaneo di variazione di z relativo.
Nelle parole di George F.
Se un veicolo può muoversi due volte più velocemente di una bicicletta, e una bicicletta può viaggiare quattro volte più velocemente di una persona che cammina, allora Simmons dice questo: allora l'auto viaggia 2 × 4 = 8 volte più veloce dell'uomo.
Di seguito viene descritta la connessione tra questa particolare illustrazione e la regola della catena:.
Siano z, y e x le posizioni (variabili) dell'auto, della bicicletta e del ragazzo che stava camminando, rispettivamente.
Il tasso di cambiamento delle posizioni relative dell'auto e della bicicletta è {\textstyle {\frac {dz}{dy}}=2.} Allo stesso modo, {\textstyle {\frac {dy}{dx}}=4.} quindi, il ritmo con cui cambiano le posizioni relative dell'automobile e del ragazzo che cammina è
{\displaystyle {\frac {dz}{dx}}={\frac {dz}{dy}}\cdot {\frac {dy}{dx}}=2\cdot 4=8.}Il tasso di variazione della posizione è uguale al rapporto delle velocità, e la velocità è calcolata prendendo la derivata della posizione rispetto al tempo; Ciò significa che il tasso di variazione della posizione è pari a 1, {\displaystyle {\frac {dz}{dx}}={\frac {\frac {dz}{dt}}{\frac {dx}{dt}}},}
o, equivalentemente, {\displaystyle {\frac {dz}{dt}}={\frac {dz}{dx}}\cdot {\frac {dx}{dt}},}
Di seguito è