Scopri milioni di eBook, audiolibri e tanto altro ancora con una prova gratuita

Solo $11.99/mese al termine del periodo di prova. Cancella quando vuoi.

Campo di movimento: Esplorando le dinamiche della visione artificiale: svelato il campo del movimento
Campo di movimento: Esplorando le dinamiche della visione artificiale: svelato il campo del movimento
Campo di movimento: Esplorando le dinamiche della visione artificiale: svelato il campo del movimento
E-book143 pagine1 ora

Campo di movimento: Esplorando le dinamiche della visione artificiale: svelato il campo del movimento

Valutazione: 0 su 5 stelle

()

Leggi anteprima

Info su questo ebook

Cos'è il campo di movimento


Nella visione artificiale, il campo di movimento è una rappresentazione ideale del movimento nello spazio tridimensionale (3D) così come viene proiettato sull'immagine di una telecamera . Dato un modello di fotocamera semplificato, ogni punto  nell'immagine è presente la proiezione di un punto della scena 3D ma la posizione della proiezione di un punto fisso nello spazio può variare nel tempo. Il campo di movimento può essere formalmente definito come la derivata temporale della posizione dell'immagine di tutti i punti dell'immagine dato che corrispondono a punti 3D fissi. Ciò significa che il campo di movimento può essere rappresentato come una funzione che mappa le coordinate dell'immagine su un vettore bidimensionale. Il campo di movimento è una descrizione ideale del movimento 3D proiettato, nel senso che può essere definito formalmente, ma in pratica è normalmente possibile determinare solo un'approssimazione del campo di movimento dai dati dell'immagine.


Come trarrai vantaggio


(I) Approfondimenti e convalide sui seguenti argomenti:


Capitolo 1: Campo di movimento


Capitolo 2 : Regola della catena


Capitolo 3: Curl (matematica)


Capitolo 4: Sistema di coordinate polari


Capitolo 5: Teorema di Green


Capitolo 6: Elemento linea


Capitolo 7: Matrice della fotocamera


Capitolo 8: Modello della fotocamera stenopeica


Capitolo 9: Derivazione delle equazioni di Navier-Stokes


Capitolo 10: Meccanica lagrangiana relativistica


(II) Rispondere alle principali domande del pubblico sul campo di movimento.


(III) Esempi reali per l'utilizzo del campo di movimento in molti campi .


A chi è rivolto questo libro


Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di campo di movimento.


 


 

LinguaItaliano
Data di uscita12 mag 2024
Campo di movimento: Esplorando le dinamiche della visione artificiale: svelato il campo del movimento

Correlato a Campo di movimento

Titoli di questa serie (100)

Visualizza altri

Ebook correlati

Intelligenza artificiale e semantica per voi

Visualizza altri

Articoli correlati

Recensioni su Campo di movimento

Valutazione: 0 su 5 stelle
0 valutazioni

0 valutazioni0 recensioni

Cosa ne pensi?

Tocca per valutare

La recensione deve contenere almeno 10 parole

    Anteprima del libro

    Campo di movimento - Fouad Sabry

    Capitolo 1: Campo di movimento

    Il campo di movimento è la proiezione perfetta del movimento 3D sull'immagine di una telecamera ed è ampiamente utilizzato nella visione artificiale.

    Supponendo un modello di fotocamera minimamente complesso, ogni punto (y_{{1}},y_{{2}}) dell'immagine è la proiezione di un punto nella scena 3D, ma la posizione della proiezione di un punto fisso nello spazio può variare nel tempo.

    Dato che tutti i punti dell'immagine corrispondono a coordinate 3D fisse, il campo di movimento può essere formalmente definito come la derivata temporale della posizione dell'immagine di tutti i punti dell'immagine.

    Il campo di movimento può quindi essere espresso come una funzione che trasforma le coordinate dell'immagine in un vettore bidimensionale.

    Formalmente parlando, il campo di movimento è la descrizione perfetta del movimento 3D proiettato, ma in pratica di solito è possibile stimare il campo di movimento solo dai dati dell'immagine.

    Un modello di camera mappa ogni punto (x_{{1}},x_{{2}},x_{{3}}) nello spazio 3D in un punto dell'immagine 2D (y_{{1}},y_{{2}}) in base ad alcune funzioni di mappatura {\displaystyle m_{1},m_{2}} :

    {\displaystyle {\begin{pmatrix}y_{1}\\y_{2}\end{pmatrix}}={\begin{pmatrix}m_{1}(x_{1},x_{2},x_{3})\\m_{2}(x_{1},x_{2},x_{3})\end{pmatrix}}}

    Per una scena dinamica, in cui gli oggetti sono in movimento l'uno rispetto all'altro, in cui gli oggetti subiscono una deformazione e in cui la fotocamera stessa è in movimento rispetto alla scena, un punto fisso nello spazio 3D viene mappato in diversi punti dell'immagine. Il risultato della differenziazione temporale dell'espressione precedente è

    {\displaystyle {\begin{pmatrix}{\frac {dy_{1}}{dt}}\\[2mm]{\frac {dy_{2}}{dt}}\end{pmatrix}}={\begin{pmatrix}{\frac {dm_{1}(x_{1},x_{2},x_{3})}{dt}}\\[2mm]{\frac {dm_{2}(x_{1},x_{2},x_{3})}{dt}}\end{pmatrix}}={\begin{pmatrix}{\frac {dm_{1}}{dx_{1}}}&{\frac {dm_{1}}{dx_{2}}}&{\frac {dm_{1}}{dx_{3}}}\\[2mm]{\frac {dm_{2}}{dx_{1}}}&{\frac {dm_{2}}{dx_{2}}}&{\frac {dm_{2}}{dx_{3}}}\end{pmatrix}}\,{\begin{pmatrix}{\frac {dx_{1}}{dt}}\\[2mm]{\frac {dx_{2}}{dt}}\\[2mm]{\frac {dx_{3}}{dt}}\end{pmatrix}}}

    Qui

    {\displaystyle \mathbf {u} ={\begin{pmatrix}{\frac {dy_{1}}{dt}}\\[2mm]{\frac {dy_{2}}{dt}}\end{pmatrix}}}

    è il campo di moto e il vettore u dipende sia dalla posizione dell'immagine che (y_{{1}},y_{{2}}) dal tempo t.

    Similmente {\displaystyle \mathbf {x'} ={\begin{pmatrix}{\frac {dx_{1}}{dt}}\\[2mm]{\frac {dx_{2}}{dt}}\\[2mm]{\frac {dx_{3}}{dt}}\end{pmatrix}}}

    rappresenta il movimento del punto 3D in relazione al campo di movimento, e

    {\displaystyle \mathbf {u} =\mathbf {M} \,\mathbf {x} '}

    dove {\mathbf {M}} è la matrice dipendente dalla posizione dell'immagine 2\times 3

    {\displaystyle \mathbf {M} ={\begin{pmatrix}{\frac {dm_{1}}{dx_{1}}}&{\frac {dm_{1}}{dx_{2}}}&{\frac {dm_{1}}{dx_{3}}}\\[2mm]{\frac {dm_{2}}{dx_{1}}}&{\frac {dm_{2}}{dx_{2}}}&{\frac {dm_{2}}{dx_{3}}}\end{pmatrix}}}

    In base a questa connessione, il campo di movimento, in una posizione fissa nell'immagine, è invariante ai moti 3D che giace nello spazio nullo di {\mathbf {M}} .

    Ad esempio, tutti i componenti di movimento nello spazio 3D che sono perpendicolari al punto focale della videocamera non verranno rilevati da una videocamera stenopeica.

    Il campo di movimento \mathbf {v} è definito come:

    {\displaystyle \mathbf {v} =f{\frac {Z\mathbf {V} -V_{z}\mathbf {P} }{Z^{2}}}}

    dove

    {\displaystyle \mathbf {V} =-\mathbf {T} -\mathbf {\omega } \times \mathbf {P} } .

    dove

    \mathbf {P} è un punto della scena in cui Z è la distanza da quel punto della scena.

    \mathbf {V} è il movimento relativo tra la telecamera e la scena, \mathbf {T} è la componente traslazionale del movimento, e

    \mathbf {\omega } è la velocità angolare del moto.

    Come spiegato in precedenza, il campo di movimento è una creazione teorica basata sul presupposto che la direzione del movimento per ogni pixel di un'immagine possa essere determinata. Tuttavia, in realtà, le misurazioni sui dati dell'immagine possono servire solo come approssimazione del campo di movimento sottostante. Il problema è che, nella maggior parte dei casi, la mobilità di ogni punto dell'immagine è unica e deve essere valutata localmente utilizzando una sorta di operazione di vicinato sui dati dell'immagine. Pertanto, per alcuni tipi di quartieri, un'approssimazione, generalmente indicata come flusso ottico, deve essere utilizzata al posto del vero campo di moto. Un quartiere con un'intensità costante, ad esempio, può corrispondere a un campo di moto che non è zero, ma il flusso ottico in tale regione sarebbe zero perché nessun movimento locale dell'immagine sarebbe misurabile. Allo stesso modo, il flusso ottico può registrare solo la componente normale di un campo di movimento, anche se un intorno che è intrinsecamente unidimensionale (come un bordo o una linea) può corrispondere a qualsiasi campo di movimento. Il rumore dell'immagine, l'occlusione 3D e l'aliasing temporale sono tutti fattori che sorgono naturalmente in qualsiasi tecnica di misurazione del flusso ottico e portano a discrepanze tra i campi di movimento misurati e quelli effettivi.

    Per riassumere, il campo di movimento è un'approssimazione del flusso ottico perché è impossibile misurare con precisione il campo di movimento per tutte le posizioni dell'immagine. Il flusso ottico può essere calcolato in diversi modi, ognuno dei quali tiene conto di una serie unica di criteri per determinare l'accuratezza di una stima ottica.

    {Fine Capitolo 1}

    Capitolo 2: Regola della catena

    In matematica, la regola della catena è un'espressione matematica che può essere utilizzata per definire la derivata della combinazione di due funzioni differenziabili, f e g, in termini di derivate di f e g.

    Più precisamente, se {\displaystyle h=f\circ g} è la funzione tale che {\displaystyle h(x)=f(g(x))} per ogni x, se questo è il caso, la regola della catena è, usando la notazione di Lagrange, {\displaystyle h'(x)=f'(g(x))g'(x).}

    o, equivalentemente,

    {\displaystyle h'=(f\circ g)'=(f'\circ g)\cdot g'.}

    La regola della catena può anche essere enunciata usando la notazione usata da Leibniz. Se una variabile, z, dipende da un'altra variabile, y, ed entrambe le variabili dipendono da una terza variabile, x (cioè, y e z sono variabili dipendenti), allora anche z dipende da x tramite l'uso della variabile y come intermediario. In questo caso particolare, la regola della catena è indicata come

    {\displaystyle {\frac {dz}{dx}}={\frac {dz}{dy}}\cdot {\frac {dy}{dx}},}

    e

    {\displaystyle \left.{\frac {dz}{dx}}\right|_{x}=\left.{\frac {dz}{dy}}\right|_{y(x)}\cdot \left.{\frac {dy}{dx}}\right|_{x},}

    allo scopo di segnalare in quali punti i derivati devono essere valutati.

    Quando si tratta di integrazione, la regola di sostituzione è quella che corrisponde alla regola della catena.

    Intuitivamente, la regola della catena afferma che se si conosce il tasso istantaneo di variazione di z rispetto a y e quello di y rispetto a x, allora si è in grado di calcolare il tasso di variazione istantaneo di z rispetto a x come prodotto dei due tassi di variazione. Se si conosce il tasso istantaneo di variazione di z rispetto a x, allora si è in grado di calcolare il tasso istantaneo di variazione di z relativo.

    Nelle parole di George F.

    Se un veicolo può muoversi due volte più velocemente di una bicicletta, e una bicicletta può viaggiare quattro volte più velocemente di una persona che cammina, allora Simmons dice questo: allora l'auto viaggia 2 × 4 = 8 volte più veloce dell'uomo.

    Di seguito viene descritta la connessione tra questa particolare illustrazione e la regola della catena:.

    Siano z, y e x le posizioni (variabili) dell'auto, della bicicletta e del ragazzo che stava camminando, rispettivamente.

    Il tasso di cambiamento delle posizioni relative dell'auto e della bicicletta è {\textstyle {\frac {dz}{dy}}=2.} Allo stesso modo, {\textstyle {\frac {dy}{dx}}=4.} quindi, il ritmo con cui cambiano le posizioni relative dell'automobile e del ragazzo che cammina è

    {\displaystyle {\frac {dz}{dx}}={\frac {dz}{dy}}\cdot {\frac {dy}{dx}}=2\cdot 4=8.}

    Il tasso di variazione della posizione è uguale al rapporto delle velocità, e la velocità è calcolata prendendo la derivata della posizione rispetto al tempo; Ciò significa che il tasso di variazione della posizione è pari a 1, {\displaystyle {\frac {dz}{dx}}={\frac {\frac {dz}{dt}}{\frac {dx}{dt}}},}

    o, equivalentemente, {\displaystyle {\frac {dz}{dt}}={\frac {dz}{dx}}\cdot {\frac {dx}{dt}},}

    Di seguito è

    Ti è piaciuta l'anteprima?
    Pagina 1 di 1