Modello di fotocamera stenopeica: Comprendere la prospettiva attraverso l'ottica computazionale
Di Fouad Sabry
()
Info su questo ebook
Cos'è il modello di fotocamera stenopeica
Il modello di fotocamera stenopeica è una rappresentazione matematica della relazione tra le coordinate di un punto nello spazio tridimensionale e la sua proiezione sull'immagine piano di una macchina fotografica stenopeica ideale. In questo modello, l'apertura della fotocamera è rappresentata come un punto e non sono utilizzati obiettivi per concentrare la luce. A titolo illustrativo, il modello non tiene conto delle distorsioni geometriche o della sfocatura di oggetti non a fuoco che possono essere provocati da lenti e aperture di dimensioni finite. Il fatto che la maggior parte delle fotocamere pratiche abbia solo coordinate discrete dell'immagine è un'altra cosa che non viene presa in considerazione. Per questo motivo, il modello della fotocamera stenopeica può essere utilizzato solo come approssimazione del primo ordine della mappatura da una scena tridimensionale a una rappresentazione grafica bidimensionale. La sua validità dipende dalla qualità della fotocamera e, in generale, diminuisce dal centro dell'immagine ai bordi man mano che aumentano gli effetti della distorsione dell'obiettivo.
Come trarrai vantaggio
(I) Approfondimenti e convalide sui seguenti argomenti:
Capitolo 1: Modello di fotocamera stenopeica
Capitolo 2: Sistema di coordinate cartesiane
Capitolo 3: Sistema di coordinate sferiche
Capitolo 4: Proiezione isometrica
Capitolo 5: Rappresentazione matriciale delle sezioni coniche
Capitolo 6: Ottica di Fourier
Capitolo 7: Proiezione 3D
Capitolo 8: Matrice di trasformazione
Capitolo 9: Pipeline grafica
Capitolo 10: Spazio tridimensionale
(II) Rispondere alle principali domande del pubblico sul modello di fotocamera stenopeico.
(III) Esempi reali dell'utilizzo del modello di fotocamera stenopeico in molti campi.
A chi è rivolto questo libro
Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di modello di fotocamera stenopeica.
Correlato a Modello di fotocamera stenopeica
Titoli di questa serie (100)
Equalizzazione dell'istogramma: Miglioramento del contrasto dell'immagine per una migliore percezione visiva Valutazione: 0 su 5 stelle0 valutazioniVisione computerizzata: Esplorare le profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRiduzione del rumore: Miglioramento della chiarezza, tecniche avanzate per la riduzione del rumore nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformata del radon: Svelare modelli nascosti nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniMappatura dei toni: Mappatura dei toni: prospettive illuminanti nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniDiffusione anisotropa: Miglioramento dell'analisi delle immagini attraverso la diffusione anisotropa Valutazione: 0 su 5 stelle0 valutazioniRetinex: Svelare i segreti della visione computazionale con Retinex Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniSistema di gestione del colore: Ottimizzazione della percezione visiva negli ambienti digitali Valutazione: 0 su 5 stelle0 valutazioniVisione artificiale subacquea: Esplorando le profondità della visione artificiale sotto le onde Valutazione: 0 su 5 stelle0 valutazioniCorrezione gamma: Migliorare la chiarezza visiva nella visione artificiale: la tecnica di correzione gamma Valutazione: 0 su 5 stelle0 valutazioniModello di aspetto del colore: Comprendere la percezione e la rappresentazione nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniVisione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniScala dello spazio: Esplorare le dimensioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGruppo congiunto di esperti fotografici: Sfruttare la potenza dei dati visivi con lo standard JPEG Valutazione: 0 su 5 stelle0 valutazioniFunzione di corrispondenza dei colori: Comprendere la sensibilità spettrale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRidipintura: Colmare le lacune nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniIstogramma dell'immagine: Svelare intuizioni visive, esplorare le profondità degli istogrammi delle immagini nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniConsenso del campione casuale: Stima robusta nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniModello a colori: Comprendere lo spettro della visione artificiale: esplorare i modelli di colore Valutazione: 0 su 5 stelle0 valutazioniSpazio colore: Esplorare lo spettro della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniStima della posa del corpo articolato: Sbloccare il movimento umano nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMappatura dei colori: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevamento delle macchie: Scoprire modelli nei dati visivi Valutazione: 0 su 5 stelle0 valutazioniCompressione delle immagini: Tecniche efficienti per l'ottimizzazione dei dati visivi Valutazione: 0 su 5 stelle0 valutazioniProfilo colore: Esplorare la percezione visiva e l'analisi nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione affine: Sbloccare le prospettive visive: esplorare la trasformazione affine nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di feature invarianti di scala: Svelare il potere della trasformazione delle caratteristiche invarianti su scala nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioni
Ebook correlati
Visione stereoscopica del computer: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniProiezione tridimensionale: Sbloccare la profondità della visione artificiale Valutazione: 0 su 5 stelle0 valutazioniGeometria descrittiva: Sbloccare il regno visivo: esplorare la geometria descrittiva nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRegolazione del pacchetto: Ottimizzazione dei dati visivi per una ricostruzione precisa Valutazione: 0 su 5 stelle0 valutazioniGrafica di ray-tracing: Esplorazione del rendering fotorealistico nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniCampo di movimento: Esplorando le dinamiche della visione artificiale: svelato il campo del movimento Valutazione: 0 su 5 stelle0 valutazioniModellazione e rendering basati su immagini: Esplorare il realismo visivo: tecniche di visione artificiale Valutazione: 0 su 5 stelle0 valutazioniComputer grafica bidimensionale: Esplorazione del regno visivo: computer grafica bidimensionale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniComputer grafica della radiosità: Avanzamento della visualizzazione attraverso la radiosità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniProiezione isometrica: Esplorare la percezione spaziale nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniProiezione assonometrica: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniRilevatore di bordi astuto: Svelare l'arte della percezione visiva Valutazione: 0 su 5 stelle0 valutazioniAlgoritmo della linea di Bresenham: Rendering delle linee efficiente e pixel perfetto per la visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMosaicazione di documenti: Sbloccare intuizioni visive attraverso il mosaico di documenti Valutazione: 0 su 5 stelle0 valutazioniPartizionamento binario dello spazio: Esplorazione del partizionamento binario dello spazio: fondamenti e applicazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniInterpolazione bilineare: Miglioramento della risoluzione e della chiarezza dell'immagine tramite l'interpolazione bilineare Valutazione: 0 su 5 stelle0 valutazioniAlgoritmo di disegno di linee: Padroneggiare le tecniche per il rendering di immagini di precisione Valutazione: 0 su 5 stelle0 valutazioniOrthographic Projection: Esplorazione della proiezione ortografica nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniPunto di fuga: Esplorare i limiti della visione: approfondimenti dall'informatica Valutazione: 0 su 5 stelle0 valutazioniStima della posa del corpo articolato: Sbloccare il movimento umano nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniProspettiva curvilinea: Esplorare la percezione della profondità nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniFlusso ottico: Esplorazione di modelli visivi dinamici nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniComputer grafica di vertice: Esplorando l'intersezione tra la computer grafica di vertice e la visione artificiale Valutazione: 0 su 5 stelle0 valutazioniMetodo di impostazione del livello: Avanzamento della visione artificiale, esplorazione del metodo dell'impostazione dei livelli Valutazione: 0 su 5 stelle0 valutazioniSegmentazione delle immagini: Sbloccare insight grazie alla precisione dei pixel Valutazione: 0 su 5 stelle0 valutazioniTrasformazione di Hough: Svelare la magia della trasformazione di Hough nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniOmografia: Omografia: trasformazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniStima del movimento: Progressi e applicazioni nella visione artificiale Valutazione: 0 su 5 stelle0 valutazioniAppunti di un fotografo amatoriale Valutazione: 0 su 5 stelle0 valutazioni
Intelligenza artificiale e semantica per voi
ANonniMus: Vecchi rivoluzionari contro giovani robot Valutazione: 0 su 5 stelle0 valutazioniIl Terzo Like Valutazione: 0 su 5 stelle0 valutazioniGuida Intelligenza Artificiale Valutazione: 0 su 5 stelle0 valutazioni
Recensioni su Modello di fotocamera stenopeica
0 valutazioni0 recensioni
Anteprima del libro
Modello di fotocamera stenopeica - Fouad Sabry
Capitolo 1: Modello di fotocamera stenopeica
Quando non ci sono lenti coinvolte nella messa a fuoco della luce, il modello di fotocamera stenopeica descrive la relazione matematica tra la posizione di un punto nello spazio tridimensionale e la sua proiezione sul piano dell'immagine. Le distorsioni geometriche e la sfocatura fuori fuoco dovute agli obiettivi e alle dimensioni fisse dell'apertura non sono prese in considerazione nel modello. Inoltre, ignora il fatto che la maggior parte delle fotocamere del mondo reale utilizza solo coordinate di immagine discrete. Ciò significa che la mappatura da una scena 3D a un'immagine 2D prodotta dal modello della fotocamera stenopeica è semplicemente una stima nella migliore delle ipotesi. La sua affidabilità si riduce dal centro ai bordi dell'immagine a causa degli effetti di distorsione dell'obiettivo e varia a seconda della qualità della fotocamera.
Se si utilizza una fotocamera di alta qualità, è possibile tenere conto di alcuni degli impatti ignorati dal modello della fotocamera stenopeica, ad esempio eseguendo trasformazioni di coordinate appropriate sulle coordinate dell'immagine. Pertanto, in campi come la visione artificiale e la computer grafica, in cui sono necessarie descrizioni accurate di come una telecamera rappresenta una scena 3D, il modello di fotocamera stenopeica è spesso sufficiente.
La figura mostra come funziona la geometria di mappatura di una fotocamera stenopeica. Di seguito sono riportati gli elementi costitutivi dell'illustrazione:
Un sistema di coordinate ortogonale, tridimensionale O-centrico. Anche qui si trova l'apertura della fotocamera. X1, X2 e X3 sono i nomi dati ai tre assi delle coordinate. L'asse ottico, l'asse principale o il raggio principale puntano nella direzione del campo visivo della telecamera. Il piano primario, o lato anteriore della telecamera, è lo spazio definito dagli assi X1 e X2.
Piano dell'immagine, in cui il mondo, in tre dimensioni, viene proiettato attraverso l'obiettivo di una macchina fotografica.
Il piano dell'immagine è parallelo agli assi X1 e X2 e si trova a distanza f dall'origine O nella direzione negativa dell'asse X3, dove f è la lunghezza focale della fotocamera stenopeica.
Affinché una fotocamera stenopeica funzioni in pratica, il piano dell'immagine deve essere posizionato in modo che intercroci l'asse X3 in -f, dove f è maggiore di zero.
Il piano dell'immagine e l'asse ottico si incontrano in una posizione indicata con R. Questo è il punto focale, o il cuore dell'immagine.
Un punto P da qualche parte nel mondo in corrispondenza delle coordinate (x_1, x_2, x_3) relative agli assi X1, X2 e X3.
La linea che il punto P usa per proiettarsi sul piano della pellicola. Punti di connessione P e O, questa linea verde rappresenta questa connessione.
Questo è il piano dell'immagine su cui viene proiettato il punto P, indicato con Q.
Il piano dell'immagine e la linea di proiezione verde si intersecano in questa posizione.
In qualsiasi situazione pratica possiamo assumere che x_{3} > 0, il che significa che il punto di intersezione è ben definito.
Oltre al mondo 3D, il piano dell'immagine ha un proprio set di coordinate, con il centro in R e gli assi perpendicolari tra loro (X1 e X2), rispettivamente.
Le coordinate del punto Q relative a questo sistema di coordinate sono (y_1, y_2) .
Si suppone che tutte le linee di proiezione passino attraverso un punto infinitesimamente piccolo all'apertura stenopeica della fotocamera. Il termine centro ottico
è usato per descrivere questa posizione in tre dimensioni.
Successivamente vogliamo capire come le coordinate (y_1, y_2) del punto Q dipendano dalle coordinate (x_1, x_2, x_3) del punto P.
La figura successiva aiuterà in questo processo mostrando la scena identica a quella precedente, solo che questa volta vista dall'alto, con gli occhi puntati verso il basso, lungo la direzione negativa dell'asse X.
La figura raffigura una coppia di triangoli congruenti, entrambi le cui ipotenuse sono segmenti della linea di proiezione verde.
I cateti del triangolo sinistro sono -y_1 e f e i cateti del triangolo rettangolo sono x_{1} e x_3 .
Le somiglianze tra i due triangoli suggeriscono che
\frac{-y_1}{f} = \frac{x_1}{x_3} o y_1 = -\frac{f \, x_1}{x_3}
I risultati di un'indagine simile, se osservati in senso antiorario attorno all'asse X1, sono
\frac{-y_2}{f} = \frac{x_2}{x_3} o y_2 = -\frac{f \, x_2}{x_3}
In poche parole, questo significa
\begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = -\frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix}che è un'espressione che descrive la relazione tra le coordinate 3D (x_1,x_2,x_3) del punto P e le sue coordinate dell'immagine (y_1,y_2) date dal punto Q nel piano dell'immagine.
La mappatura dalle coordinate 3D a quelle 2D descritta da una telecamera stenopeica è una proiezione prospettica seguita da una rotazione di 180° nel piano dell'immagine.
Questo è in linea con il funzionamento di una fotocamera stenopeica convenzionale; l'immagine risultante viene ruotata di 180° e la dimensione relativa degli oggetti proiettati dipende dalla loro distanza dal punto focale e la dimensione complessiva dell'immagine dipende dalla distanza f tra il piano dell'immagine e il punto focale.
Per ottenere un'immagine che non è stata ruotata, come ci si può aspettare da un dispositivo fotografico, si potrebbe andare in entrambi i modi:
Ruotare il sistema di coordinate nel piano dell'immagine di 180° (in entrambe le direzioni).
Questa è la soluzione che utilizzerebbe qualsiasi fotocamera stenopeica funzionale; Quando si visualizza una foto scattata con una fotocamera, l'immagine viene ruotata prima di essere visualizzata, Nel caso di una fotocamera digitale, l'immagine viene ruotata in base all'ordine in cui vengono letti i pixel.
Il piano dell'immagine deve essere spostato in modo che incontri l'asse X3 in f, anziché -f, e tutti i calcoli precedenti devono essere rifatti. Dal momento che questo non può essere fatto di fatto, viene creata una fotocamera teorica che può essere più facile da analizzare rispetto alla fotocamera vera e propria.
Senza la negazione, l'espressione precedente fornisce la mappatura dalle coordinate dell'immagine 3D a quella 2D in entrambe le circostanze.
\begin{pmatrix} y_1 \\ y_2 \end{pmatrix} = \frac{f}{x_3} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix}Le coordinate omogenee sono un altro modo per descrivere la mappatura dalle posizioni dei punti 3D nello spazio alle posizioni delle immagini 2D.
Sia \mathbf {x} una rappresentazione di un punto 3D in coordinate omogenee (un vettore a 4 dimensioni) e sia \mathbf{y} una rappresentazione dell'immagine di questo punto nella fotocamera stenopeica (un vettore a 3 dimensioni).
Allora la relazione successiva è vera.
\mathbf{y} \sim \mathbf{C} \, \mathbf{x}dove \mathbf{C} è la 3\times 4 matrice della camera e l' \, \sim uguaglianza delle medie tra gli elementi degli spazi proiettivi.
Ciò significa che anche qualsiasi moltiplicazione scalare diversa da zero tra i lati sinistro e destro è uguale.
Una conseguenza di questa relazione è che può anche \mathbf{C} essere visto come un elemento di uno spazio proiettivo; Se una moltiplicazione scalare di due matrici della fotocamera produce lo stesso risultato, le matrici sono comparabili.
La mappatura della telecamera stenopeica come descritto qui, come trasformazione lineare \mathbf{C} anziché come frazione di due espressioni lineari, consente di derivare diverse relazioni tra coordinate 3D e 2D con un minor numero di passaggi di calcolo.
{Fine Capitolo 1}
Capitolo 2: Sistema di coordinate cartesiane
In geometria, un sistema di coordinate cartesiane (UK: /kɑːˈtiːzjən/, US: /kɑːrˈtiʒən/) in un piano è un sistema di coordinate che specifica ogni punto in modo univoco da una coppia di numeri reali chiamati coordinate, dove due linee perpendicolari si incontrano in un punto fisso, quali sono le distanze con segno tra di loro?, linee di coordinate, in breve, assi di coordinate del sistema o assi (plurale di asse).
Il punto di intersezione, noto anche come origine, è contrassegnato da uno zero, 0) come coordinate.
Le coordinate cartesiane, le distanze con segno da un punto a tre piani perpendicolari, possono essere utilizzate per descrivere la posizione di un punto nello spazio tridimensionale. In generale, per ogni dimensione n, un punto in uno spazio euclideo n-dimensionale può essere descritto usando n coordinate cartesiane. Queste sono le coordinate di un punto, espresse come le distanze con segno da n iperpiani fissi e perpendicolari.
Le coordinate cartesiane prendono il nome da René Descartes, il matematico il cui sviluppo nel XVII secolo stabilì la prima connessione sistematica tra geometria e algebra e quindi scatenò una rivoluzione matematica.
Applicando il sistema cartesiano di coordinate, le equazioni contenenti le coordinate dei punti su una forma geometrica (ad esempio una curva) possono essere utilizzate per descrivere la forma in dettaglio.
Ad esempio, il cerchio di raggio 2, che si concentra sulla genesi del piano, può essere descritto come l'insieme di tutti i punti le cui coordinate x e y soddisfano l'equazione x2 + y2 = 4.
A causa del suo ruolo centrale nella geometria analitica, le coordinate cartesiane forniscono anche luce su altre aree di studio della matematica, tra cui l'algebra lineare, l'analisi complessa, la geometria differenziale, il calcolo multivariato, la teoria dei gruppi e molte altre. Il grafico delle funzioni è un esempio ben noto di tale concetto. La maggior parte dei campi pratici che si occupano di geometria si basano fortemente sulle coordinate cartesiane, tra cui l'astronomia, la fisica, l'ingegneria e molti altri. Sono lo standard de facto per l'elaborazione dei dati in campi come la computer grafica, il CAD e altre forme di modellazione geometrica.
Il cartesiano si riferisce al matematico e filosofo francese René Descartes, che, mentre viveva nei Paesi Bassi, pubblicò questa teoria nel 1637.
Pierre de Fermat l'ha trovato da solo, che sono stati anche coinvolti in un lavoro multidimensionale, nonostante il fatto che Fermat non condividesse la sua scoperta,.
Le coordinate polari per il piano, e le coordinate sferiche e cilindriche per lo spazio tridimensionale, sono solo alcune delle molte che sono state stabilite a partire da Cartesio.
La scelta di un punto O sulla retta (l'origine), di un'unità di lunghezza e di un orientamento per la linea sono i tre componenti di un sistema di coordinate cartesiane per una retta in uno spazio bidimensionale. Quando una linea è orientata
(o punti
) dalla metà negativa alla metà positiva, significa che l'orientamento ha scelto quale delle due metà della linea data da O deve essere considerata positiva. Quindi, la distanza da O a un dato punto P sulla linea può essere indicata utilizzando un simbolo più (+) o meno (-), a seconda di quale semilinea contiene P.
Una linea numerica è una linea che utilizza uno specifico sistema di coordinate cartesiane. C'è un posto specifico sulla linea per ogni numero reale. D'altra parte, ogni punto sulla retta può essere pensato come un elemento discreto di un sistema numerico