Scopri milioni di eBook, audiolibri e tanto altro ancora con una prova gratuita

Solo $11.99/mese al termine del periodo di prova. Cancella quando vuoi.

Composizione alfa: Padroneggiare l'arte della composizione delle immagini nella visione artificiale
Composizione alfa: Padroneggiare l'arte della composizione delle immagini nella visione artificiale
Composizione alfa: Padroneggiare l'arte della composizione delle immagini nella visione artificiale
E-book134 pagine1 ora

Composizione alfa: Padroneggiare l'arte della composizione delle immagini nella visione artificiale

Valutazione: 0 su 5 stelle

()

Leggi anteprima

Info su questo ebook

Che cos'è l'Alpha Compositing


Nella computer grafica, l'alpha compositing o l'alpha blending è il processo di combinazione di un'immagine con uno sfondo per creare l'aspetto di trasparenza parziale o totale. Spesso è utile eseguire il rendering degli elementi dell'immagine (pixel) in passaggi o livelli separati e quindi combinare le immagini 2D risultanti in un'unica immagine finale denominata composita. Il compositing è ampiamente utilizzato nei film quando si combinano elementi di immagini renderizzate al computer con riprese dal vivo. La fusione alfa viene utilizzata anche nella computer grafica 2D per posizionare elementi rasterizzati in primo piano su uno sfondo.


Come trarne vantaggio


(I) Approfondimenti e convalide sui seguenti argomenti:


Capitolo 1: Composizione alpha


Capitolo 2: Composizione digitale


Capitolo 3: PNG


Capitolo 4: Modello di colore RGB


Capitolo 5: Correzione gamma


Capitolo 6: Sottocampionamento cromatico


Capitolo 7: Formato file BMP


Capitolo 8: Modello di colore RGBA


Capitolo 9: Scala di grigi


Capitolo 10: Trasparenza (grafica)


(II) Rispondere alle principali domande del pubblico sulla composizione alfa.


(III) Esempi reali dell'uso del compositing alfa in molti campi.


A chi è rivolto questo libro


Professionisti, studenti universitari e studenti laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di Alpha Compositing.


 


 

LinguaItaliano
Data di uscita5 mag 2024
Composizione alfa: Padroneggiare l'arte della composizione delle immagini nella visione artificiale

Leggi altro di Fouad Sabry

Correlato a Composizione alfa

Titoli di questa serie (100)

Visualizza altri

Ebook correlati

Intelligenza artificiale e semantica per voi

Visualizza altri

Articoli correlati

Recensioni su Composizione alfa

Valutazione: 0 su 5 stelle
0 valutazioni

0 valutazioni0 recensioni

Cosa ne pensi?

Tocca per valutare

La recensione deve contenere almeno 10 parole

    Anteprima del libro

    Composizione alfa - Fouad Sabry

    Capitolo 1: Composizione alfa

    L'alpha compositing o alpha blending è il processo di miscelazione di un'immagine con uno sfondo per simulare la trasparenza parziale o completa nella computer grafica. Spesso è vantaggioso eseguire il rendering dei componenti dell'immagine (pixel) in vari passaggi o livelli e quindi unire le immagini 2D risultanti in un'unica immagine finale nota come composita. Il film fa un uso considerevole del compositing quando fonde elementi grafici renderizzati al computer con riprese dal vivo. La fusione alfa viene utilizzata anche per posizionare elementi in primo piano rasterizzati su uno sfondo nella grafica computerizzata 2D.

    Oltre al colore dell'elemento, è importante mantenere un mascherino correlato per ogni elemento dell'immagine per integrarli in modo efficace. Questo livello mascherino fornisce le informazioni di copertura, ovvero la forma della geometria disegnata, semplificando la distinzione tra le aree dell'immagine in cui è stato disegnato qualcosa e le aree in cui non è stato disegnato nulla.

    Sebbene l'operazione più fondamentale per unire due immagini sia quella di posizionarle una sopra l'altra, vengono utilizzati diversi processi o metodi di fusione.

    Alla fine degli anni '70, Alvy Ray Smith e Ed Catmull introdussero il concetto di canale alfa al New York Institute of Technology Computer Graphics Lab. Nel 1981, Bruce A. Wallace derivò l'identico operatore straight over utilizzando un modello di riflettanza/trasmittanza fisica.

    L'uso del termine alfa è spiegato da Smith come segue: L'abbiamo chiamato così a causa della classica formula di interpolazione lineare {\displaystyle \alpha A+(1-\alpha )B} che utilizza la lettera greca \alpha (alfa) per controllare la quantità di interpolazione tra, in questo caso, due raffigurazioni A e B.

    Cioè, mentre si sovrappone l'immagine A all'immagine B, il valore di \alpha nella formula viene preso direttamente dal canale alfa di A.

    In un'immagine 2D, viene mantenuta una combinazione di colori per ogni pixel, spesso una combinazione di rosso, verde e blu (RGB). Quando si utilizza la composizione alfa, il canale alfa di ogni pixel contiene un valore numerico aggiuntivo compreso tra 0 e 1. Un valore pari a 0 indica che il pixel è completamente trasparente, consentendo di visualizzare il colore del pixel sottostante. Uno indica che il pixel è completamente opaco.

    Con la presenza di un canale alfa, i processi di composizione delle immagini possono essere espressi utilizzando un'algebra di composizione. Date due foto A e B, ad esempio, il processo di composizione più frequente è quello di combinare le immagini in modo che A appaia in primo piano e B sullo sfondo. Questo potrebbe essere indicato come A contro B. Oltre a over, Porter e Duff hanno definito gli operatori di compositing in, tenuti fuori da (spesso abbreviato), atop e xor (e gli operatori inversi rover, rin, rout e ratop) da una considerazione delle opzioni per fondere i colori di due pixel quando la loro copertura è concettualmente sovrapposta ortogonalmente:

    Ad esempio, l'operatore over può essere implementato applicando la formula seguente a ciascun pixel:

    {\displaystyle \alpha _{o}=\alpha _{a}+\alpha _{b}(1-\alpha _{a})}{\displaystyle C_{o}={\frac {C_{a}\alpha _{a}+C_{b}\alpha _{b}(1-\alpha _{a})}{\alpha _{o}}}}

    Qui C_{o} , C_{a} e C_{b} stanno per le componenti di colore dei pixel nel risultato, l'immagine A e l'immagine B singolarmente, applicate singolarmente a ciascun canale di colore (rosso, verde, blu), mentre {\displaystyle \alpha _{o}} , \alpha _{a} e \alpha _{b} sono i valori alfa dei rispettivi pixel.

    In sostanza, l'operatore over è l'operazione di verniciatura standard (vedi algoritmo di Painter). Gli operatori in e out sono l'equivalente del clipping nella composizione alfa. I due utilizzano solo il canale alfa e ignorano le componenti di colore della seconda immagine. Inoltre, plus definisce la miscelazione additiva.

    Se un'immagine contiene un canale alfa, sono disponibili due rappresentazioni comuni: alfa può essere diritta (non associata) o premoltiplicata (associata).

    I componenti RGB rappresentano il colore dell'oggetto o del pixel indipendentemente dalla sua opacità quando si utilizza l'alfa semplice. Questa è la procedura implicita nell'operatore over della sezione precedente.

    Con l'alfa premoltiplicato, le componenti RGB indicano l'emissione dell'oggetto o del pixel, mentre la componente alfa indica l'occlusione. Quindi, l'operatore over diventa:

    {\displaystyle C_{o}=C_{a}+C_{b}(1-\alpha _{a})}{\displaystyle \alpha _{o}=\alpha _{a}+\alpha _{b}(1-\alpha _{a})}

    Il più grande vantaggio dell'alfa premoltiplicato è che consente una miscelazione, un'interpolazione e un filtraggio accurati.

    Supponendo che il colore dei pixel sia indicato utilizzando tuple RGBA diritte (non premoltiplicate), un pixel con il valore (0, 0,7, 0, 0,5) ha il 70% dell'intensità massima del verde e il 50% di opacità. Se la tonalità fosse completamente verde, il suo RGBA sarebbe (0, 1, 0, 0.5).

    PNG e TIFF sono i formati di immagine più comuni che supportano il canale alfa. GIF supporta i canali alfa ma è inefficiente per quanto riguarda lo spazio dei file. Alcuni codec video, come Animation e Apple ProRes 4444 in formato QuickTime o il codec multiformato Techsmith, includono canali alfa.

    In generale, il formato di file BMP non supporta questo canale; Tuttavia, è possibile memorizzare il canale alfa in altri formati, come 32 bit (888-8) o 16 bit (444-4), anche se non tutti i computer o programmi sono in grado di leggerlo: Sono stati sviluppati anche programmi particolari per la generazione di questi BMP, che vengono utilizzati principalmente nei videogiochi.

    I valori RGB delle tipiche fotografie digitali sono compressi da un meccanismo di correzione gamma piuttosto che riflettere direttamente l'intensità della luce fisica:

    {\displaystyle C_{\text{encoded}}=C_{\text{linear}}^{1/\gamma }}

    Questa trasformazione utilizza meglio il numero limitato di bit nell'immagine codificata, scegliendo \gamma quella che meglio corrisponde alla percezione umana non lineare della luminanza.

    Di conseguenza, i programmi per computer che manipolano tali immagini devono decodificare i valori RGB in uno spazio lineare (rimuovendo la compressione gamma), mescolare le intensità di luce lineari e quindi riapplicare la compressione gamma all'immagine risultante:

    {\displaystyle C_{o}=\left({\frac {C_{a}^{\gamma }\alpha _{a}+C_{b}^{\gamma }\alpha _{b}(1-\alpha _{a})}{\alpha _{o}}}\right)^{1/\gamma }}

    Prima della compressione gamma, la pre-moltiplicazione viene eseguita nello spazio lineare quando accoppiata con alfa premoltiplicata. Il risultato è la formula mostrata di seguito:

    {\displaystyle C_{o}=\left(C_{a}^{\gamma }+C_{b}^{\gamma }(1-\alpha _{a})\right)^{1/\gamma }}

    Si noti che la correzione gamma viene applicata solo ai canali di colore; Il canale alfa è sempre lineare.

    Sebbene utilizzati per ragioni simili, i colori trasparenti e le maschere dell'immagine impediscono la miscelazione senza soluzione di continuità dei pixel dell'immagine sovrapposti con i pixel di sfondo (sono consentiti solo pixel dell'immagine intera o pixel di sfondo interi).

    Un effetto simile può essere ottenuto con un canale alfa a 1 bit, come si trova nella modalità RGBA ad alto colore a 16 bit del formato di file immagine Truevision TGA e nella modalità grafica ad alto colore delle corrispondenti schede video TARGA e AT-Vista/NU-Vista. Questa modalità alloca 5 bit a ciascuno dei tre colori RGB primari (RGB a 15 bit) più un bit per il canale alfa.

    Quando è disponibile solo l'alfa a 1 bit, la trasparenza dello schermo può imitare l'occlusione parziale.

    Un singolo canale alfa non è sufficiente per alcune applicazioni; una vetrata, ad esempio, richiede un canale di trasparenza distinto per ciascun canale RGB per simulare la trasparenza rossa, verde e blu in modo indipendente. Per applicazioni di filtrazione del colore a spettro preciso, è possibile aggiungere ulteriori canali alfa.

    Alcuni metodi di trasparenza indipendenti dall'ordine sostituiscono l'operatore over con un'approssimazione commutativa.

    {Fine Capitolo 1}

    Capitolo 2: Compositing digitale

    Il compositing digitale è la tecnica di integrazione digitale di numerose immagini per creare un'immagine finita, spesso per la stampa, la pellicola o la proiezione su uno schermo. Questo processo è l'equivalente digitale della composizione ottica della pellicola.

    La fusione alfa è la procedura di base utilizzata nella composizione digitale, se un valore di opacità, 'α', controlla il rapporto tra due valori di pixel di input che danno come risultato un singolo pixel di output.

    Per fare un semplice esempio, supponiamo che vengano fornite due foto di dimensioni identiche per la composizione. Le immagini di input sono note rispettivamente come immagine in primo piano e immagine di sfondo. Ogni immagine contiene la stessa quantità di pixel. L'immagine composita è il risultato dell'unione matematica delle informazioni provenienti dai pixel corrispondenti delle due immagini di input e dell'acquisizione del risultato come terza immagine.

    Pensa a tre pixel; f rappresenta un pixel in primo piano.

    A Pixel di sfondo, B Pixel di primo piano

    c è un pixel composito.

    e

    α, Il valore dell'opacità del pixel di primo piano.

    (α = 1 per un primo piano opaco, α = 0 per un primo piano completamente trasparente).

    Un mascherino è un'immagine raster monocromatica in cui i valori dei pixel devono essere interpretati come valori alfa.

    Quindi, tenendo conto di tutti e tre i canali di colore, e assumendo che i canali di colore siano espressi in uno spazio colore γ=1 (vale a dire, le quantità osservate sono proporzionali alla quantità di luce), si ha:

    Cr = α fr + (1 − α) br

    cg

    Ti è piaciuta l'anteprima?
    Pagina 1 di 1