Scopri milioni di eBook, audiolibri e tanto altro ancora con una prova gratuita

Solo $11.99/mese al termine del periodo di prova. Cancella quando vuoi.

Parola visiva: Sbloccare il potere della comprensione delle immagini
Parola visiva: Sbloccare il potere della comprensione delle immagini
Parola visiva: Sbloccare il potere della comprensione delle immagini
E-book140 pagine1 ora

Parola visiva: Sbloccare il potere della comprensione delle immagini

Valutazione: 0 su 5 stelle

()

Leggi anteprima

Info su questo ebook

Che cos'è Visual Word


Le parole visive, utilizzate nei sistemi di recupero delle immagini, si riferiscono a piccole parti di un'immagine che contengono qualche tipo di informazione relativa alle funzionalità o alle modifiche che si verificano nei pixel come filtri e descrittori di funzionalità di basso livello.


Come trarrai vantaggio


(I) Approfondimenti e convalide sui seguenti aspetti argomenti:


Capitolo 1: Parola visiva


Capitolo 2: Codice


Capitolo 3: Recupero delle informazioni


Capitolo 4: Segmentazione delle immagini


Capitolo 5: Riepilogo automatico


Capitolo 6: Analisi semantica latente


Capitolo 7: Recupero di immagini basato sul contenuto


Capitolo 8: N -gram


Capitolo 9: Matrice dei termini del documento


Capitolo 10: Ricerca nel testo completo


(II) Rispondere alle principali domande del pubblico sulla parola visiva.


(III) Esempi reali dell'uso della parola visiva in molti campi.


A chi è rivolto questo libro


Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che vogliono andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di parola visiva.


 


 

LinguaItaliano
Data di uscita4 mag 2024
Parola visiva: Sbloccare il potere della comprensione delle immagini

Leggi altro di Fouad Sabry

Autori correlati

Correlato a Parola visiva

Titoli di questa serie (100)

Visualizza altri

Ebook correlati

Intelligenza artificiale e semantica per voi

Visualizza altri

Articoli correlati

Recensioni su Parola visiva

Valutazione: 0 su 5 stelle
0 valutazioni

0 valutazioni0 recensioni

Cosa ne pensi?

Tocca per valutare

La recensione deve contenere almeno 10 parole

    Anteprima del libro

    Parola visiva - Fouad Sabry

    Capitolo 1: Parola visiva

    Le parole visive, impiegate nei sistemi di recupero delle immagini, si riferiscono a brevi porzioni di un'immagine che contengono informazioni sulle caratteristiche (come il colore, la forma o la trama) o sui cambiamenti nei pixel, come i descrittori di funzionalità di basso livello (SIFT o SURF).

    Metodologie del sistema di recupero del testo (o sistema di recupero delle informazioni)

    Si consideri che i pixel di un'immagine, che sono le porzioni più piccole di un'immagine digitale e non possono essere ulteriormente suddivisi, sono simili alle lettere alfabetiche di una lingua. Quindi, un gruppo di pixel all'interno di un'immagine (una patch o matrici di pixel) costituisce una parola. Quindi, ogni parola può essere rielaborata all'interno di un sistema morfologico per recuperare un termine correlato. Quindi, più parole con lo stesso significato si riferiranno allo stesso concetto (come in qualsiasi lingua). Numerose parole condividono lo stesso significato e costituiscono la stessa frase (hanno le stesse informazioni). Secondo questa prospettiva, i ricercatori possono adattare le tecniche di recupero del testo ai sistemi di recupero delle immagini.

    Questo approccio può essere applicato ai giochi per determinare quali parole e frasi appariranno nelle nostre immagini. L'obiettivo è quello di tentare di comprendere le immagini utilizzando un vocabolario di parole visive.

    Una piccola area di un'immagine che può includere qualsiasi informazione in qualsiasi spazio delle funzionalità, ad esempio modifiche di colore o trama.

    In generale, le parole visive (VW) esistono in uno spazio di caratteristiche di valori continui, che implica un vasto numero di parole e, di conseguenza, un vasto linguaggio. Poiché i sistemi di recupero delle immagini devono utilizzare tecniche di recupero del testo a seconda delle lingue naturali, che hanno un limite al numero di termini e parole, il numero di parole visive deve essere ridotto.

    Esistono numerosi modi per superare questo problema, ad esempio il partizionamento dello spazio delle funzionalità in intervalli con funzionalità condivise (che possono essere considerate come la stessa parola). Tuttavia, questa tecnica presenta numerosi difetti, tra cui la strategia di divisione e l'ampiezza della gamma nello spazio delle funzionalità. L'utilizzo di un metodo di clustering per classificare e unire parole che trasmettono informazioni comuni in un numero finito di termini è un'altra soluzione presentata dai ricercatori.

    Conseguenza del clustering nello spazio delle funzionalità (centri dei cluster). Più patch possono fornire le informazioni più vicine nello spazio delle funzionalità, quindi possiamo considerarle equivalenti.

    Poiché il termine in un testo (il verbo dell'infinito, i sostantivi e gli articoli) si riferisce a numerose parole comuni con le stesse proprietà, il termine visivo (con il risultato del clustering) si riferirà a tutte le parole comuni che condividono le stesse informazioni in uno spazio di funzionalità.

    Infine, se tutte le immagini corrispondono allo stesso insieme di concetti visivi, allora possono comunicare tutte nello stesso linguaggio (o linguaggio visivo).

    Una raccolta di parole e frasi visive.

    Considerando solo i termini visivi è il Vocabolario Visivo che sarà il sistema di riferimento e recupero che dipenderà da esso per il recupero delle immagini.

    Questo linguaggio visivo rappresenterà tutte le immagini come una raccolta di parole visive o un insieme di parole visive.

    Una raccolta di parole visive che insieme spiegano il significato di una porzione o dell'intera immagine.

    Sulla base di questo tipo di rappresentazione dell'immagine, è possibile creare un sistema di recupero delle immagini utilizzando tecniche di recupero del testo. Tuttavia, poiché tutti i sistemi di recupero del testo si basano sui termini, le immagini delle query dell'utente devono essere trasformate in una raccolta di parole visive all'interno del sistema. Il sistema confronterà quindi questi termini visivi con tutti i termini visivi presenti nel database.

    {Fine Capitolo 1}

    Capitolo 2: Codice

    Ai fini della comunicazione e dell'elaborazione delle informazioni, un codice è un insieme di principi che trasforma le informazioni, come una lettera, una parola, un suono, un'immagine o un gesto, in un'altra forma, a volte più breve o segreta, per l'archiviazione su un dispositivo di archiviazione o per la trasmissione su un canale di comunicazione. Un primo esempio è lo sviluppo del linguaggio, che ha permesso alle persone di esprimere verbalmente ciò che pensavano, vedevano, sentivano o sentivano agli altri. Tuttavia, parlare restringe l'uditorio a coloro che sono presenti nel momento in cui viene pronunciato il discorso e limita il raggio di comunicazione alla distanza che una voce può percorrere. L'avvento della scrittura, che ha trasformato la comunicazione verbale in simboli visivi, ha aumentato il potenziale di comunicazione nel tempo e a distanza.

    La codifica è il processo di trasformazione dei dati da una fonte in simboli per la trasmissione o l'archiviazione. La procedura opposta, nota come decodifica, prevede la traduzione dei simboli del codice in una lingua comprensibile al destinatario, come l'inglese e/o lo spagnolo.

    La codifica viene utilizzata per facilitare la comunicazione in situazioni in cui sarebbe difficile o impossibile farlo utilizzando un linguaggio normale e semplice, sia verbalmente che per iscritto. Ad esempio, il semaforo crittografa parti del messaggio, generalmente singoli caratteri e numeri, utilizzando la disposizione delle bandiere tenute dal segnalatore o i bracci della torre del semaforo. Le bandiere possono essere lette da qualcuno lontano e possono ripetere i messaggi inviati.

    Un codice è tipicamente pensato nella teoria dell'informazione e nell'informatica come un metodo che rappresenta in modo discreto i simboli di un alfabeto di origine mediante stringhe codificate, che potrebbero essere in un alfabeto di destinazione diverso. La concatenazione delle stringhe codificate produce un'estensione del codice per la codifica di sequenze di simboli nell'alfabeto di origine.

    Questo è un piccolo esempio prima di fornire una definizione matematicamente esatta. Il diagramma

    C = \{\, a\mapsto 0, b\mapsto 01, c\mapsto 011\,\}

    il codice, il cui alfabeto di origine è l'insieme \{a,b,c\} e il cui alfabeto di destinazione è l'insieme \{0,1\} .

    Utilizzando l'estensione del codice, la stringa codificata 0011001 può essere raggruppata in parole di codice come 0 011 0 01, e queste a loro volta possono essere utilizzate per decodificare l'ordine dei simboli originali, acab.

    Facendo uso dei concetti della teoria del linguaggio formale, Quella che segue è una definizione matematica dettagliata di questa idea: S e T dovrebbero essere due insiemi finiti, alfabeti noti rispettivamente come sorgente e destinazione.

    Un codice C:\, S \to T^* è una funzione totale che mappa ogni simbolo da S a una sequenza di simboli su T.

    L' estensione C' di C , è un omomorfismo di S^{*} in T^{*} , Converte automaticamente ogni insieme di simboli di origine in un insieme di simboli di destinazione.

    In questa sezione, parleremo dei codici che traducono ogni carattere di origine (testo non crittografato) in una parola in codice presa da un dizionario, che quando concatenato produce una stringa codificata. Quando i caratteri di testo non crittografato hanno probabilità variabili, i codici a lunghezza variabile sono estremamente utili; Vedi anche Codifica dell'entropia.

    Un codice di prefisso è un codice che possiede la proprietà nota come proprietà del prefisso: nessun'altra parola di codice valida nell'insieme ha un prefisso (start) che è anche una parola di codice valida nel sistema. L'algoritmo più noto per la generazione di codici di prefisso è la codifica di Huffman. Anche quando il codice del prefisso non è stato generato da un metodo Huffman, viene spesso indicato come codici di Huffman. Le sezioni relative al paese e all'editore dei codici ISBN, i numeri di chiamata nazionali e i codici di sincronizzazione secondari utilizzati dallo standard wireless UMTS WCDMA 3G sono istanze aggiuntive dei codici di prefisso.

    I possibili insiemi di lunghezze di parole di codice in un codice di prefisso sono descritti dalla disuguaglianza di Kraft. Quasi tutti i codici uno-a-molti che possono essere decodificati in modo univoco, non solo i codici di prefisso, devono soddisfare la disuguaglianza di Kraft.

    Inoltre, i codici possono essere utilizzati per rappresentare i dati in modo più resiliente agli errori di trasmissione o archiviazione. Il modo in cui funziona questo codice che si suppone corregga gli errori è quello di costruire attentamente la ridondanza nei dati memorizzati (o trasmessi). Gli esempi includono i codici spazio-temporali, i codici di controllo di parità a bassa densità, Reed-Solomon, Reed-Muller, Walsh-Hadamard, Bose-Chaudhuri-Hochquenghem, Turbo, Golay e Goppa. Gli algoritmi di rilevamento degli errori possono essere migliorati per trovare errori casuali o a raffica.

    Sostituendo parole più brevi con parole come nave o fattura, un codice via cavo consente di comunicare le stesse informazioni con meno caratteri, più rapidamente

    Ti è piaciuta l'anteprima?
    Pagina 1 di 1