Scopri milioni di eBook, audiolibri e tanto altro ancora con una prova gratuita

Solo $11.99/mese al termine del periodo di prova. Cancella quando vuoi.

Riconoscimento ottico del Braille: Potenziare l'accessibilità attraverso l'intelligenza visiva
Riconoscimento ottico del Braille: Potenziare l'accessibilità attraverso l'intelligenza visiva
Riconoscimento ottico del Braille: Potenziare l'accessibilità attraverso l'intelligenza visiva
E-book132 pagine1 ora

Riconoscimento ottico del Braille: Potenziare l'accessibilità attraverso l'intelligenza visiva

Valutazione: 0 su 5 stelle

()

Leggi anteprima

Info su questo ebook

Cos'è il riconoscimento ottico del Braille


Il riconoscimento ottico del Braille è una tecnologia che cattura ed elabora le immagini dei caratteri braille in caratteri del linguaggio naturale. Viene utilizzato per convertire documenti braille per le persone che non possono leggerli in testo e per la conservazione e la riproduzione dei documenti.


Come trarrai vantaggio


(I) Approfondimenti e convalide sui seguenti argomenti:


Capitolo 1: Riconoscimento ottico del braille


Capitolo 2: Visione artificiale


Capitolo 3: Riconoscimento ottico dei caratteri


Capitolo 4: Riconoscimento della grafia


Capitolo 5: Scanner di immagini


Capitolo 6: Analisi del layout del documento


Capitolo 7: Elaborazione dei documenti


Capitolo 8: Tracciamento video


Capitolo 9: Scansione 3D


Capitolo 10: Riconoscimento ottico della musica


(II) Rispondere al pubblico top domande sul riconoscimento ottico del Braille.


(III) Esempi reali dell'utilizzo del riconoscimento ottico del Braille in molti campi.


A chi è rivolto questo libro


Professionisti, studenti universitari e laureati, appassionati, hobbisti e coloro che desiderano andare oltre le conoscenze o le informazioni di base per qualsiasi tipo di riconoscimento ottico del Braille.


 


 

LinguaItaliano
Data di uscita4 mag 2024
Riconoscimento ottico del Braille: Potenziare l'accessibilità attraverso l'intelligenza visiva

Leggi altro di Fouad Sabry

Autori correlati

Correlato a Riconoscimento ottico del Braille

Titoli di questa serie (100)

Visualizza altri

Ebook correlati

Intelligenza artificiale e semantica per voi

Visualizza altri

Articoli correlati

Recensioni su Riconoscimento ottico del Braille

Valutazione: 0 su 5 stelle
0 valutazioni

0 valutazioni0 recensioni

Cosa ne pensi?

Tocca per valutare

La recensione deve contenere almeno 10 parole

    Anteprima del libro

    Riconoscimento ottico del Braille - Fouad Sabry

    Capitolo 1: Riconoscimento ottico braille

    Il riconoscimento ottico braille è una tecnica che converte fotografie di simboli braille in caratteri di linguaggio semplice. Viene utilizzato per tradurre i documenti braille in testo per le persone che non possono leggerli, nonché per conservare e riprodurre i documenti.

    Nel 1984, un team di ricercatori della Delft University of Technology ha creato una tavoletta di lettura braille in cui una testina di lettura con cellule fotosensibili è stata spostata su una coppia di righelli per catturare il testo braille riga per riga.

    La natura dei documenti braille crea molti degli ostacoli all'elaborazione corretta del testo braille. Il Braille è spesso stampato su carta di un solo colore, senza l'uso di inchiostro per creare contrasto tra i caratteri in rilievo e lo sfondo. Tuttavia, i difetti della pagina possono essere visibili in una scansione o in una fotografia della pagina.

    Numerosi documenti vengono stampati interpunto o fronte/retro. Così, le depressioni del braille di un lato sembrano intercalate con le sporgenze del braille dell'altro lato.

    Alcuni sistemi di identificazione ottica braille utilizzano un'illuminazione obliqua e una telecamera per rivelare le ombre delle depressioni e delle sporgenze del braille. Altri utilizzano scanner per documenti disponibili sul mercato.

    {Fine Capitolo 1}

    Capitolo 2: Visione artificiale

    Lo studio di come i computer possano derivare conoscenze di alto livello da immagini o video digitali è al centro dell'area scientifica multidisciplinare della visione artificiale. Da un punto di vista tecnologico, indaga e tenta di automatizzare le attività che rientrano nelle capacità del sistema visivo umano.

    Le attività associate alla visione artificiale includono tecniche per ottenere, elaborare, analizzare e comprendere immagini digitali, nonché l'estrazione di dati ad alta dimensione dall'ambiente fisico al fine di creare informazioni numeriche o simboliche, come i giudizi.

    La visione artificiale è un sottocampo dell'informatica che indaga le basi teoriche dei sistemi artificiali progettati per derivare informazioni dalle immagini. I dati visivi possono essere presentati in una varietà di formati, tra cui sequenze video, immagini ottenute da diverse telecamere, dati multidimensionali ottenuti da uno scanner 3D o da apparecchiature di scansione medica e così via. L'obiettivo del campo tecnico noto come visione artificiale è quello di implementare le idee e i modelli che ha sviluppato nel processo di costruzione di sistemi di visione artificiale.

    I campi della ricostruzione della scena, del rilevamento di oggetti, del rilevamento di eventi, del tracciamento video, del riconoscimento di oggetti, della stima della posa 3D, dell'apprendimento, dell'indicizzazione, della stima del movimento, dell'asservimento visivo, della modellazione di scene 3D e del ripristino delle immagini sono tutti sottodomini della visione artificiale. Altri sottodomini della visione artificiale includono la modellazione di scene 3D.

    La visione artificiale è uno studio multidisciplinare che esamina il modo in cui i computer possono essere programmati per estrarre conoscenze di alto livello da immagini o filmati digitali. Quest'area si concentra su come insegnare ai computer a comprendere ciò che viene loro mostrato. Dal punto di vista dell'ingegneria, l'obiettivo è trovare il modo di automatizzare le operazioni che possono già essere eseguite dal sistema visivo umano. La visione artificiale è un campo di studio nel campo della tecnologia dell'informazione che si concentra sull'applicazione di teorie e modelli esistenti al processo di costruzione di sistemi di visione artificiale.

    Alla fine degli anni '60, i college che erano all'avanguardia nell'intelligenza artificiale sono stati i primi a sperimentare la visione artificiale. Il suo scopo era quello di funzionare in modo simile a quello del sistema visivo umano, con l'obiettivo finale di infondere nei robot un comportamento intelligente. Negli anni '90, molte delle aree di studio che erano state studiate in precedenza sono diventate più attive delle altre. Lo studio delle ricostruzioni tridimensionali proiettive ha portato a una comprensione più profonda di come calibrare una telecamera. Divenne chiaro, con l'introduzione delle tecniche di ottimizzazione per la calibrazione della fotocamera, che un numero significativo di concetti era stato precedentemente studiato dalla disciplina della teoria della regolazione del fascio della fotogrammetria. Questo è venuto alla luce come risultato di questo sviluppo. Ciò ha portato allo sviluppo di tecniche per la realizzazione di ricostruzioni tridimensionali sparse di scene utilizzando diverse fotografie. Sia il problema della densa corrispondenza stereo che lo sviluppo di ulteriori approcci stereo multi-view hanno visto un certo grado di movimento in avanti. Allo stesso tempo, sono state utilizzate molte varianti di taglio grafico per risolvere il problema della segmentazione dell'immagine. Questo decennio è stato particolarmente significativo in quanto è stata la prima volta che i metodi di apprendimento statistico sono stati utilizzati nella pratica per il compito di riconoscere i volti nelle fotografie (vedi Eigenface). Le aree della computer grafica e della visione artificiale sono diventate più intrecciate negli ultimi anni, il che ha portato a un grande aumento della quantità di collaborazione che ha avuto luogo tra i due. Questo presentava le prime forme di rendering del campo luminoso, lo stitching dell'immagine panoramica, il morphing dell'immagine, l'interpolazione della vista e il rendering basato sull'immagine. L'area della visione artificiale ha ricevuto una nuova prospettiva di vita grazie allo sviluppo di algoritmi basati sul deep learning. L'accuratezza degli algoritmi di deep learning su numerosi set di dati di visione artificiale di riferimento per attività che vanno dalla classificazione al flusso ottico ha superato quella degli approcci precedenti. Queste attività includono la segmentazione delle immagini e il flusso ottico.

    La visione artificiale a stato solido è fortemente connessa a una serie di altre discipline, tra cui la fisica. La stragrande maggioranza dei sistemi di visione artificiale si basa su sensori di immagine, che sono dispositivi in grado di rilevare le radiazioni elettromagnetiche. Questa radiazione si manifesta comunemente come luce visibile o infrarossa. La fisica quantistica è stata utilizzata nello sviluppo dei sensori. La disciplina scientifica della fisica fornisce una spiegazione per il metodo attraverso il quale la luce interagisce con le superfici. Il comportamento dell'ottica, che è una componente fondamentale della maggior parte dei sistemi di imaging, può essere spiegato dalla fisica. Al fine di offrire una conoscenza completa del processo attraverso il quale si forma un'immagine, sofisticati sensori di immagine hanno bisogno dell'uso della meccanica quantistica. La visione artificiale può anche essere utilizzata per risolvere una varietà di problemi di misurazione che sorgono in fisica, come quelli che coinvolgono il movimento dei fluidi.

    La disciplina scientifica della neurobiologia, in particolare lo studio del sistema visivo biologico. Gli occhi, i neuroni e le regioni del cervello che sono dedicati all'elaborazione degli input visivi sia negli esseri umani che in diversi animali sono stati oggetto di una notevole quantità di ricerche nel corso dell'ultimo secolo. Di conseguenza, è emersa una descrizione semplice ma complessa del modo in cui funzionano i sistemi di visione reali per completare vari compiti relativi alla visione. Come conseguenza di queste scoperte, è emerso un sottocampo della visione artificiale in cui i sistemi artificiali hanno lo scopo di imitare l'elaborazione e il comportamento dei sistemi biologici, con vari gradi di somiglianza biologica. Molti degli approcci basati sull'apprendimento che sono stati creati nell'ambito della visione artificiale hanno le loro radici nella biologia. Alcuni esempi di questi metodi basati sull'apprendimento includono l'analisi e la categorizzazione di immagini e funzionalità basate sulla rete neurale e sul deep learning.

    Alcune branche della ricerca sulla visione artificiale sono molto simili allo studio della visione biologica. Molti rami della ricerca sull'IA sono anche molto simili allo studio della coscienza umana e all'applicazione delle conoscenze acquisite in precedenza per interpretare, integrare e utilizzare l'input visivo. Lo studio e la modellizzazione dei meccanismi fisiologici che sono alla base della percezione visiva nell'uomo e in altri animali è di competenza della disciplina accademica della visione biologica. D'altra parte, la visione artificiale è lo studio e la descrizione dei processi che vengono implementati nel software e nell'hardware che sono alla base dei sistemi di visione artificiale. La collaborazione interdisciplinare tra le scienze della visione biologica e della visione artificiale si è dimostrata vantaggiosa per entrambe queste aree.

    L'elaborazione del segnale è un'altra area di studio collegata alla visione artificiale. Nella visione artificiale, l'elaborazione di segnali a due o più variabili può essere naturalmente estesa dall'elaborazione di segnali a una variabile, spesso segnali temporali. Ciò consente un maggiore grado di flessibilità nell'analisi del segnale. Tuttavia, a causa delle caratteristiche uniche delle immagini, il campo della visione artificiale ha creato un'ampia varietà di tecniche che non possono essere analoghe all'elaborazione di segnali che includono solo una singola variabile. Questo, insieme al fatto che il segnale stesso è multidimensionale, crea un settore all'interno dell'elaborazione del segnale che rientra nell'ambito della visione artificiale.

    La navigazione robotica può includere la

    Ti è piaciuta l'anteprima?
    Pagina 1 di 1