Scopri milioni di eBook, audiolibri e tanto altro ancora con una prova gratuita

Solo $11.99/mese al termine del periodo di prova. Cancella quando vuoi.

RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.
RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.
RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.
E-book194 pagine1 ora

RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.

Valutazione: 0 su 5 stelle

()

Leggi anteprima

Info su questo ebook

L'utilizzo delle espressioni regolari non è molto diffuso tra autori, scrittori e redattori mentre programmatori, sviluppatori di codice e realizzatori di e-book ne fanno un frequente – e soddisfacente – impiego.
Questa succinta guida all'uso delle «regex» o «regexp» (acronimi di origine inglese da «regular expressions») o – più semplicemente – «RE», è stato pensato proprio per chi si occupa di scrivere o revisionare testi.
Molti editor e wordprocessor ormai incorporano la «modalità regex» per effettuare ricerche, estrazioni e sostituzioni di testo.
Sulle espressioni regolari esiste molto poco nella letteratura in lingua italiana; ben altra mole di documentazione è invece a disposizione se si conosce un po' l'inglese.
Chi vorrà approfondire potrà trovare nella bibliografia alla fine di questo testo ottimi suggerimenti per le opere a stampa, di cui – il più delle volte – i loro autori forniscono anche una versione digitale, se si preferisce questa modalità di lettura.
Cosa si può fare con le regex?
Per rispondere, basta considerare che la ricerca di «stringhe» (sequenze di caratteri) da parte di un computer è molto veloce ma estremamente rigida. Con le espressioni regolari diventa invece possibile:
– trovare se esistono nel testo determinate sequenze;
– localizzare stringhe di caratteri che combaciano con le sequenze e sostituirle con qualcosa di diverso;
– estrarre le stringhe che combaciano con le sequenze per poterle riutilizzare diversamente.
Per non annoiare troppo il lettore l'esposizione sarà legata per quanto possibile ad esempi pratici, con i quali saranno illustrate, di volta in volta, le varie funzionalità delle regex. Ovviamente gli esempi saranno quelli che normalmente si trovano di fronte autori, scrittori e redattori.
LinguaItaliano
Data di uscita7 ott 2016
ISBN9788822853813
RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.

Leggi altro di Mario Canton

Correlato a RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.

Titoli di questa serie (3)

Visualizza altri

Ebook correlati

Riferimenti per voi

Visualizza altri

Articoli correlati

Recensioni su RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.

Valutazione: 0 su 5 stelle
0 valutazioni

0 valutazioni0 recensioni

Cosa ne pensi?

Tocca per valutare

La recensione deve contenere almeno 10 parole

    Anteprima del libro

    RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali. - Mario Canton

    RegEx

    per autori,

    scrittori

    e redattori

    Guida operativa

    all'utilizzo

    delle espressioni regolari

    nel trattamento

    di testi digitali

    — Edizione digitale 2016 —


    a cura di Mario Canton

    PROPRIETÀ INTELLETTUALE LETTERARIA RISERVATA

    © Copyright 2016 by Mario Canton

    1ª edizione digitale – 2016

    ––=ooOoo=––

    Qualora si volesse condividere questo e-book con un’altra persona, si chiede cortesemente di scaricare una copia a pagamento per ciascuna delle persone a cui lo si vuole destinare.

    Se si sta leggendo questo e-book e non lo si è acquistato, qualora risulti di gradimento, si chiede, per favore, di acquistarne anche una copia a pagamento, al fine di poter permettere la continuità e la crescita del lavoro e la possibilità di offrire sempre più titoli e una qualità sempre maggiore.

    Grazie per l'aiuto e per aver rispettato il lavoro dell’autore, redattore ed editore di questo libro.

    Data la rapidità con cui gli strumenti di sviluppo e i linguaggi vengono aggiornati, i contenuti di questo e-book si intendono fedeli allo stato dell’arte al momento della pubblicazione, come pure il livello di aggiornamento dei dati.

    ––=ooOoo=––

    Nota

    Se il Lettore fosse cortesemente disponibile a collaborare al miglioramento dell'opera, può segnalare qualsiasi refuso e/o errore operativo riscontrato nella lettura dell'e-book utilizzando una e-mail da inviare all'indirizzo dell'autore.

    Si veda l'indirizzo in calce all'introduzione al testo o al colophon.

    L'autore si impegna ad apportare quanto prima possibile le correzioni ritenute opportune o necessarie.

    Si ringrazia sin d'ora per l'eventuale collaborazione.

    ––=ooOoo=––

    Avvertenza

    Ogni sforzo è stato fatto per rendere questo libro il più completo e il più accurato possibile, ma non è implicita alcuna garanzia sulla perfetta correttezza dei contenuti.

    Le informazioni sono fornite «così come sono».

    Pertanto, NON si assume alcune responsabilità per la perdita di dati o altri danni derivanti dall'applicazione delle informazioni contenute di questa pubblicazione.

    ––=ooOoo=––

    Indice

    Introduzione

    Due parole sull'origine

    L'utilizzo delle espressioni regolari

    Terminologia

    Differenti «motori» delle RegEx

    Un prima prova con le RegEx

    Gli operatori fondamentali per la ricerca

    Un ricerca base

    Il punto

    Le cifre

    Gli spazi

    Gli insiemi di caratteri (set)

    Le sequenze di caratteri [ - ]

    Tutti i caratteri «tranne» [^ ]

    Le parole

    Ancore

    I caratteri di una parola \w

    Non-codici

    I confini di una riga

    I confini di tutto un testo

    I quantificatori Uno o più caratteri: +

    I quantificatori Zero o più caratteri: *

    I quantificatori Zero o uno: ? (eventualità)

    I quantificatori Il numero di ripetizioni: { }

    Quantificatori avidi o pigri (greedy o lazy)

    I raggruppamenti: Il riferimento all'indietro (backreference)

    I raggruppamenti: I gruppi di espressioni (…)

    I raggruppamenti: Il gruppo nominato (?P< > )

    I raggruppamenti: Il gruppo passivo (?: )

    I raggruppamenti: L'espressione condizionale (?: )

    I raggruppamenti: L'alternativa: |

    La codifica: Unicode

    La codifica: ASCII

    Guardarsi intorno (lookaround)

    Guarda avanti se diverso (?! )

    Guardarsi intorno (lookaround)

    Guarda avanti se uguale (?= )

    Guardarsi intorno (lookaround)

    Guarda indietro (?

    Caratteri particolari: bell \a (alarm)

    Caratteri particolari: Carattere di controllo \c

    Caratteri particolari: Carattere di escape \e

    Caratteri particolari: Carattere form feed \f

    Caratteri particolari: Caratteri a-capo e ritorno carrello \n e \r

    Caratteri particolari: Caratteri di tabulazione \v e \t

    Commento (?# )

    I modificatori: Maiuscole e minuscole uguali /i

    I modificatori: Modalità singola riga /s

    I modificatori: Modalità multi-riga /m

    Errori e incovenienti

    Backtracking quantificatori possessivi e gruppi atomici

    Individuare un file HTML completo

    Ripetere un gruppo catturato e ragruppare un gruppo ripetuto

    Le sostituzioni

    Esempi

    Individuare tag in (X)HTML

    Eliminare gli spazi vuoti

    Indirizzi IP

    Individuare numeri in virgola mobile

    Trovare e validare un indirizzo e-mail

    Individuare una data valida

    Individuare una intera linea di testo

    Trovare linee che contengono (o non contengono) determinate parole

    Cancellare linee duplicate in un file

    Rimuovere parti duplicate in una stringa

    Individuare commenti

    Individuare stringhe

    Individuare numeri

    Individuare parole particolari o parole chiave

    Trovare due parole vicine l’una all’altra

    Espressioni regolari per e-book

    Trasformare gli spazi doppi in spazi singoli

    Cancellare tutti i tabulatori

    Cancellare le linee bianche (con codifica Windows)

    Eliminare gli spazi vuoti di inizio riga

    Eliminare gli spazi vuoti a fine riga

    Eliminare le interruzione di riga interne ai paragrafi

    Inserire tutte le linee tra i tag di paragrafo «

    »

    Aggiungere una «class» alle interruzioni di sezione

    Aggiungere un attributo «alt» a tutte le immagini

    Sostituire «&» con «&»

    Sostituire apostrofi normali con apostrofi orientati

    Modificare la marcatura dei titoli

    Cambiare il formato delle date

    Trovare caratteri speciali

    Trovare caratteri speciali (escludendo apici inclinati e lineette)

    Aggiungere lo stile «centrato» alle interruzioni di sezione stile Markdown

    Cancellare le linee bianche con esclusione dell’ultima

    Aggiungere ai capitoli lo stile «capitolo»

    Sostituire i tag segnaposto nei file XHTML provenienti da file di word processor

    Prospetti riassuntivi di riferimento

    Metacaratteri definiti con esempi

    Escape di caratteri

    Classi di caratteri

    Modificatori

    Lista di alcuni editor con le varianti di regex supportate

    RegEx Tester, online e installabili

    Bibliografia essenziale

    Manuali generali

    Manuali su Perl con parti specifiche sulle espressioni regolari

    Manuali specifici

    Alla memoria

    del prof. Stephen Cole Kleene,

    (* 5.1.1909 † 25.1.1994)

    con somma gratitudine ...

    ... per tutta la fatica evitata,

    per tutta la precisione ottenuta

    e per tutto il tempo della mia vita

    risparmiato e dedicato ad altro.

    Introduzione

    Non ricordo più quando è stato il momento preciso in cui ho scoperto le espressioni regolari, ma posso dire che da allora trattare testi è diventato molto meno faticoso.

    L'utilizzo delle espressioni regolari non è molto diffuso tra autori, scrittori e redattori mentre programmatori, sviluppatori di codice e realizzatori di e-book ne fanno un frequente – e soddisfacente – impiego.

    Questa succinta guida all'uso delle «regex» o «regexp» (acronimi di origine inglese da «regular expressions») o – più semplicemente – «RE», è stato pensato proprio per chi si occupa di scrivere o revisionare testi.

    Delle regex esistono molte varianti (chiamate «flavours», letteralmente «sapori, gusti o aromi») ma sostanzialmente la logica è sempre la stessa e la sintassi non presenta moltissime differenze.

    Qui sarà trattata la sintassi relativa alla libreria PCRE (Perl Compatible Regular Expressions) cioè a quelle istruzioni che sono accettate dai software che utilizzano un funzionamento delle regex compatibile con quello del linguaggio Perl, da cui peraltro le regex sono state destinate a un impiego operativo.

    PCRE è una libreria sviluppata in linguaggio «C» ed è perciò estremamente efficiente e veloce.

    Molti editor e word processor ormai incorporano la «modalità regex» per effettuare ricerche, estrazioni e sostituzioni di testo.

    Un editor particolarmente utilizzato è Notepad++ ma anche il famosissimo Word di Microsoft, oppure l'open source LibreOffice (e il precedente OpenOffice) o ancora editor per

    Ti è piaciuta l'anteprima?
    Pagina 1 di 1