E-book194 pagine1 ora
RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.
Di Mario Canton
Valutazione: 0 su 5 stelle
()
Info su questo ebook
L'utilizzo delle espressioni regolari non è molto diffuso tra autori, scrittori e redattori mentre programmatori, sviluppatori di codice e realizzatori di e-book ne fanno un frequente – e soddisfacente – impiego.
Questa succinta guida all'uso delle «regex» o «regexp» (acronimi di origine inglese da «regular expressions») o – più semplicemente – «RE», è stato pensato proprio per chi si occupa di scrivere o revisionare testi.
Molti editor e wordprocessor ormai incorporano la «modalità regex» per effettuare ricerche, estrazioni e sostituzioni di testo.
Sulle espressioni regolari esiste molto poco nella letteratura in lingua italiana; ben altra mole di documentazione è invece a disposizione se si conosce un po' l'inglese.
Chi vorrà approfondire potrà trovare nella bibliografia alla fine di questo testo ottimi suggerimenti per le opere a stampa, di cui – il più delle volte – i loro autori forniscono anche una versione digitale, se si preferisce questa modalità di lettura.
Cosa si può fare con le regex?
Per rispondere, basta considerare che la ricerca di «stringhe» (sequenze di caratteri) da parte di un computer è molto veloce ma estremamente rigida. Con le espressioni regolari diventa invece possibile:
– trovare se esistono nel testo determinate sequenze;
– localizzare stringhe di caratteri che combaciano con le sequenze e sostituirle con qualcosa di diverso;
– estrarre le stringhe che combaciano con le sequenze per poterle riutilizzare diversamente.
Per non annoiare troppo il lettore l'esposizione sarà legata per quanto possibile ad esempi pratici, con i quali saranno illustrate, di volta in volta, le varie funzionalità delle regex. Ovviamente gli esempi saranno quelli che normalmente si trovano di fronte autori, scrittori e redattori.
Questa succinta guida all'uso delle «regex» o «regexp» (acronimi di origine inglese da «regular expressions») o – più semplicemente – «RE», è stato pensato proprio per chi si occupa di scrivere o revisionare testi.
Molti editor e wordprocessor ormai incorporano la «modalità regex» per effettuare ricerche, estrazioni e sostituzioni di testo.
Sulle espressioni regolari esiste molto poco nella letteratura in lingua italiana; ben altra mole di documentazione è invece a disposizione se si conosce un po' l'inglese.
Chi vorrà approfondire potrà trovare nella bibliografia alla fine di questo testo ottimi suggerimenti per le opere a stampa, di cui – il più delle volte – i loro autori forniscono anche una versione digitale, se si preferisce questa modalità di lettura.
Cosa si può fare con le regex?
Per rispondere, basta considerare che la ricerca di «stringhe» (sequenze di caratteri) da parte di un computer è molto veloce ma estremamente rigida. Con le espressioni regolari diventa invece possibile:
– trovare se esistono nel testo determinate sequenze;
– localizzare stringhe di caratteri che combaciano con le sequenze e sostituirle con qualcosa di diverso;
– estrarre le stringhe che combaciano con le sequenze per poterle riutilizzare diversamente.
Per non annoiare troppo il lettore l'esposizione sarà legata per quanto possibile ad esempi pratici, con i quali saranno illustrate, di volta in volta, le varie funzionalità delle regex. Ovviamente gli esempi saranno quelli che normalmente si trovano di fronte autori, scrittori e redattori.
Correlato a RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.
Titoli di questa serie (3)
RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali. Valutazione: 0 su 5 stelle0 valutazioniRegEx 2: Il trattamento testi con le espressioni regolari Valutazione: 0 su 5 stelle0 valutazioniRegEx3: L'uso delle espressioni regolari nelle applicazioni e nei linguaggi Valutazione: 1 su 5 stelle1/5
Ebook correlati
Il foglio elettronico: ... Tips and tricks ... Valutazione: 0 su 5 stelle0 valutazioniProgrammare in Visual Basic (VB) Valutazione: 0 su 5 stelle0 valutazioniTecnologia e Progettazione per il mondo digitale e per il web III Valutazione: 0 su 5 stelle0 valutazioniFondamenti di programmazione in C# 11 Valutazione: 0 su 5 stelle0 valutazioniRegEx3: L'uso delle espressioni regolari nelle applicazioni e nei linguaggi Valutazione: 1 su 5 stelle1/5Kung-Fu A Linea Di Comando Valutazione: 0 su 5 stelle0 valutazioniPython: La Guida Per Imparare a Programmare. Include Esercizi di Programmazione.: Programmazione per Principianti, #1 Valutazione: 0 su 5 stelle0 valutazioniProgrammare in C: Introduzione pratica Valutazione: 0 su 5 stelle0 valutazioniElaborazione del linguaggio naturale con Python Valutazione: 0 su 5 stelle0 valutazioniCorso html. La base di ogni sito web Valutazione: 1 su 5 stelle1/5E così vuoi scrivere un ebook ... 2: ... e magari pubblicarlo. Rassegna dei molti problemi che dovrai affrontare e delle soluzioni che dovrai trovare. Valutazione: 0 su 5 stelle0 valutazioniHTML5 canvas in tempo reale Valutazione: 0 su 5 stelle0 valutazioniCorso Css. Dai stile al tuo sito web Valutazione: 0 su 5 stelle0 valutazioniTabelle Pivot per tutti. Dalle semplici tabelle alle Power-Pivot: Guida utile per la creazione delle Tabelle Pivot in Excel Valutazione: 0 su 5 stelle0 valutazioniSviluppare applicazioni ibride per dispositivi mobili Valutazione: 5 su 5 stelle5/5Il welfare per freelance non è una leggenda metropolitana: Cavarsela con l’INPS in caso di malattia, maternità e altri diritti Valutazione: 0 su 5 stelle0 valutazioniPedagogia dell'emancipazione e valutazione: Dare valore all'apprendimento: idee e pratiche Valutazione: 0 su 5 stelle0 valutazioniImpara il Francese: Francese per Bambini. Rana - Grenouille. Racconto Bilingue in Francese e Italiano. Valutazione: 0 su 5 stelle0 valutazioniESAME AVVOCATO 2017. Tecniche di redazione Atti e Pareri alla luce dei criteri di correzione dei Commissari – 2a Edizione Valutazione: 0 su 5 stelle0 valutazioni100 Modi di Dire & Proverbi INGLESI Valutazione: 0 su 5 stelle0 valutazioniHeidegger e l'abitare poetico: Per mortem ad vitam Valutazione: 0 su 5 stelle0 valutazioniSiti Web che NON funzionano - Dal progetto alla pubblicazione, tutti gli errori che penalizzano o annullano l'efficacia di un sito Web Valutazione: 0 su 5 stelle0 valutazioniTime on a Line. Il verbo inglese in 60 minuti Valutazione: 1 su 5 stelle1/5Le Tecniche per Chiudere una Vendita Valutazione: 0 su 5 stelle0 valutazioniProntuario di diritto dell'Unione Europea Valutazione: 0 su 5 stelle0 valutazioniLe lingue nelle facoltà di lingue. Tra ricerca e didattica Valutazione: 0 su 5 stelle0 valutazioniPadroneggiare l’inglese con 12 argomenti: Oltre 200 parole e frasi di livello intermedio con spiegazione Valutazione: 0 su 5 stelle0 valutazioniI Fratelli Karamazov Valutazione: 0 su 5 stelle0 valutazioniEsame Avvocato 2020-21. CASI DI DIRITTO PENALE: Con soluzioni schematiche dimostrte Valutazione: 3 su 5 stelle3/5
Riferimenti per voi
Il libro per i musicisti fai da te: Consigli tecnici e Aneddoti sul Mondo della Musica. Valutazione: 0 su 5 stelle0 valutazioniTarocchi Guida Completa Valutazione: 5 su 5 stelle5/5Verbi e punteggiatura Valutazione: 0 su 5 stelle0 valutazioniL'Arte di Comunicare Valutazione: 5 su 5 stelle5/5La grammatica fondamentale: Scrivere bene 1 Valutazione: 0 su 5 stelle0 valutazioniDizionario del sesso e dell'erotismo Valutazione: 5 su 5 stelle5/5La Divina Commedia e il simbolo nascosto Valutazione: 0 su 5 stelle0 valutazioniIl manuale del mozzo Valutazione: 0 su 5 stelle0 valutazioniCome si scrive una sceneggiatura Valutazione: 0 su 5 stelle0 valutazioniCome si scrive un film: Scrivere cinema 1 Valutazione: 0 su 5 stelle0 valutazioniPhrasal Verbs Valutazione: 0 su 5 stelle0 valutazioniSintetizzatori virtuali: Teoria e tecnica Valutazione: 0 su 5 stelle0 valutazioniScrivere ganzo!: Consigli per comunicare alla grande dal romanzo all'online Valutazione: 5 su 5 stelle5/5Vendere Handmade: Una guida completa per trasformare la tua passione in professione Valutazione: 0 su 5 stelle0 valutazioniL'idea narrativa: Scrivere narrativa 7 Valutazione: 0 su 5 stelle0 valutazioniGuida alle Droghe Magiche Valutazione: 0 su 5 stelle0 valutazioniScrivere con stile: Manuale avanzato di scrittura con esempi, esercizi, approfondimenti Valutazione: 0 su 5 stelle0 valutazioniCome fare editing Valutazione: 0 su 5 stelle0 valutazioniSchemi di diritto penale - parte generale Valutazione: 0 su 5 stelle0 valutazioniSi scrive così… o come? Valutazione: 0 su 5 stelle0 valutazioniLavorare da casa: Una guida completa al modello di business da scegliere per lavorare da casa Valutazione: 0 su 5 stelle0 valutazioniCreatività - Istruzioni per l'uso Valutazione: 4 su 5 stelle4/5La Tecnica Steiner Valutazione: 0 su 5 stelle0 valutazioniTutto fa branding: Guida pratica al personal branding Valutazione: 5 su 5 stelle5/5Tecniche e Metodologia della scrittura giuridica Valutazione: 0 su 5 stelle0 valutazioni101 cose da fare a Torino almeno una volta nella vita Valutazione: 0 su 5 stelle0 valutazioniNozioni di base sul vino Valutazione: 0 su 5 stelle0 valutazioniPresent Past Future: I tempi verbali in Inglese Valutazione: 0 su 5 stelle0 valutazioniPronto Soccorso e Naturopatia. Curarsi a casa con i prodotti della natura Valutazione: 0 su 5 stelle0 valutazioniAlla ricerca del Trend Valutazione: 0 su 5 stelle0 valutazioni
Recensioni su RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali.
Valutazione: 0 su 5 stelle
0 valutazioni
0 valutazioni0 recensioni
Anteprima del libro
RegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali. - Mario Canton
RegEx
per autori,
scrittori
e redattori
Guida operativa
all'utilizzo
delle espressioni regolari
nel trattamento
di testi digitali
— Edizione digitale 2016 —
a cura di Mario Canton
PROPRIETÀ INTELLETTUALE LETTERARIA RISERVATA
© Copyright 2016 by Mario Canton
1ª edizione digitale – 2016
––=ooOoo=––
Qualora si volesse condividere questo e-book con un’altra persona, si chiede cortesemente di scaricare una copia a pagamento per ciascuna delle persone a cui lo si vuole destinare.
Se si sta leggendo questo e-book e non lo si è acquistato, qualora risulti di gradimento, si chiede, per favore, di acquistarne anche una copia a pagamento, al fine di poter permettere la continuità e la crescita del lavoro e la possibilità di offrire sempre più titoli e una qualità sempre maggiore.
Grazie per l'aiuto e per aver rispettato il lavoro dell’autore, redattore ed editore di questo libro.
Data la rapidità con cui gli strumenti di sviluppo e i linguaggi vengono aggiornati, i contenuti di questo e-book si intendono fedeli allo stato dell’arte al momento della pubblicazione, come pure il livello di aggiornamento dei dati.
––=ooOoo=––
Nota
Se il Lettore fosse cortesemente disponibile a collaborare al miglioramento dell'opera, può segnalare qualsiasi refuso e/o errore operativo riscontrato nella lettura dell'e-book utilizzando una e-mail da inviare all'indirizzo dell'autore.
Si veda l'indirizzo in calce all'introduzione al testo o al colophon.
L'autore si impegna ad apportare quanto prima possibile le correzioni ritenute opportune o necessarie.
Si ringrazia sin d'ora per l'eventuale collaborazione.
––=ooOoo=––
Avvertenza
Ogni sforzo è stato fatto per rendere questo libro il più completo e il più accurato possibile, ma non è implicita alcuna garanzia sulla perfetta correttezza dei contenuti.
Le informazioni sono fornite «così come sono».
Pertanto, NON si assume alcune responsabilità per la perdita di dati o altri danni derivanti dall'applicazione delle informazioni contenute di questa pubblicazione.
––=ooOoo=––
Indice
Introduzione
Due parole sull'origine
L'utilizzo delle espressioni regolari
Terminologia
Differenti «motori» delle RegEx
Un prima prova con le RegEx
Gli operatori fondamentali per la ricerca
Un ricerca base
Il punto
Le cifre
Gli spazi
Gli insiemi di caratteri (set)
Le sequenze di caratteri [ - ]
Tutti i caratteri «tranne» [^ ]
Le parole
Ancore
I caratteri di una parola \w
Non-codici
I confini di una riga
I confini di tutto un testo
I quantificatori Uno o più caratteri: +
I quantificatori Zero o più caratteri: *
I quantificatori Zero o uno: ? (eventualità)
I quantificatori Il numero di ripetizioni: { }
Quantificatori avidi o pigri (greedy o lazy)
I raggruppamenti: Il riferimento all'indietro (backreference)
I raggruppamenti: I gruppi di espressioni (…)
I raggruppamenti: Il gruppo nominato (?P< > )
I raggruppamenti: Il gruppo passivo (?: )
I raggruppamenti: L'espressione condizionale (?: )
I raggruppamenti: L'alternativa: |
La codifica: Unicode
La codifica: ASCII
Guardarsi intorno (lookaround)
Guarda avanti se diverso (?! )
Guardarsi intorno (lookaround)
Guarda avanti se uguale (?= )
Guardarsi intorno (lookaround)
Guarda indietro (?
Caratteri particolari: bell \a (alarm)
Caratteri particolari: Carattere di controllo \c
Caratteri particolari: Carattere di escape \e
Caratteri particolari: Carattere form feed \f
Caratteri particolari: Caratteri a-capo e ritorno carrello \n e \r
Caratteri particolari: Caratteri di tabulazione \v e \t
Commento (?# )
I modificatori: Maiuscole e minuscole uguali /i
I modificatori: Modalità singola riga /s
I modificatori: Modalità multi-riga /m
Errori e incovenienti
Backtracking quantificatori possessivi e gruppi atomici
Individuare un file HTML completo
Ripetere un gruppo catturato e ragruppare un gruppo ripetuto
Le sostituzioni
Esempi
Individuare tag in (X)HTML
Eliminare gli spazi vuoti
Indirizzi IP
Individuare numeri in virgola mobile
Trovare e validare un indirizzo e-mail
Individuare una data valida
Individuare una intera linea di testo
Trovare linee che contengono (o non contengono) determinate parole
Cancellare linee duplicate in un file
Rimuovere parti duplicate in una stringa
Individuare commenti
Individuare stringhe
Individuare numeri
Individuare parole particolari o parole chiave
Trovare due parole vicine l’una all’altra
Espressioni regolari per e-book
Trasformare gli spazi doppi in spazi singoli
Cancellare tutti i tabulatori
Cancellare le linee bianche (con codifica Windows)
Eliminare gli spazi vuoti di inizio riga
Eliminare gli spazi vuoti a fine riga
Eliminare le interruzione di riga interne ai paragrafi
Inserire tutte le linee tra i tag di paragrafo «
Aggiungere una «class» alle interruzioni di sezione
Aggiungere un attributo «alt» a tutte le immagini
Sostituire «&» con «&»
Sostituire apostrofi normali con apostrofi orientati
Modificare la marcatura dei titoli
Cambiare il formato delle date
Trovare caratteri speciali
Trovare caratteri speciali (escludendo apici inclinati e lineette)
Aggiungere lo stile «centrato» alle interruzioni di sezione stile Markdown
Cancellare le linee bianche con esclusione dell’ultima
Aggiungere ai capitoli lo stile «capitolo»
Sostituire i tag segnaposto nei file XHTML provenienti da file di word processor
Prospetti riassuntivi di riferimento
Metacaratteri definiti con esempi
Escape di caratteri
Classi di caratteri
Modificatori
Lista di alcuni editor con le varianti di regex supportate
RegEx Tester, online e installabili
Bibliografia essenziale
Manuali generali
Manuali su Perl con parti specifiche sulle espressioni regolari
Manuali specifici
Alla memoria
del prof. Stephen Cole Kleene,
(* 5.1.1909 † 25.1.1994)
con somma gratitudine ...
... per tutta la fatica evitata,
per tutta la precisione ottenuta
e per tutto il tempo della mia vita
risparmiato e dedicato ad altro.
Introduzione
Non ricordo più quando è stato il momento preciso in cui ho scoperto le espressioni regolari, ma posso dire che da allora trattare testi è diventato molto meno faticoso.
L'utilizzo delle espressioni regolari non è molto diffuso tra autori, scrittori e redattori mentre programmatori, sviluppatori di codice e realizzatori di e-book ne fanno un frequente – e soddisfacente – impiego.
Questa succinta guida all'uso delle «regex» o «regexp» (acronimi di origine inglese da «regular expressions») o – più semplicemente – «RE», è stato pensato proprio per chi si occupa di scrivere o revisionare testi.
Delle regex esistono molte varianti (chiamate «flavours», letteralmente «sapori, gusti o aromi») ma sostanzialmente la logica è sempre la stessa e la sintassi non presenta moltissime differenze.
Qui sarà trattata la sintassi relativa alla libreria PCRE (Perl Compatible Regular Expressions) cioè a quelle istruzioni che sono accettate dai software che utilizzano un funzionamento delle regex compatibile con quello del linguaggio Perl, da cui peraltro le regex sono state destinate a un impiego operativo.
PCRE è una libreria sviluppata in linguaggio «C» ed è perciò estremamente efficiente e veloce.
Molti editor e word processor ormai incorporano la «modalità regex» per effettuare ricerche, estrazioni e sostituzioni di testo.
Un editor particolarmente utilizzato è Notepad++ ma anche il famosissimo Word di Microsoft, oppure l'open source LibreOffice (e il precedente OpenOffice) o ancora editor per
Ti è piaciuta l'anteprima?
Pagina 1 di 1