• Skip to primary navigation
  • Skip to main content
  • Skip to primary sidebar
  • Skip to footer

Geekebrains

Para programadores, maker y geeks en general

  • Inicio
  • Code Brains
  • Zona Makers!
  • Code & Beers
  • GeekeHistorias
  • GeekeBlocks
  • Qué es …?
You are here: Home / Code Brains / Expresiones regulares

2 febrero, 2020 Por admin8049

Expresiones regulares

Tienes dos problemas. ,-)

Si quieres utilizarlas lo mejor es meter unas muestras de los textos que quieres analizar en un editor de textos que permita buscar por expresiones regulares (Sublime, Atom, …) y probar desde ahí. Pero para entender lo que estas haciendo la página de Odio las Expresiones Regulares http://ihateregex.io/ es increible. Yo era uno de esos… y ahora alucino con su potencial.

MetacarácterDescripción
.Cualquier carácter excepto salto de linea
*Indica que el carácter precedente puede ocurri 0 o más veces.
+Indica que el carácter precedente puede ocurri 1 o más veces.
?Indica que el carácter precedente puede ocurrir 0 o 1 vez.
Hace que el metacaracter anterior sea perezoso (lazy). 
[Abre un set de caracteres
]Cierra un set de caracteres
^Niega un set de caracteres ( como en [^0-9] )
–Define un set de caracteres ( de 0 a 9: [0-9] )
{Comienza la repetición cuantificada del carácter precedente {min,max}
}Acaba la repetición cuantificada del carácter precedente {min,max}
(El comienzo de un grupo de caracteres.
)El fin de un grupo de caracteres.
|Alterna entre uno y otro carácter
El carácter de escape
(Escape character)

Characters específicos

CarácterDescripciónEquivalente
wEncuentra un carácter alfanumérico, incluido el guión bajo ( _ )[a-z
A-Z0-9_]
WEncuentra cualquier carácter NO alfanumérico[^a-z
A-Z0-9_]
dEncuentra un dígito[0-9]
DEncuentra cualquier carácter que NO es un dígito.[^0-9]
sEncuentra un espacio en blanco[ trn]
SEncuentra cualquier carácter que NO es un espacio en blanco.[^ trn]
bEncuentra una coincidencia al inicio o al final de una palabra. 
BEncuentra una coincidencia que NO està al inicio o al final de una palabra. 
Encuentra un carácter NUL 
nSalto de línea (new line) 
fSalto de página (feed) 
rRetorno de carro (return) 
tTabulador 
vTabulador vertical 
xxxRepresenta un carácter especificado por un número octal xxx 
xddRepresenta un carácter especificado por un número hexadecimal dd 
uxxxxRepresenta un carácter Unicode especificado por un número hexadecimal xxxx 

Declaraciones
(Assertions)

 Descripción
?=declaración positiva de búsqueda hacia delante
(positive lookahead assertion)
/(?=prematuro)pre/ encuentra pre de prematuro
pero no pre de precavido
/pre(?=maturo)/ encuentra pre de prematuro
pero no pre de precavido
?!declaración negativa de búsqueda hacia delante
(negative lookahead assertion)
/(?!prematuro)pre/ encuentra pre
pero no de prematuro
/pre(?!maturo)/ encuentra pre
pero no de prematuro
?<=declaración positiva de búsqueda hacia atras
(positivee lookbehind assertion)
Soporte:
Si: .NET, Java, Perl, PHP, Python, Ruby 1.9
No:.JavaScript, Ruby 1.8, Unix
/(?<=balon)mano/ encuentra -mano de balonmano
pero no de antemano
?<!declaración negativa de búsqueda hacia atras
(negative lookbehind assertion)
Soporte:
Si: .NET, Java, Perl, PHP, Python, Ruby 1.9
No:.JavaScript, Ruby 1.8, Unix
/(?<!balon)mano/ encuentra -mano
pero no de balonmano

Comodines UNICODE

Soporte:
Si: Java, .NET, Perl, PHP, Ruby
No: JavaScript, Python, Unix

 Descripción
XCarácter comodin Unicode.
Encuentra cualquier carácter incluso salto de linea.
p{xx}Un carácter con la propiedad xx
P{xx}Un carácter sin la propiedad xx
Mp{M} Marca (acentos, tilde…etc)
Lp{L} Letra (incluye las letras accentuadas, la ñ…etc)
Np{N} Numero
Sp{S} Símbolo
Cp{C} Otros
ModificadoresDescripción
iInsensible a las mayúsculas y minúsculas W (case insensitive)
gBusqueda global (global match)
mBusqueda en multiples líneas de texto. (Multiple lines)
sIncluye saltos de línea. Sin él, las nuevas líneas son excluidas.

Clases de Carácteres (Ranges)

ExpressionDescripción
[abc]Encuentra uno de los caracteres entre corchetes
[^abc]Encuentra cualquier carácter que NO esté entre corchetes
[0-9]Encuentra un dígito de 0 a 9
[^0-9]Encuentra cualquier carácter que NO sea un dígito de 0 a 9
[A-Z]Encuentra cualquier carácter de
A mayuscula a Z mayuscula
[a-z]Encuentra cualquier carácter de
a minuscula a z minuscula
[A-z]Encuentra cualquier carácter de
A mayuscula a z minuscula
[adgk]Encuentra uno de los caracteres entre corchetes
[^adgk]Encuentra cualquier carácter que NO esté entre corchetes
(a|b)a o b
(…)Se utilizan para agrupar partes de una expresión.

Cuantificadores

El metacarácter ? (detras de otro metacarácter) hace que una expresión regular, habitualmente codiciosa (greedy), se convierta en perezosa (lazy), y resulte en la cadena más corta posible que coincida con ella.

GreedyLazyDescripcion
**?0 o más veces
++?1 o más veces
???0 o 1 veces
{ n }{ n }?n veces
{ n ,}{ n ,}?n o más veces
{ n , m }{ n , m }?De n a m veces

Anclas

MetacarácterDescripción
^Comienzo de una línea
$Final de una línea
AComienzo de una cadena de texto (string). Nunca final de línea.
(Soporte: Java, .NET, Perl,PHP, Python,Ruby)
ZFin de cadena de texto (string). Nunca final de línea.
(Soporte: Java, .NET, Perl,PHP, Python,Ruby)
bPrincipio o final de palabra (Word boundary)
BNO al principio o al final de una palabra

Retroreferencias (backreference)

Para designar una retroreferencia (backreference), a veces utilizamos la barra inversa (  ), otras veces el dólar ( $ ), dependiendo del lenguaje que se utilice.

 Descripción
$nnn-ésimo grupo no pasivo (no-passive group)
$22«xyz» en /^ (abc)(xyz) $/
$22«xyz» en /^ (abc(xyz)) $/
? cambia el significado del grupo
: el significado del grupo es: pasivo
?: especifica un grupo pasivo
(passive group / non-capturing group)
$11«xyz» en /^ (?:abc)(xyz) $/
(porque el primer grupo es pasivo)

POSIX
(Portable Operating System Interface)

Manera correcta de utilizarlos:
[[:alpha:]] or [^[:alpha:]].

Soporte:
SI: Perl, PHP, Ruby, Unix
NO: Java, JavaScript, .NET, Python

POSIXDescripción
[:alpha:]Caracteres alfabeticos
[a-zA-Z]
[:digit:]Dígitos
[0-9]
[:alnum:]Caracteres alfanuméricos
[a-zA-Z0-9]
[:lower:]Letras minúsculas
[a-z]
[:upper:]Letras mayúsculas
[A-Z]
[:word:]Letras, números y el guion bajo
[A-Za-z0-9_]
[:punct:]Punctuacion y símbolos.
[!»#$%&'()*+,-./:;<=>?@[\]^_`{|}~]
[:space:]Espacios en blanco, incluido <br />
[ trnvf]
[:blank:]Espacio y tabulador
[ t]
[:print:]Caracteres visibles y espacios (i.e: excepto los carácteres de control)
[x20-x7E]
[:graph:]Caracteres visibles (i.e: excepto espacios, carácteres de control, etc.)
[x21-x7E]
[:xdigit:]Dígitos hexadecimales
[A-Fa-f0-9]
[:ascii:]Caracteres ASCII
[x00-x7F]
[:cntrl:]Caracteres de control
[x00-x1Fx7F]

Filed Under: Code Brains Tagged With: Expresiones regulares

Previous Post: « Java (chuleta)
Next Post: Spring Framework de Java »

Primary Sidebar

Categorías

  • Code & Beers
  • Code Brains
  • Cómo …?
  • Experimentos
  • GeekeBlocks
  • GeekeHistorias
  • Noticias Geek
  • Proyectos
  • Qué es …?
  • Quién es …?
  • Zona Junior!
  • Zona makers!

Etiquetas

Antipatrones de diseño de software Arduino Arquitectura de software base64 Bases de Datos cert Certificados Digitales Clean Code control de acceso DBeaver Diseño de Software docker docker-compose Domain Drive Design Edición de video https IDE Java javascript jest JSON lenguajes de programación Librerías de JavaScript MongoDb MySQL NodeJS NoSQL odoo openssl Oracle package.json Patrones de Diseño de Software pem plugins Postgres Prettier ReactJS seguridad Serverless shell SSL testing TypeScript utilidades de software Visual Studio Code

Entradas recientes

  • CAPTCHA y por qué es importante para la seguridad en línea
  • Cómo mokear una clase que se instancia dentro de otra que necesitas testear y no se pasa por injección?
  • tsconfig paths con Typescript en Serverless
  • Serverless, un framework para todos los proveedores
  • Serverless, otro enfoque de desarrollo
  • Que es currying en Javascript
  • Noticias Junio 2023. Vuelta a la oficina, Million.js, Linux Azure, Apple Vision, Java 21…
  • 23.3 WS:IA-JS Creando un Blog en React con chatGPT.
  • 23.2 IA. Cómo va a afectar a nuestros empleos?
  • 23.1 IA. En que punto estamos y como hemos llegado hasta aquí.
Jesús A. Carballo Santaclara

Empezé trasteando en los 80' con un ZX espectrum, después pasé al potente "PC 8086" (jeje...). He trabajado haciendo software para la administración pública, para Hospitales, el sector de la Automoción, el sector Bancario, en algún e-Commerce de alguna multinacional y he emprendido en robótica educativa y en buscadores web.
Trabajo de forma profesional en esto de los ordenadores desde hace mas de 25 años espero poder contarte alguna cosa interesante.

Footer

Copyright © 2025 · GeekeZonia · Aviso Legal · Política de Cookies · Política de Privacidad · Log in