Utiliser la correspondance RegEx dans la segmentation
Génération en cours…
Cette fonctionnalité est en cours de déploiement et n’est pas encore disponible pour tous les comptes.
Définition Regex Matching
La correspondance Regex vous permet de filtrer les profils en fonction de modèles de texte plutôt que de valeurs exactes. Cela permet de trouver des profils qui suivent un format spécifique, comme des adresses e-mail provenant de certains domaines ou des numéros de téléphone dans un format particulier.
⚠️ Important : Regex correspond toujours à la valeur complète du début à la fin.
Comment utiliser Regex
Comment utiliser Regex
Lorsque vous créez un segment, vous pouvez utiliser deux opérateurs regex :
- Correspond à l’expression rationnelle : inclut les profils dont la valeur correspond à votre expression rationnelle.
- Ne correspond pas à l’expression régulière - Inclut les profils dont la valeur ne correspond PAS à votre expression régulière
Il peut être utilisé dans les conditions de segment suivantes :
- Propriétés concernant une personne (y compris les objets personnalisés)
2. Filtres sur « Ce que quelqu’un a fait ou n’a pas fait » et « Mesures prises par une personne dans un ordre spécifique »
Bases de Regex
Bases de Regex
Caractères correspondants
- Lettres et chiffres - Saisissez normalement : bonjour correspond à « bonjour »
- N’importe quel chiffre - Utilisez \d pour faire correspondre n’importe quel nombre 0-9
- Toute lettre : utilisez [a-z] pour les minuscules, [A-Z] pour les majuscules ou [a-zA-Z] pour les deux
- Soit/ou - Utiliser | pour faire correspondre les options : gmail|yahoo fait correspondre « gmail » ou « yahoo »
- Tout - Utilisez .* pour faire correspondre vos caractères
Caractères spéciaux
Ajoutez une barre oblique inverse \ avant ces éléments pour les faire correspondre littéralement :
- Période : \. correspond à une période
- Signe plus : \+ correspond à un signe plus
- Les parenthèses : \( et \) correspondent aux parenthèses
Tendances Répétitives
- {5} - Exactement 5 fois (par exemple, \d{5} correspond à 5 chiffres)
- {2,4} - Entre 2 et 4 fois
- ? - Facultatif (0 ou 1 fois)
Remarque : nous limitons les répétitions à 1 000 répétitions maximum.
Exemples courants
Exemples courants
Adresses e-mail
- Domaine spécifique :
- .*@exemple\.com
- Matchs : john@example.com, support@example.com
- Plusieurs domaines :
- .*@(gmail|yahoo|hotmail).com
- Matchs : user@gmail.com, user@yahoo.com, user@hotmail.com
- Tout .com e-mail :
- .*@.*\.com
Numéros de téléphone
- Numéro américain à 10 chiffres
- \d{10}
- Correspondances : 5551234567
- Formaté avec des parenthèses :
- \(\d{3}\) \d{3}-\d{4}
- Matchs : (555) 123-4567
Codes postaux
- ZIP à 5 chiffres :
- \d{5}
- Correspondances : 12 345
- ZIP+4 :
- \d{5}-\d{4}
- Matchs : 12345-6789
Pour les références avancées : notre implémentation utilise Google RE2 comme norme. En savoir plus ici.
Limites d’enregistrement
Limites d’enregistrement
| Limite | Valeur | Exemple |
| Longueur Regex | 1 000 caractères maximum | - |
| Lignes Regex | 100 lignes maximum | - |
| Répétitions | 1 000 répétitions maximum | \d{1000} autorisé \d{1001} non autorisé |
| Options (|) | 5 max au niveau principal | a|b|c|d|e|f dépasse la limite (6 options) |
| Profondeur d’imbrication | 5 niveaux maximum | ((((a)))) est de 4 niveaux, autorisé |
En outre, les fonctionnalités suivantes ne sont pas prises en charge pour le moment.
| Fonctionnalité | Exemple |
| Lookahead/Lookbehind | (?=...), (?!...), (?<=...), (?<!...) |
| Backreferences | \1, \2, (\w+)\s+\1 |
| Échappements Unicode | \uXXXX, \u00A0 |
| Quantificateurs imbriqués | (a+)+, (x*)*, (a{2,5})+ |
Conseils
Conseils
1. Regex correspond à la valeur complète
Votre regex doit décrire l’ensemble de la valeur, et pas seulement une partie.
Erreur : gmail\.com (ne correspond qu’au texte « gmail.com »)
À droite : .*@gmail\.com (correspond à des e-mails complets tels que john@gmail.com)
2. Toujours éviter les périodes
Lorsque .com correspond, .net, etc., écrivez-le comme \.com avec une barre oblique inverse.
Faux : @gmail.com (le point correspond à n'importe quel caractère)
Droite : @gmail\.com (correspond à la période littérale)
3. Utiliser .* pour « N’importe quoi »
Associez tous les caractères avec .*
- .*@company\.com - Tout e-mail à l’adresse company.com
- \+.* - Tout ce qui commence par +
- .*urgent.* - Texte contenant « urgent »
4. Commencez simplement, puis affinez
Commencez par un regex de base et ajoutez des détails progressivement.
- Exemple : .*@gmail\.com → [a-z]+\.[a-z]+@gmail\.com
Fractionner la logique complexe en plusieurs filtres simples lorsque cela est possible.
- Exemple pour « Gmail ou Yahoo emails from California » :
- Filtre 1 : Email correspond à regex .*@(gmail|yahoo)\.com
- Filtre 2 : État équivaut à Californie
5. RegEx est sensible à la casse par défaut
Si vous souhaitez rendre une instruction insensible à la casse, vous pouvez ajouter (?i) comme préfixe.
- Correspondance des produits (?i)^iphone$
Quand utiliser RegEx vs Opérateurs de Standard
Quand utiliser RegEx vs Opérateurs de Standard
Utilisez l’expression rationnelle lorsque vous avez besoin de correspondre à des formats ou des modèles spécifiques. Pour des besoins plus simples, nous vous recommandons vivement d’utiliser des opérateurs standard :
- Contient - Le texte apparaît n’importe où
- Commence par - Correspond au début
- Se termine par - Correspond à la fin
- Équivaut à - Correspondance exacte