Регулярные выражения — это формальный язык поиска и действий с подстроками в тексте, который базируется на использовании метасимволов (символов-«джокеров», англ. wildcard characters). При поиске актуально использовать строку-образец (от англ. «pattern»— «шаблон», «маска»), состоящую из метасимволов и символов, а также задающую правило поиска. Для действий с текстом необходимо прописывать строку замены, которая может содержать в себе специальные символы.
Регулярные выражения необходимы при сортировке больших объемов текстовой информации по заранее известным параметрам, или чтобы найти в строке определенный фрагмент — например, при парсинге данных, составлении семантического ядра, подготовке целей и фильтров в аналитических системах.
Система регулярных выражений была разработана в 1997 году создателями языка программирования С. Изначально регулярные выражения применяли в библиотеке PCRE языка Perl. Но регулярные выражения оказались настолько удобными, что затем их начали применять и в других языках— JavaScript, PHP, Java, C++ и т. д. Сама библиотека PCRE была включена в Google Analytics. Она не требует больших вычислительных мощностей, проста в освоении и использовании.
Работа с регулярными выражениями возможна также в редакторе таблиц Excel, различных текстовых редакторах.
Особое значение регулярные выражения имеют при фильтрации данных текстового типа. Их применение актуально для разработки парсеров строк — синтаксических анализаторов.
Регулярные выражения часто находят применение и в сфере интернет-маркетинга. Специалисты по аналитике используют механизм для фильтрации текстовых данных, настройки вида отчетов. Инструменты аналитики — Яндекс.Метрика и Google Analytics — позволяют пользоваться регулярными выражениями:
Поисковый запрос, который пишут с использованием регулярных выражений, называют шаблоном. В принципе, регулярными выражениями можно пользоваться как обычным поиском, и шаблон «слон» найдёт все случаи, когда в тексте встречается «слон». Однако существует и набор специальных символов, которые позволяют искать что-то более сложное.
Значительная часть символов в регулярных выражениях представляют сами себя. Исключение составляют специальные символы. Дополнение в виде обратной косой черты «\»необходимо, если последние нужно представить в качестве текстовых символов.
Спецсимволы встречаются без обратной косой черты. Это означает, что им подставлены особые значения: