Регулярные выражения помогают при обработке текста внутри программы ZennoPoster или любой другой, которая поддерживает данный синтаксис и структуру (Notepad++).
Кроме того, при помощи "регулярок" можно "вытащить" из огромного куска текстовых данных, например, ТОЛЬКО телефоны, ТОЛЬКО email или любые другие данные, а затем софт ZennoPoster положит их красиво в таблицу формата CSV или XLSX.
Помимо очевидных плюсов, автоматизации действий и сокращения времени на поиск нужных элементов на страницах сайта или обычного текста, вы получаете полностью готовый комплект, которым удобно пользоваться, а также софт постоянно совершенствуется (к примеру, сейчас уже выпущена 7 версия продукта, где можно указать темную и светлую тему в настройках). Но, вернемся к регулярным выражениям - они созданы для облегчения нахождения нужного куска текста, формальный язык поиска и осуществления манипуляций с подстроками в тексте, основанный на использовании метасимволов (символов-джокеров, англ. wildcard characters). При этом, не все такие выражения подходят в каждой программе, поэтому нужно читать руководство пользователя прежде чем начнете поиск каких-либо данных.
[maxbutton id="3" text="ZennoPoster" url="/af-zenno" linktitle="External link | Внешняя ссылка" window="new" nofollow="true"]
ZennoPoster хорош тем, что у вас под рукой всегда (при нажатии клавиши F3 внутри софта) лежит инструмент, который предоставляет тестирование регулярных выражений, и вы видите что получается на выходе, потому не приходится тысячу раз вводить различные варианты "регулярок". Как по мне, это лучший вариант, когда вы только начинаете знакомиться с такими сложными схемами взаимодействия текста и вывода данных.
Что умеют делать регулярные выражения?
Сами по себе, конечно, ничего не умеют делать, а вот в комплексе с программным обеспечением - очень даже много. Например, частой задачей является удаление тегов HTML из текста, скопированного откуда-то (это могут быть таблицы или обычные параграфы). Рассмотрим для начала софт Notepad++, где можно менять данные в тексте как через обычный поиск, так и через поиск "регулярок".
https://www.youtube.com/embed/92Q8puE4jC0
Но вот при объемных кусках текста, например, кода страниц HTML, уже возникают проблемы с обработкой, т.к. не всегда удобно парсить его по частям. Именно тогда и приходит на помощь уникальный инструмент под названием ZennoPoster. Рассмотрим с вами пример, когда из кода страницы берется JSON формат (если он, конечно, присутствует на странице), т.к. внутренняя функция парсинга данного формата позволяет работать с данными более гибко и быстрее, чем с обычным текстом.
Итак, копируем текст, нажав на кнопки CTRL + U (в браузере Chrome), далее вставляем его внутри программы (клавиша F3 в ЗенноПостере и функционал "Конструктор регулярных выражений"). Теперь смотрим как это работает... Находим через CTRL + F для начала "JSON", собственно конец и начало.
[maxbutton id="3" text="ZennoPoster" url="/af-zenno" linktitle="External link | Внешняя ссылка" window="new" nofollow="true"]
[maxbutton id="3" text="ZennoPoster" url="/af-zenno" linktitle="External link | Внешняя ссылка" window="new" nofollow="true"]
Берем блок с обработкой текста, вставляем полученное ранее значение в поле данных и выбираем их парсинг. После этого у вас должны появиться структурированные ячейки, где указаны для каждой формулы собственные наименования. Что это нам дает в итоге? Все очень просто - у нас с вами структурированные числа, строки и т.п., которые можно одним действием поместить в таблицу, SQL и т.д., не вычисляя отдельные элементы на странице и не привязываясь к идентификаторам объектов на них. Т.е. к примеру разработчик сайта решил поменять стиль сайта или поменять классы у DIV, то поиск стандартным путем становится затруднительным (хотя в ZennoPoster есть и новая функция - поиск элемента на странице с помощью xpath, но как показывает практика, такой подход не всегда эффективен).
Вернемся к регуляркам
Где конкретно можно использовать такие выражения? Например, удобно выбрать ссылку в письме, если вы не знаете ее, но уверены, что она должна вести на определенную страницу или начинаться с нужного аlреса url - в этом случае поможет поиск через знакомую опцию "Конструктор регулярных выражений", а затем на основе полученного выражения уже можно вставить его в блок "Получить почту".
Рассмотрим другие примеры:
- получение телефонов из кучи неразобранного текста;
- получение электронных адресов после парсинга страниц;
- взять списки имен, фамилий, дат рождений и прочих контактных данных путем парсинга JSON формата или HTML;
- использование API, SMS и других полезных функций при обработке больших объемов данных.
Больше - лучше!
Это еще не все! Возможности Зеннопостера удивляют, т.к. софт может сделать практически что угодно, а что касается "регулярок", то у вас в запасе есть интересная опция "Групповые регулярные выражения". С помощью нее вы будете разделять по группам текстовые данные и любые другие, которые разделены между собой определенными символами. Более подробно об этой замечательной функции можно прочитать тут.
Основные команды
[maxbutton id="3" text="ZennoPoster" url="/af-zenno" linktitle="External link | Внешняя ссылка" window="new" nofollow="true"]
Was this helpful?