ru_vds Dec 4 2017 at 09:01

Основы регулярных выражений в JavaScript

10 min

48K

RUVDS.com corporate blogWebsite development*Entertaining tasksJavaScript*

Tutorial

Translation

+22

Comments 20

LoadRunner Dec 4 2017 at 09:29

Мощная картинка для привлечения внимания :) Осторожно, может засосать!

А если кого-то всё же засосало, то есть замечательный сайт — regexcrossword.com

gonzazoid Dec 4 2017 at 10:14

Спасибо тебе, добрый человек! Зашел собственно задать этот вопрос и получить этот ответ )

cypok Dec 5 2017 at 03:43

И вот ссылка на конкретно кроссворд с КДПВ: https://regexcrossword.com/playerpuzzles/8cbea27f-c4c5-4d11-a509-6a622ba01107

vesper-bot Dec 4 2017 at 10:02

Если меня не глючит, кроссворд с КДПВ не имеет решений: регулярка «P+(..)\1.*» требует двух символов между последовательностью «P» и единицей, однако 1 не может появиться в 4й позиуии из-за горизонтального ограничения (O|RHH|MM)*, следовательно, во второй позиции должна быть Р, а её уже не дает поставить вторая строка (DI|NS|TH|OM)*. А в третьей позиции единица хотя и может появиться, но регулярка не дает, потому что минимум первая позиция должна быть занята символом «Р».

AnutaU Dec 4 2017 at 10:15

Имеет. Когда меня засосало в прошлый раз, я его решила.

JokerNN Dec 4 2017 at 10:37

Видимо всё-таки глючит, потому что \1 означает не единицу, а первую группу захвата (matching group) — то есть должно совпасть то же самое что совпало в (..)

Dim0v Dec 4 2017 at 10:37

\1 — это первая группа, а не строка "\1" буквально. Т.е. регулярка "P+(..)\1.*" означает:
1) один или больше симоволов "P", затем
2) два произвольных символа, затем
3) снова те-же 2 символа из пункта 2, затем
4) любое количество произвольных символов.

vesper-bot Dec 4 2017 at 10:45

Спасибо, пошел дальше решать :)

AnutaU Dec 4 2017 at 10:43

Включу режим ботана-теоретика и позанудствую немного. Большинство тьюториалов по регулярным выражениям — это список обозначений и примеры с пояснениями, что в общем-то хорошо. Но мне кажется, что для достижения просветления всё-таки нужна теория: регулярные языки, конечные автоматы и вот это всё. Это важно, например, для того, чтобы понимать, какие задачи регулярками решать нельзя, чтобы не попадаться в ловушки вроде «проверить правильность расстановки скобок в выражении с помощью регулярок».

mickvav Dec 4 2017 at 16:08

Хм, а на перловских регулярных выражениях с илайн-кодом, вероятно, все-таки можно.

AnutaU Dec 4 2017 at 16:18

То, что описывают перловские регулярные выражения, строго говоря, уже не будет являться регулярными языками (в общем случае, естественно).

domix32 Dec 4 2017 at 12:22

помогло ли вам это знакомство в реальных проектах.

Использую регулярки в основном для поиска/автозамены специфичных токенов в каких-нибудь логах или коде. grep'ы туда же

XanderBass Dec 4 2017 at 15:00

Интересно, каких бед может натворить вещество с такой формулой?

RusXP Dec 4 2017 at 16:04

Тут разжевано до нельзя
ru.wikipedia.org/wiki/%D0%A0%D0%B5%D0%B3%D1%83%D0%BB%D1%8F%D1%80%D0%BD%D1%8B%D0%B5_%D0%B2%D1%8B%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F

gdt Dec 5 2017 at 04:34

Регулярки удобно использовать в основном для поиска/замены шаблонных конструкций, при этом желательно сохранять небольшой размер выражения, чтобы можно было потом разобраться. Мне как-то приходилось на .net регулярках делать разбор, например, валидного набора объявлений переменных с тем, чтобы регулярка падала ровно на месте первой синтаксической ошибки — вот это ад и израиль, никогда не делайте таких вещей в реальных проектах.
Вот код если кому интересно

rafuck Dec 5 2017 at 05:16

Навскидку выглядит так, будто список realTypes не нужен.

gdt Dec 5 2017 at 06:11

Всегда есть простор для оптимизации, мне надо было сдать побыстрее

Kazurus Dec 5 2017 at 09:14

Может профи подскажут, как разбить текст по n символов, но чтобы слова, точки и запятые оставались на своих местах? Или тут одной регуляркой не обойтись?

ainoneko Dec 6 2017 at 05:54

разбить текст по n символов, но чтобы слова, точки и запятые оставались на своих местах

Я даже не понимаю, что здесь требуется.

Kazurus Jan 16 2018 at 20:46

1. Разбить текст, например, 10 символов максимальная длина части.
2. Запятые, точки и тд должны прилипать к словам, а не уходить в следующую часть.
Пример: Очень, длинный. Текст.
Итог: 1. Очень, 2. длинный. 3. Текст.