Мой вопрос похож на this, но я ищу что-то R конкретное. У меня есть data.frame из десятков тысяч адресов, и мне нужно вытащить почтовые индексы. Почтовые индексы находятся в Великобритании и имеют формат {LETTER_LETTER_DIGIT LETTER_LETTER_DIGIT}. Аналогично следующему:
"8, Longbow Close, \ r \ nHarlescott Lane, \ r \ nShrewsbury, \ r \ nEngland, \ r \ nSY1 3GZ"
Я безрезультатно использовал варианты этого кода с stringr:
str_extract('^(\\[Gg]\\[Ii]\\[Rr] 0\\[Aa]{2})|(((\\[A-Za-z]\\[0-9]{1,2})|((\\
[A-Za-z]\\[A-Ha-hJ-Yj-y]\\[0-9]{1,2})|((\\[AZa-z]\\[0-9]\\[A-Za-z])|(\\[A-Za-
z]\\[A-Ha-hJ-Yj-y]\\[0-9]?\\[A-Za-z]))))\\[0-9]\\[A-Za-z]{2})$',alfa$Address)
^и$. Удалите их или замените на\\bи используйтеstr_extract_all. И поменяйте местами аргументы, первый - ввод, второй - регулярное выражение. И не избегайте[, это начало класса символов. - person Wiktor Stribiżew   schedule 25.04.2018^и$и использованияstr_extract_allя получаюcharacter(0). - person elliot   schedule 25.04.2018[совпадают как буквальные[. Уберите побеги. Почему вы изменили регулярное выражение в сообщении, на которое указали ссылку? - person Wiktor Stribiżew   schedule 25.04.2018