Публикации по теме 'parsing'


Основы парсера
Грамматики и синтаксические деревья Это введение в синтаксический анализ охватывает контекстно-свободные грамматики и синтаксические деревья на базовом уровне. Достаточно просто понять комбинаторы парсеров, которые будут представлены в следующем сообщении блога . Парсеры Парсер принимает входные данные и преобразует их в результат, как функция. Входные данные парсера - это текст на языке, который он понимает. Результатом может быть синтаксическое дерево, результат вычисления..

Разбор абсолютно всего в JavaScript с использованием алгоритма Эрли
Позвольте мне начать с того, что я был удивлен, насколько легко было написать грамматику для синтаксического анализатора Эрли. Я использую регулярные выражения более десяти лет. И я привык разбирать вещи с помощью регулярных выражений. Он хрупкий, не всегда возможен и т. Д. Но он быстрый и по большей части служит своей цели. Знакомство с алгоритмами синтаксического анализа навсегда изменило это отношение. Это длинная статья. Поэтому я использовал мем He Man, чтобы развлекать вас на..

Простой синтаксический анализ Python для описательных диаграмм
Как создавать визуализации для книг Поклонники веб-комикса xkcd , вероятно, помнят повествовательные диаграммы , которые он сделал для таких фильмов, как Властелин колец , Парк Юрского периода и — саркастически — 12 разгневанных мужчин: Схемы повествования о фильмах xkcd.com лучше всего просматривать с помощью Netscape Navigator 4.0 или более ранней версии на Pentium 3±1, эмулированном в Javascript на Apple IIGS… xkcd. ком..

Автоматическая вставка точки с запятой в Go
Автоматическая вставка точки с запятой в Go Формальная грамматика определяет, что составляет синтаксически допустимую программу на Go (или другом языке программирования): Block = "{" StatementList "}" . StatementList = { Statement ";" } . Приведенные выше определения взяты из спецификации Go. Они используют расширенную форму Бэкуса-Наура (EBNF). Все это означает, что блок кода - это одно или несколько операторов, разделенных точкой с запятой. Вызов..

Разбор DOM с помощью VanillaJS
В JavaScript есть экспериментальная технология. Вы можете прочитать на MDN . Я покажу класс DOMParser. Этот класс может манипулировать строками как элементами DOM. Например, вы отправили запрос ajax. После этого вы получили ответ, который включает html. Допустим, мы хотим использовать событие с этим элементом кода. Форма комментариев должна быть лучшим примером. My Comment \ save_comment.php / ... html codes Как видите, мы получили html-код после..

Есть ли какой-нибудь скрипт Python, который может помочь моему участию в виртуальном конкурсе CodeForces?
Недавно я создал скрипт для очистки последних n соревнований пользователя, где n задается как вводимые пользователем данные. Затем я столкнулся с этим вопросом и подумал, что мне следует написать лучший сценарий, который может использоваться всеми пользователями Codeforces во всем мире. Здесь я представляю вам VirtualCF - парсер Codeforces для конкретного конкурса, идентифицированного Id. Его можно использовать для непрерывного и беспрепятственного участия в виртуальном конкурсе,..

Вопросы по теме 'parsing'

Как вручную разобрать число с плавающей запятой из строки
Конечно, в большинстве языков для этого есть библиотечные функции, но предположим, что я хочу сделать это сам. Предположим, что число с плавающей запятой задано так же, как в программе на C или Java (за исключением суффикса «f» или «d»), например,...
18410 просмотров
schedule 24.07.2022

Разбор двоичных данных в C?
Существуют ли какие-либо библиотеки или руководства по чтению и синтаксическому анализу двоичных данных на C? Я смотрю на некоторые функции, которые будут получать TCP-пакеты в сетевом сокете, а затем анализировать эти двоичные данные в...
22780 просмотров
schedule 19.04.2024

Как я могу читать и анализировать файлы CSV на C ++?
Мне нужно загрузить и использовать данные файла CSV на C ++. На данный момент это действительно может быть просто синтаксический анализатор с разделителями-запятыми (т.е. не беспокойтесь об экранировании новых строк и запятых). Основная потребность...
403224 просмотров
schedule 11.10.2023

XPath для анализа SRC из тега IMG?
Прямо сейчас я успешно захватил полный элемент со страницы HTML следующим образом: //img[@class='photo-large'] например, он вернет это: <img src="http://example.com/img.jpg" class='photo-large' /> Но мне нужен только URL-адрес...
60613 просмотров
schedule 22.02.2024

Разбор пользовательских тегов с помощью PHP
Я пытаюсь создать простые пользовательские теги, чтобы разрешить использование пользовательских шаблонов в моем приложении. Но я не могу понять, как разобрать и заменить теги. (пример) <div class="blog"> <module display="posts"...
8422 просмотров
schedule 05.04.2024

Ошибка синтаксического анализа даты в Javascript - не работает для дат в июне (??)
У меня есть JavaScript, который анализирует дату ISO-8601. Почему-то не на июньские даты. Но даты в июле и мае работают нормально, что для меня не имеет смысла. Я надеюсь, что свежий взгляд поможет, потому что я не вижу, что я здесь делаю не так....
3675 просмотров
schedule 14.11.2022

подстановочный знак python datetime strptime
Я хочу разобрать такие даты в объект datetime: 12 декабря 2008 г. 1 января 2009 г. Для первого свидания подойдет следующее: datetime.strptime("December 12th, 2008", "%B %dth, %Y") но не получится для второго из-за суффикса к...
17531 просмотров
schedule 18.03.2024

ANTLR против Happy против других генераторов парсеров
Я хочу написать переводчик между двумя языками, и после некоторого чтения в Интернете я решил использовать ANTLR. Пришлось изучать его с нуля, но, если не считать проблем с устранением левой рекурсии, до сих пор все шло нормально. Однако сегодня...
3784 просмотров
schedule 23.03.2024

Что такое парсинг пакрата?
Я знаю и использую bison/yacc. Но в мире синтаксического анализа много шума вокруг синтаксического анализа packrat. Что это такое? Стоит ли учиться?
11602 просмотров
schedule 27.08.2022

Проблема JavaCC — сгенерированный код не находит все ошибки синтаксического анализа
Только начал с JavaCC. Но у меня странное поведение с ним. Я хочу проверить ввод в виде токенов (букв и цифр), которые объединены знаками (+, -, /) и могут содержать круглые скобки. Надеюсь понятно было :) В основном методе есть строка, которая...
6890 просмотров
schedule 21.08.2022

Эффективный способ транспонировать файл в Bash
У меня есть огромный файл с разделением табуляцией, подобный этому формату X column1 column2 column3 row1 0 1 2 row2 3 4 5 row3 6 7 8 row4 9 10 11 Я хотел бы транспонировать его эффективным способом, используя только команды bash (для этого...
133937 просмотров
schedule 01.03.2024

разбор бинарного файла в C#
У меня есть бинарный файл. я сохранил его в массиве байтов. размер файла может быть 20MB или больше. затем я хочу проанализировать или найти определенное значение в файле. я делаю это двумя способами -> 1. Преобразовывая полный файл в массив...
3175 просмотров
schedule 12.11.2023

Разобрать HEX ASCII в числа?
У меня есть устройство H/W, которое обычно использует последовательный порт для интерфейса, отправляя и получая двоичные сообщения в программу пользовательского интерфейса ПК. Я добавил порт Ethernet и небольшой стек TCP/IP с небольшим веб-сервером,...
27989 просмотров
schedule 17.11.2022

Как разобрать HTML с помощью PHP/ASP.NET?
На самом деле вопрос заключается не в разборе HTML, а в разборе HTML и добавлении элементов в DOM в соответствии с тегами HTML. Например, я хочу иметь возможность взять HTML-страницу, добавить атрибут к тегам HTML, например, «class='replace'»,...
966 просмотров
schedule 01.07.2022

Написание парсера для предметно-ориентированного языка на Java
Мы хотим разработать простой предметно-ориентированный язык для написания тестовых сценариев для автоматического тестирования XML-интерфейса одного из наших приложений. Примерный тест будет: Получить входной XML-файл из сетевой общей папки или...
5829 просмотров
schedule 23.07.2022

Как реализовать стек с графической структурой?
Итак, я хотел бы создать генератор парсера GLR. Я знаю, что существуют такие программы лучше, чем то, что я, вероятно, сделаю, но я делаю это для развлечения / обучения, так что это не важно. Я читал о синтаксическом анализе GLR и думаю, что...
1754 просмотров
schedule 05.07.2022

Сравнение каналов данных из разных сетей (партнерский маркетинг)
Я работаю над интеграцией партнерских продаж в несколько существующих сайтов. Мы используем несколько мерчантов, которые работают через разные сети (cj, shareasale, linkshare, avantlink). Теперь мое наблюдение заключается в том, что все эти сети...
1050 просмотров
schedule 19.08.2022

Надежная библиотека парсера DateTime для .NET
Я пишу приложение для чтения RSS и почты на С# (технически MonoTouch). Я столкнулся с проблемой разбора DateTime s. Я вижу много различий в том, как даты представлены в дикой природе, и начал писать такую ​​​​функцию: static string[]...
897 просмотров
schedule 18.01.2024

C++: синтаксический анализ с помощью простого регулярного выражения или использовать sscanf?
Мне нужно разобрать строку типа func1(arg1, arg2); func2(arg3, arg4); . Это не очень сложная проблема синтаксического анализа, поэтому я бы предпочел не прибегать к flex/bison или подобным утилитам. Мой первый подход состоял в том, чтобы...
1577 просмотров
schedule 27.12.2023

Разбор электронной почты в Ruby с помощью Action Mailer
Я получаю почту, используя net/pop , но мне также нужно проанализировать электронную почту, чтобы получить тему, адрес и тело электронной почты. Есть идеи по поводу Action Mailer? Я должен использовать сторонние драгоценные камни. (Нет, даже Tmail)...
1530 просмотров
schedule 18.08.2022