SOFT
BLOG
&
Логин
Имя:
Пароль:

HTML XML Парсинг

Парсинг XML/HTML Free Pascal библиотека Internet Tools. Часть 1

В данном документе я рассмотрю несколько примеров использования библиотеки Internet Tools для обработки XML/HTML документов. В качестве инструмента будет использованы htmlparserExampleGUI или Xidel онлайн версия для любого браузера

Internet Tools - библиотека инструментов для парсинга

Автором является господин Бенито (контактные данные на его сайте). Кроме этой библиотеки Вы сможете найти еще много полезных инструментов для Фрипаскаль. На самом деле заголовок не совсем точно отображает назначение библиотеки Internet Tools, это набор кода для XPath2/XQuery/JSONiq процессоров, "pattern matcher" - шаблонный согласователь (простой и мощный инструмент парсинга), инструменты для работы с HTML и XML подобно DOM-инструменту. А также инструменты для работы с HTTP/HTTPS, FTP протоколами.

Парсер HTML. Обзор технологий

Постараюсь дать краткое описание некоторым методотам обработки HTML, XML документов. Основная задача таких технологии это извлечение, структурирование и преобразование информации в другое удобное представление. Это всё называют одним общим термином - Парсинг (англ. parsing). Подробнее Вы можете почитать про синтаксический анализ. Могут быть разные причины и цели чтобы извлекать информацию из документов, но обычно это делают для следующего использования.