Сегодня я хочу поделиться с вами подробностями об инновационном инструменте для работы с данными — «Frog Parser», адрес проекта: Этот инструмент представляет собой мощный парсер, призванный сделать процесс извлечения данных с веб-сайтов максимально удобным, понятным и эффективным. Я попытался отойти от сложных парадигм программирования, сделав этот инструмент доступным для пользователей с базовыми компьютерными знаниями, сохранив при этом гибкость и мощность, необходимые для выполнения сложных задач скретчинга.

«Frog Parser» основан на проектном подходе, использует иерархическую структуру команд и учитывает естественное поведение пользователя при просмотре веб-страниц. В этой статье я хочу рассказать вам об основных возможностях этого продукта, языке его команд, типах представления рабочих документов, а также о преимуществах использования «Frog Parser» в ваших проектах. Давайте углубимся в детали!»

  1. Анализ рассматривается как комплекс различных команд, объединенных в иерархические группы по смыслу или рабочему процессу.

  2. С точки зрения конечного пользователя процесс парсинга представлен в виде документа под названием «Документ рабочего процесса Frog Parser».

  3. Применяется проектный подход: документы группируются в проекты.

  4. Язык описания процесса синтаксического анализа, «Frog Parser Command Language», можно сравнить с языком ассемблера — это набор команд с параметрами.

  5. Документ «Frog Parser Workflow» может иметь различное представление: табличное, схематическое, текстовое.

  6. «Рабочий процесс Frog Parser» должен быть представлен в виде удобочитаемого текстового файла для удобного хранения в системе контроля версий и ручного редактирования.

  7. Командный язык Frog Parser должен быть простым и понятным для пользователя с базовыми компьютерными знаниями, при этом обеспечивать достаточную гибкость для выполнения задач, но не быть перегруженным сложными парадигмами программирования, распространенными среди профессиональных разработчиков.

  8. В результате процесса анализа данных веб-сайта создается «набор данных», который можно экспортировать из внутреннего представления в распространенные форматы, такие как CSV или MS Excel.

  9. Взаимодействие с веб-страницей следует общепринятым практикам в индустрии веб-разработки. Например, поиск элементов на странице возможен разными способами: по идентификатору, имени HTML-тега, имени атрибута HTML-элемента, классу CSS, селектору CSS.

  10. Навигация по веб-странице имитирует поведение реального пользователя: нажатие кнопок, ввод данных в поля и т. д.

  11. Для работы с «Frog Parser» конечному пользователю не нужно устанавливать какое-либо дополнительное программное обеспечение — достаточно иметь доступ в Интернет и последнюю версию веб-браузера (Google Chrome, MS Edge).

  12. Задачи сканирования выполняются в пакетном режиме, а пользовательский интерфейс позволяет отслеживать статус их выполнения.

  13. Программный продукт Frog Parser доступен по подписке. В случае неактивной подписки продукт работает в демо-режиме, добавляя на выходе «Водяные знаки».

ЧИТАТЬ  Как получить водительские права без прохождения правил дорожного движения или прохождения автошколы? -Ежедневно Авто

Список проектов

Список рабочих процессов

Список рабочих процессов

Измените рабочий процесс в виде таблицы, пример примера 1

Измените рабочий процесс в виде таблицы, пример примера 1

Измените рабочий процесс в виде таблицы, пример примера 2

Измените рабочий процесс в виде таблицы, пример примера 2

Измените рабочий процесс в виде таблицы, пример примера 3

Измените рабочий процесс в виде таблицы, пример примера 3

Изменить рабочий процесс в формате JSON

Изменить рабочий процесс в формате JSON

Сведения о выполнении рабочего процесса

Сведения о выполнении рабочего процесса

Выходной набор данных

Выходной набор данных

Данные экспортированы в MS Excel

Данные экспортированы в MS Excel

Пример «Документ рабочего процесса Frog Parser». В данном случае анализируется сайт, созданный с помощью Shopify Ecommerce CMS: https://district-theme-demo.myshopify.com/collections/clothing

{ "version": "1.0.0.0", "acceptLanguage": "", "commands": [ { "@type": "SetConstantValueToVariableCommand", "enabled": true, "name": "set-implicitly-wait-variable-value", "description": "", "retryCount": 1, "variableType": "Long", "variable": { "name": "implicitly-wait" }, "value": { "@type": "VariableValueLong", "value": 3000 } }, { "@type": "SetImplicitlyWaitCommand", "enabled": true, "name": "set-implicitly-wait", "description": "", "retryCount": 1, "variable": { "name": "implicitly-wait" } }, { "@type": "CreateDatasetCommand", "enabled": true, "name": "create-dataset", "description": "", "retryCount": 1, "variable": { "name": "dataset" }, "metadata": { "columns": [ { "name": "page-number", "type": "Integer" }, { "name": "product-title", "type": "String" }, { "name": "product-price", "type": "String" } ] } }, { "@type": "SetConstantValueToVariableCommand", "enabled": true, "name": "Set constant value to start-page variable", "description": "", "retryCount": 1, "variableType": "Url", "variable": { "name": "start-page" }, "value": { "@type": "VariableValueUrl", "value": " } }, { "@type": "OpenWebPageCommand", "enabled": true, "name": "Open start-web-page", "description": "", "retryCount": 1, "variable": { "name": "start-page" } }, { "@type": "SetConstantValueToVariableCommand", "enabled": true, "name": "set-handle-current-page-to-true", "description": "", "retryCount": 1, "variableType": "Boolean", "variable": { "name": "handle-current-page" }, "value": { "@type": "VariableValueBoolean", "value": true } }, { "@type": "SetConstantValueToVariableCommand", "enabled": true, "name": "set-page-number", "description": "", "retryCount": 1, "variableType": "Integer", "variable": { "name": "page-number" }, "value": { "@type": "VariableValueInteger", "value": 0 } }, { "@type": "WhileLoopCommand", "enabled": true, "name": "do-while-handle-current-page", "description": "", "retryCount": 1, "variable": { "name": "handle-current-page" }, "commands": [ { "@type": "IncrementVariableCommand", "enabled": true, "name": "increment-page-number", "description": "", "retryCount": 1, "variable": { "name": "page-number" } }, { "@type": "FindElementsCommand", "enabled": true, "name": "find-product-card-elements", "description": "", "retryCount": 1, "findBy": { "@type": "FindByTagName", "value": "product-card" }, "variable": { "name": "product-card-elements" } }, { "@type": "ForAllLoopCommand", "enabled": true, "name": "for-all-product-cards", "description": "", "retryCount": 1, "variable": { "name": "product-card-elements" }, "itemVariable": { "name": "product-card-element" }, "commands": [ { "@type": "FindChildElementCommand", "enabled": true, "name": "find-product-card-title-element", "description": "", "retryCount": 1, "findBy": { "@type": "FindByClassName", "value": "product-card__title" }, "variable": { "name": "product-card-title-element" }, "parentElementVariable": { "name": "product-card-element" } }, { "@type": "ReadPropertyCommand", "enabled": true, "name": "read-product-card-title-element", "description": "", "retryCount": 1, "variable": { "name": "product-card-title-element" }, "property": { "@type": "ElementPropertyText" }, "newVariable": { "name": "product-card-title-text" } }, { "@type": "FindChildElementCommand", "enabled": true, "name": "find-product-card-price-element", "description": "", "retryCount": 1, "findBy": { "@type": "FindByCssSelector", "value": ".price" }, "variable": { "name": "product-card-price-element" }, "parentElementVariable": { "name": "product-card-element" } }, { "@type": "ReadPropertyCommand", "enabled": true, "name": "read-product-card-price-element", "description": "", "retryCount": 1, "variable": { "name": "product-card-price-element" }, "property": { "@type": "ElementPropertyText" }, "newVariable": { "name": "product-card-price-text" } }, { "@type": "CreateDatasetRowCommand", "enabled": true, "name": "create-dataset-row", "description": "", "retryCount": 1, "variable": { "name": "dataset" }, "columns": [ { "name": "page-number", "columnVariable": { "name": "page-number" } }, { "name": "product-title", "columnVariable": { "name": "product-card-title-text" } }, { "name": "product-price", "columnVariable": { "name": "product-card-price-text" } } ] }, { "@type": "SaveVariableCommand", "enabled": true, "name": "save-dataset", "description": "", "retryCount": 1, "variable": { "name": "dataset" } } ] }, { "@type": "CheckElementExistsCommand", "enabled": true, "name": "check-next-page-link-exists", "description": "", "retryCount": 1, "findBy": { "@type": "FindByCssSelector", "value": "a[aria-label=\"Next page\"]" }, "variable": { "name": "handle-current-page" } }, { "@type": "IfThenCommand", "enabled": true, "name": "if-next-page-link-exists", "description": "", "retryCount": 1, "ifVariable": { "name": "handle-current-page" }, "thenCommands": [ { "@type": "FindElementCommand", "enabled": true, "name": "find-next-page-link-element", "description": "", "retryCount": 1, "findBy": { "@type": "FindByCssSelector", "value": "a[aria-label=\"Next page\"]" }, "variable": { "name": "next-page-link-element" } }, { "@type": "ClickCommand", "enabled": true, "name": "click-by-next-page-link", "description": "", "retryCount": 1, "variable": { "name": "next-page-link-element" }, "clickIfInvisible": true } ] } ] } ] }

Подводя итог, следует отметить, что «Frog Parser» — это уникальный инструмент, призванный облегчить и упростить процесс анализа данных с веб-сайтов. Он сочетает в себе простоту использования для пользователей с базовыми знаниями компьютера и возможность выполнять сложные задачи очистки.

ЧИТАТЬ  Только что просочилась дата выхода iPhone 15. Вы можете купить его здесь | цифровые тренды

С помощью «Frog Parser» вы можете упростить и ускорить процесс извлечения данных, используя его интуитивно понятный язык команд, различные представления рабочих документов и возможность экспорта данных в часто используемые форматы. При этом инструмент не требует установки дополнительного ПО и доступен по подписке, что обеспечивает максимальную гибкость использования.

В целом «Frog Parser» предлагает универсальное и гибкое решение для работы с данными, сочетающее лучшие практики веб-разработки и навигации по страницам, имитирующее поведение реального пользователя. Я надеюсь, что этот программный продукт поможет вам повысить эффективность и качество управления вашими данными.

Адрес проекта:

Страница проекта в Facebook: https://www.facebook.com/frogparser

Телеграмма: https://t.me/frog_parser_com

Искренне,

Роман

Source