WebDriver

w3cselenium

WebDriver

Сегодня я Вам расскажу о стандарте WebDriver от W3C. Данный стандарт применим для управления браузерами посредством замечательного инструмента — selenium. Основным ключевым моментом является отправка команд и получение ответа от selenium посредством REST технологии (где запрос на получение данных осуществляется путем отправки GET запроса, а установка значения или изменения состояния посредством POST запроса, DELETE очистка куков, закрытие окон, закрытие сессии).

Читать далее «WebDriver»

DOMDocument

DOMDocument

    В PHP есть замечательный класс — DOMDocument. В чем же его замечательность? Данный класс изначально предназначался для парсинга XML файлов. Он представляет из себя удобный интерфейс по манипуляции элементами DOM модели. Данный класс можно использовать не только для парсинга XML документов, но и для HTML. Читать далее «DOMDocument»

php-webdriver

facebook1

    В недрах FACEBOOK была разработана библиотека на PHP —  php-webdriver. Данная библиотека работает в связке с SELENIUM, исходный код которого выложен на GitHub. Что это за чудо? Что может? Зачем это им нужно было разрабатывать? Читать далее «php-webdriver»

Guzzle

guzzle

    Guzzle — удобная библиотека для получения содержимого веб сайта и последующей обработки его. Данная библиотека по умолчанию использует — CURL, а в случае ее отсутствия, то использует обертку — PHP потоков (php stream). Guzzle распространяется под лицензией — MIT. Она способна выполнять как синхронные запросы к веб ресурсу, так и работать с асинхронными запросами. Читать далее «Guzzle»

Human Emulator

vneshnij_vid_xhe

     Human Emulator — это полноценный Web-браузер, поддерживающий JavaScript. Легко управляемый, прост в эксплуатации, низкий порог обучения. Управлять им можно как в локально, так и подавать управляющие сигналы через сеть. До недавнего времени он был основан на движке IE, но в последних версиях перешел на хромиум. Читать далее «Human Emulator»

Laravel TestTools

Laravel_TestTools

Marcel Pociot 21 Марта 2016 выложил на GitHub первую версию — Laravel TestTools. Это небольшое расширение для браузера — Google Chrome позволяющее записывать Ваши действия в браузере генерируя код для Laravel. Читать далее «Laravel TestTools»

file_get_contents

images

    Да… да… да… не удивляйтесь. С помощью этого оператора можно достаточно успешно парсить сайты. Этот инструмент, довольно простой, но не менее эффективный! К тому же является встроенным в PHP. Минусом является невозможность проводить парсинг в несколько потоков и должна быть включена опция fopen wrappers Читать далее «file_get_contents»

CURL

curl

    Об этом расширении не писали только ленивые. Мощный инструмент на основе, которого создаются библиотеки для парсинга страниц в интернете.
Данное расширение позволяет скачивать страницы как в один поток, так и в несколько потоков. Удобный инструмент для массовой скачки страниц или обращения к нескольким источникам одновременно. Используется повсеместно. Читать далее «CURL»

Snoopy

    Snoopy

    Snoopy — полезный инструмент для начинающего парсера. Позволяет обратится к Web странице и извлечь с нее все данные. Инструмент прост, не требует дополнительных расширений для PHP. Эмулирует браузер. Читать далее «Snoopy»

Обновление — PHP

php5.4-300x300

    3 марта обновился PHP до версии 7.0.4. В нем были исправлены ряд ошибок 7-й версии. Читать далее «Обновление — PHP»