Datacol

Datacol    Рассмотрим еще одну программу, которая отлично справляется с автоматизацией процесса парсинга — Datacol. Читать далее «Datacol»

Guzzle

guzzle

    Guzzle — удобная библиотека для получения содержимого веб сайта и последующей обработки его. Данная библиотека по умолчанию использует — CURL, а в случае ее отсутствия, то использует обертку — PHP потоков (php stream). Guzzle распространяется под лицензией — MIT. Она способна выполнять как синхронные запросы к веб ресурсу, так и работать с асинхронными запросами. Читать далее «Guzzle»

Human Emulator

vneshnij_vid_xhe

     Human Emulator — это полноценный Web-браузер, поддерживающий JavaScript. Легко управляемый, прост в эксплуатации, низкий порог обучения. Управлять им можно как в локально, так и подавать управляющие сигналы через сеть. До недавнего времени он был основан на движке IE, но в последних версиях перешел на хромиум. Читать далее «Human Emulator»

file_get_contents

images

    Да… да… да… не удивляйтесь. С помощью этого оператора можно достаточно успешно парсить сайты. Этот инструмент, довольно простой, но не менее эффективный! К тому же является встроенным в PHP. Минусом является невозможность проводить парсинг в несколько потоков и должна быть включена опция fopen wrappers Читать далее «file_get_contents»

CURL

curl

    Об этом расширении не писали только ленивые. Мощный инструмент на основе, которого создаются библиотеки для парсинга страниц в интернете.
Данное расширение позволяет скачивать страницы как в один поток, так и в несколько потоков. Удобный инструмент для массовой скачки страниц или обращения к нескольким источникам одновременно. Используется повсеместно. Читать далее «CURL»

Snoopy

    Snoopy

    Snoopy — полезный инструмент для начинающего парсера. Позволяет обратится к Web странице и извлечь с нее все данные. Инструмент прост, не требует дополнительных расширений для PHP. Эмулирует браузер. Читать далее «Snoopy»

Обновление — PHP

php5.4-300x300

    3 марта обновился PHP до версии 7.0.4. В нем были исправлены ряд ошибок 7-й версии. Читать далее «Обновление — PHP»