Записи с тегом ""

Парсеры, грабберы, контентоворователи

28 Сентябрь 2009 | Автор: Virtual

Собирателей различного вида контента с сайтов в общем-то много, но большинство заточено под определенные цели: какие-то парсеры тащат картинки, какие-то сохраняют ссылки, некоторые заточены только под парсинг определенных сайтов. Но сегодня я бы хотел поговорить про универсальные парсеры контента, которые можно настроить под любой сайт. Multireader Первым таковым в моей жизни был multireader Программа эта [...]

Грабберы обычно пишутся под определенные cms, либо для парсинга rss. Но MultiReader – это универсальное решение. В нем для парсинга вам нужно задать теги, между которыми будет парситься текст и граббер его соберет. Благодаря этому, контент можно парсить с любых сайтов.