Продолжаю писать парсеры для своего будущего рерайтера — готовим так сказать тренировочную базу по тексту.
Сегодня под руку попался новостной портал gazeta.ru
Так что — кому нужно — обращайтесь, цену вопроса обсудим в личке.
Продолжаю писать парсеры для своего будущего рерайтера — готовим так сказать тренировочную базу по тексту.
Сегодня под руку попался новостной портал gazeta.ru
Так что — кому нужно — обращайтесь, цену вопроса обсудим в личке.
6 комментариев на «“Парсер портала gazeta.ru”»
У них такой бардак на сайте. Я чего искал там rss и не нашёл. По старинке — регулярками? 😉
В смысле, парсишь регулярками?
старые статьи через архив
http://www.gazeta.ru/history.shtml
по старинке, регулярками
а rss у них тут
http://www.gazeta.ru/export_news.shtml
собственно тоже не без регулярок 🙂
Помоему видел не просторах и-нета уже склепаный парсер для газеты.ру, но сейчас не вспомню именно где.
Не плохо бы такой иметь. А синонимайзера встроенного он не имеет?
Присоединяюсь к вопросу: что насчет синонимайзера?