Метка: контент

  • Все статьи с rusarticles.ru и lenta.ru

    Для обучения своего будущего рерайтера-синонимайзера напарсил все статьи с rusarticles.ru и lenta.ru (около 33 тыс. и 10 тыс. соотвественно) — в архивах по 51 Мб и 44 Мб. Информация о тематике для всех статей сохранена. Если кому нужно — уступлю за по 10 WMZ за каждый. P.S. Вышел свеженький номер seodigest — Новый дизайн и…

  • Анти-Синонимайзер

    Пришла мысль — вот многие юзают синонимайзеры для уникализации контента (текстовой его составляющей) — а ведь у SE (search engine) явно должны быть базы синонимов, причем в нормализованной форме и сам нормализатор явно присуствует. SE достаточно «пройтись» по тексту и позаменять все синонимы на что-то одно и вуаля — алгоритм накрылся медным тазом ! Имхо…