.
2 июня 2009

Анти-Синонимайзер

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (3 оценок, среднее: 1.67 из 5)
posted in SEO |

Пришла мысль — вот многие юзают синонимайзеры для уникализации контента (текстовой его составляющей) — а ведь у SE (search engine) явно должны быть базы синонимов, причем в нормализованной форме и сам нормализатор явно присуствует.

SE достаточно «пройтись» по тексту и позаменять все синонимы на что-то одно и вуаля — алгоритм накрылся медным тазом !

Имхо так и должно быть — по крайней мере еслиб я в Яндексе работал — так бы и сделал.

Плюс добавляем сюда шинглы — вообще верёвка :)   Причем упор в шинглах я бы делал по ключевикам, нормализованным по синонимам,  содержащимся в тайтле.

А вот как избежать подобного определения уникализированного текста — надо подумать :)

Напоследок — нарыл в инете прикольный синонимайзер макрос под MS Word — очень простой макрос — проходим по словам текста и случайным образом меняем слово на его синоним.

<Реклама>

Компания GrandPR — раскрутка сайта

Посуточная аренда квартир в Санкт-Петербурге.  Гостевые апартаменты в центре Северной столице.

</Реклама>

Post to Twitter ReTweet

Похожие статьи

У нас куча комментариев (43) на запись “Анти-Синонимайзер”

Почему бы Вам не высказать своем мнение! Позвольте нам узнать, что Вы думаете...

  1. 1 On 02.06.2009, белый маг Гвест said:

    эмм не совсем понял. типа каждому слову и его синонимам давать код типа fff324h а потом проверять совпадения? поэтому и надо менять структуру не только в предложении но и сами предложения.

  2. 2 On 02.06.2009, GTAlex said:

    ага, правильно ты всё понял, только вот потом не совпадения проверять, а шинглы лепить, а потом уже и совпадения проверять :)

  3. 3 On 02.06.2009, GTAlex said:

    вообще уникальность текста — не панацея, в инете вообще практически нет ничего уникального — вся информация многократно дублируется, особенно если эта информация получила широкую общественную огласку — и ничего ведь — не забанили всех кто продублировал

    подобные вопросы поднимаются при создании автоматов-рерайтеров ворованного контента или просто тупой репостинг — а вот уже такие сайты последнее время вычисляются и банятся очень быстро (я кстати тоже именно в этом ракурсе все эти вещи рассматриваю :)  — уж больно хочется человеко-независимые да приносящие доход ресурсы иметь)

    в идеале конечно нужно делать проекты наполняемые контентом самими посетителями — но это уже индивидуальный подход, наличие хороших идей — в общем высший пилотаж :( ...

  4. 4 On 03.06.2009, Po4itay said:

    Лично я невидел нармального синонимайзера, который не делал из текста г@вно.

  5. 5 On 03.06.2009, Hkey said:

    Возможно поисковики ведут подобную работу, но синонимы сложное дело... Словосочетания, контекст и прочее. Нормальную форму нельзя выделить в общем случае. Более того все новости рунета это ручной рерайт.

  6. 6 On 03.06.2009, Mitragrad said:

    А что такое шингл?

  7. 7 On 03.06.2009, GTAlex said:

    Что такое шинг лучше у Яши или Гугла спросить :)

  8. 8 On 03.06.2009, killoff said:

    для поисковика подобное будет вешалкой. Смотрите сами, есть например текст 100 слов, сделать в нём даже если 10 замен синонимами — сколько вариантов получится? много, потомучто на каждое одно слово можно применить не обязательно один синоним... и поисковик не будет никогда (мне так кажется) часами анализировать «Анти-Синонимайзером» одну страницу сайта... :)

  9. 9 On 04.06.2009, CTAPuKAH said:

    У меня есть мысли по этому поводу.

    Стукни или позвони.

  10. 10 On 04.06.2009, GTAlex said:

    killoff ты неправильно понял, поисковик для себя наоборот уменьшает кол-во вариантов

    т.е. допустим есть 2 текста

    «хороший врач»

    «замечательный доктор»

    у поисковика есть внутренняя база типа

    «хороший, замечательный, не плохой, ...» = > «14f0e1»

    "врач, доктор, лекарь, ... " = > «у9с423»

    итого и тот и другой текст сохраняться как «14f0e1 у9с423»

    по этому делу делается один шинг, допустим «542ef1» и заносится в БД — вуаля

  11. 11 On 04.06.2009, Олег said:

    Немного с автором не согласен, но мысль подана, спасибо.

  12. 12 On 05.06.2009, агентство it said:

    уникальность с т.з. ПС — это отсутствие аналога. смысл анализу поддается с трудом(пока что) — так что не спалят тебя, если перемиксовать и синонимизировать.

  13. 13 On 05.06.2009, melksoft said:

    ...и накроется Интернет медным тазом, и будут поисковики только друг-друга находить

  14. 14 On 05.06.2009, Александр said:

    Фиг с ним с этим уникальным контентом. Сайты сделанные для людей, тематические-у меня не выпадали из индекса, всё копипаст...на главной только уник. Мало в рунете хороших проектов. Уник не панацея...Поставьте себя на место пользователя и делайте сайт глядя их глазами.

  15. 15 On 05.06.2009, GTAlex said:

    Ну я так понимаю, ты упор делаешь на тулбарный эффект. Возможно, конечно, за ним будущее и уникализация как таковая нах не нужна, НО кто скажет где правда то ?

  16. 16 On 06.06.2009, Nunya said:

    Сейчас очень трудно создавать уникальные тексты в своей нише. Практически все темы в интернете уже затронуты.

  17. 17 On 06.06.2009, Адский стоматолог said:

    Да всё равно, рерайт не рерайт, если сайт хороший и много уника помимо рерайта, то скорей всего не забанят. Если мало, то ждать осталось недолго.

  18. 18 On 07.06.2009, apelsinka said:

    Шингл, это что?

  19. 19 On 08.06.2009, kilnart said:

    -->On 06.06.2009, Адский стоматолог said:

    -->Да всё равно, рерайт не рерайт, если сайт хороший и много уника помимо рерайта, то -->скорей всего не забанят. Если мало, то ждать осталось недолго.

    Смотря какой рерайт. Если грамотно созданный, я думаю все будет ОК. Ну а г...вно, рано или позно само всплывет.

  20. 20 On 08.06.2009, felix said:

    Вы правда думаете, что Яшка или даже тот же Гугля делает таким образом? Заменяет слова? Вы представляете какие механизмы им надо прикупить, что бы такое реализовать для всей этой базы новых УГ ежедневных? :)

    Мне кажется проще модеров нанять )))

  21. 21 On 08.06.2009, GTAlex said:

    хто их знает :) почему бы и нет ?

    имхо не такая уж и большая нагрузка

  22. 22 On 08.06.2009, Гитарист said:

    2felix я думаю что у яши есть такие мощности. А чтобы вот модеров нанять, это нужно весь китай заставить рунет вычищать и то не будут успевать.

    Просто если все не уникальное побанить будет хуже чем есть. К тому же для бана могут быть разные причины.

  23. 23 On 10.06.2009, Evdoha said:

    автору спасибо за полезную инфу

  24. 24 On 10.06.2009, Artema said:

    полезная штука это симонайзер

  25. 25 On 11.06.2009, Lineage said:

    Сугубо мое мнение синонимайзеры — редкое гамно. Просто они так извращают текст, что он не только не четабелен для людей но и для ПС

  26. 26 On 11.06.2009, Tolyana said:

    кому как, но мне очень нравиться!

  27. 27 On 11.06.2009, Seoman said:

    Конечно, есть у ПС качественные синонимайзеры, и подобные генерации клеятся успешно.

    Есть такой вариант: перевести текст на английский а потом обратно на русский, да еще прогнать по синонимайзеру.

    Замечал кто-нибудь, что такое клеется?

  28. 28 On 12.06.2009, Дмитрий said:

    Вот тоже нашол неплохой скрипт синонимайзера который написан на php, не использует базы данных, база синонимов находится в php файле и доступна для редактировании. При обработке теста скрипту не важно написано слово с большой буквы или с маленькой, стоит ли после или перед словом знак препинания. В скрипте предусмотрена функция добавления в базу слов и словосочетаний неограниченной длинны даже со знаками препинания. Вся база синонимов скрипта уникальна и собранна в ручную с учетом морфологии, в ней находится более 91 000 слов и словосочетаний, благодаря этому на выходе получатся на 80% — 90% читаемый текст без искажения смысла. Уникальной особенностью данного скрипта является то, что при размере базы почти в 100 000 слов и соответственно столько же синонимов к ним, скрипт обрабатывает текст за доли секунд, благодаря чему данный скрипт можно использовать как функцию и получать на выходе уже синонимизированный текст. Пример работы скрипта: www.phpsin.ru/sinonim/

    за этот скрипт просят денег но походу он стоит этого.

  29. 29 On 14.06.2009, Роман said:

    Хм... интересно спасибо!

    Синонимайзер больше используют для сателитов, а не для людей, так думаю что и так сойдет как есть)

  30. 30 On 14.06.2009, Selina said:

    Многие факты — часто не совпадают с действительностью.

  31. 31 On 14.06.2009, KirilloFF said:

    Полезная штука, но лучше своей статьи нет :)

  32. 32 On 14.06.2009, веб дизайн сайта Минск said:

    Автор, спасибо за пищу для размышления!Навеялось пару идей!Преблагодарен!

  33. 33 On 16.06.2009, Valeriya said:

    спасибо очень пригодилось для моего контента на сайте

  34. 34 On 17.06.2009, claygod said:

    Уникальность — это только один из кирпичиков, главное — ссылки с правильными якорями.

  35. 35 On 19.06.2009, MASTER said:

    Поисковики до сих пор не могут определить, кто реальный автор контента. И еще долго не смогут этого сделатьпо разным причинам. Именно поэтому сейчас развелось много тех, кто спокойно контент ворует и зарабатывает на сайтах, целиком сделанных на ворованном контенте. Так что все синонимайзеры и антисинонимайзеры не решают никаких проблем. Да и новых почти не создают, проблем и так много.

  36. 36 On 22.06.2009, MaxXx said:

    Хорошая идея. Надеюсь, представители Яндекса не листают на досуге Ваш блог =)

    P.S., а если серьезно, пробовал и бесплатные, и платные синонимайзеры. Да, продукт легко входит в индекс, но как только появляются первые продажные ссылки, тут же из него вылетает.

  37. 37 On 23.06.2009, webernie said:

    Имхо так и должно быть — по крайней мере еслиб я в Яндексе работал — так бы и сделал.

    Видимо не все так просто... Ведь можно много уникального принять за уникализированное...

  38. 38 On 01.07.2009, felix said:

    Что-то слишком мудрёный способ для проверки тому же Яндексу. Мощностей не хватит для прогона всего текста в Рунете. Если только новые сайты? Тогда может быть, да и то как-то слишком.

  39. 39 On 02.07.2009, Nita said:

    Идея интересная, но реализовать ее могут только сами поисковики, да и если такое сделают половина сети накроется, в инете ведь везде все одинаковое, только по разному написано, например есть у кого-то пост про «Блогун», а другой тоже про него пост написал (сам написал — копирайт), так поисковик может подумать что это рерайт и все — пост забанен, а в таком случае будет выигрывать тот кто первый напишет.

  40. 40 On 03.07.2009, padonokx said:

    Спасибо за синонимайзер. Удобен, иногда полезен. Но верно выше сказано, лучше своей статьи Нет.

  41. 41 On 06.07.2009, Карл said:

    Синонимайзер больше используют для сателитов, а не для людей, так думаю что и так сойдет как есть)

  42. 42 On 06.07.2009, Always last said:

    Самое обсуждаемое на блогах:
    Концерт Майкла Джексона
    День Независимости США
    Резолюция ОБСЕ о сталинизме и нацизме

  43. 43 On 03.01.2010, Makermoney said:

    Явно у поисковиков есть такие скрипты

  44. Always Last said:
    Самое обсуждаемое на блогах:
    «За честные выборы»
    посвященная «антиоранжевому» митингу
    на Поклонной горе

Оставить комментарий

  • Ссылочки