.
7 августа 2009

Морфологический синонимайзер на базе PHPMorphy

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (3 оценок, среднее: 5.00 из 5)
posted in SEO, Полезности, Программирование |

Взялся я таки за написание собственного морфологического синонимайзера. Бета Версия 1.0 готова !

Морфологического потому, что замена синонимов идет не в тупую, а сначала слово приводится к нормальной форме,  к нему подбирается синоним и синоним переводится в туже морфологическую форму, что и было исходное слово.

типа такого

КРЕСЛОМ => (преобразуем в нормальную форму) => КРЕСЛО => подбираем синоним из базы => КАЧАЛКА => (преобразуем в туже морфологическую форму что и было) =>КАЧАЛКОЙ

По сути сам ничего и не делал :)

Бесплатные базы взял с сайта конкурента :)   Семантический Серверный Синонимайзер Рерайтер (по работе синонимайзера поймете почему они бесплатные :)  — уже есть идеи как их пофильтровать с использованием PHPMorphy). (Залил sql файлы в том виде как и было, только индексы добавил по нужным полям).

Класс PHPMorphy (вообще ВЕЩЬ!!!), работающий с морфологией взял на sourceforge.net очень сильно помог разработчик этого класса с ником Жиган — общение с ним происходило на ветке форума PHPClub, посвященной классу PHPMorphy. Возможности класса по истине впечатляют — советую! Разработчик постоянно улучшает и модифицирует класс. (посмотрев код по классу программирования ощутил себя ребенком по сравнению с автором, реально профессионал).

Есть режим работы синонимайзера в режиме формирования скелета для замен, включу на общий доступ чуть позже.

С заглавными буквами тоже позже разберусь — пока всё строчное.

В общем все желающие могут опробовать синонимазер в работе.

Буду рад выслушать ваши мнения и особенно идеи в улучшении сервиса.

P.S.
Изменения в версиях, свои соображения, а также Ваши предложения переносятся в одноименную тему на форуме «Морфологический синонимайзер на базе PHPMorphy»

ВЕЛКАМ !

Post to Twitter ReTweet

Похожие статьи

У нас куча комментариев (21) на запись “Морфологический синонимайзер на базе PHPMorphy”

Почему бы Вам не высказать своем мнение! Позвольте нам узнать, что Вы думаете...

  1. 1 On 07.08.2009, Синонимайзеры – скрипты, программы и сервисы - Блог SEO негоцианта said:

    [...] Морфологический синонимайзер на базе PHPMorphy «батя сказал, что переждем безалаберщины дома. наново было ниче, а следом его привели восвояси под фальцножем каковые-то дяди из автоподъезда, мы с матушкой открыли, а они выебли и прирезали нас с рекой, а главу забили конечностями и ужотко обписили…» [...]

  2. 2 On 07.08.2009, SEO негоциант said:

    Добавил в обзор.

  3. 3 On 07.08.2009, Alek$ said:

    Когда-то я тоже хотел написать синонимайзер на phpMorphy, но до ума так и не довел.

    Твой синонимайзер затестил — неплохо, но база синонимов все портит :)

  4. 4 On 08.08.2009, kopaweb said:

    Онлайн синонимайзер, очень хорошая штука. Вот только действительно база не очень. Нужно усовершенствовать. А так, довольно непросто...спасибо автору :)

  5. 5 On 08.08.2009, Статті said:

    Сколь пробовал эти синонимайзеры, такая хрень получается... не, как набор ключевых слов покатит, но как осмысленный текст... Если множить статьи, то только в немодерируемые каталоги. Кто начнет читать, охренеет.

  6. 6 On 08.08.2009, Диван said:

    Нефиг синонимайзить, писать надо. Лучше меньше, но качественно!

  7. 7 On 08.08.2009, seokot said:

    полный ппц... скорее в бан за процент отказов из поисковика попадешь за такой текст.

  8. 8 On 08.08.2009, GTAlex said:

    Надо будет над прилагательными поработать, базу связей организовать. Для этого

    нужно будет очень много заведомо качественного текста где то нарыть ...

    А сам синонимайзинг в полуавтоматический режим переведу с возможностью выбора корректных синонимов и добавления своих вариантов синонимов.

  9. 9 On 08.08.2009, alexf2000 said:

    Опробовал. В принципе задел очень хороший, особенно правильно, что испольуется морфология. Но надо пытаться учитывать часть речи синонимизируемого слова, иначе получается полная ерунда. Например, «мужской половой хуй» превращается в «дельный официантом хуй». :) А лучше конечно частотность стразу приделывать, без неё всё равно никуда не уедешь.

  10. 10 On 09.08.2009, Марина said:

    Очень оригинальный синонимайзер. Я ввела всего два слова «купить корову»

    РЕЗУЛЬТАТ — «купить дурочку»

    Совсем одно и то же. :)

  11. 11 On 09.08.2009, Rustya said:

    Не пользуюсь, ибо всякая хрень получается. Придерживаюсь качества, а не количества.

  12. 12 On 10.08.2009, Max said:

    Идея хорошая, тоже собираюсь собственный синонимайзер. как планируешь его распространять?

  13. 13 On 10.08.2009, GTAlex said:

    Да я про распространение не думал еще, нужно хоть каких то результатов добиться путних.

  14. 14 On 10.08.2009, Дмитрий said:

    В сети очень много синонимайзеров, трудно написать достойный.

  15. 15 On 11.08.2009, GTAlex said:

    вот думаю — для проверки «более правильной» замены можно гугл с яшей подключить

    запросик в скобочках — по количеству совпадений смотреть уже какая замена более подходящая

    ну и для сочетания по родам нужно либо все замены делать с одинаковым родом, что сокращает количество синонимов «стул» — «кресло» уже не прокатит. Либо как то сочетать рода — это уже сложнее :(

  16. 16 On 12.08.2009, Алексей said:

    Только что попробовал синонимизировать готовый текст.

    Первое впечатление: текст не читабельный и его все равно нужно дорабатывать (перечитывать и исправлять). А это доп время и силы.

    Но больше всего порадовал один подобраный синоним:

    БОЛЬШИНСТВО => СЕКСБОЛЬШИНСТВО и СЕГОДНЯ => ДНЕСЬ

    в контекста смотрелось прикольно :)

  17. 17 On 13.08.2009, Aravak said:

    ДОРОГИ => ТАРМАКАДАМА

    МЕСТАМИ => ИНДАМИ

    Вот что было на выдаче... когда-то в универе писал что-то подобное, правда на С++, по предмету Компьютерная лингвистика, надо порыться может найду что толковое :)

  18. 18 On 16.08.2009, acdel said:

    Идея хорошая, но вот слишком уж конкурентная. На рынке и так много скриптов синонимизации, а вот написать скрипт который бы собирал базу синонимов сам, с учетом морфологии, вот этого увы нет. Ведь если база скудная то и процент замен соответствующий.

  19. 19 On 17.08.2009, Кир said:

    да поржал, ты создал анегдото генератор :) ))

    ИМХО у конкурента получилось на много лучше

  20. 20 On 26.12.2009, amnenado said:

    я юзаю- мне очень нравится! при создании сайтов очень даже помогает!

  21. 21 On 02.01.2010, Дмитрий said:

    Если не ошибаюсь то phpsin-GOLD www.phpsin.ru/gold/ работает в два раза быстрее и лучше

  22. Always Last said:
    Самое обсуждаемое на блогах:
    между представителями РФ и Катара в ООН
    лиц Владимира Путина
    о химической кастрации педофилов

Оставить комментарий

  • Ссылочки