Производство фотообоев в Новосибирске. Интернет магазин фотообоев. Изготовление - один день! Каталог 10 000 изображений!
7 Август 2009

Морфологический синонимайзер на базе PHPMorphy

posted in SEO, Полезности, Программирование |

Взялся я таки за написание собственного морфологического синонимайзера. Бета Версия 1.0 готова !

Морфологического потому, что замена синонимов идет не в тупую, а сначала слово приводится к нормальной форме,  к нему подбирается синоним и синоним переводится в туже морфологическую форму, что и было исходное слово.

типа такого

КРЕСЛОМ => (преобразуем в нормальную форму) => КРЕСЛО => подбираем синоним из базы => КАЧАЛКА => (преобразуем в туже морфологическую форму что и было) =>КАЧАЛКОЙ

По сути сам ничего и не делал 🙂

Бесплатные базы взял с сайта конкурента 🙂  Семантический Серверный Синонимайзер Рерайтер (по работе синонимайзера поймете почему они бесплатные 🙂 — уже есть идеи как их пофильтровать с использованием PHPMorphy). (Залил sql файлы в том виде как и было, только индексы добавил по нужным полям).

Класс PHPMorphy (вообще ВЕЩЬ!!!), работающий с морфологией взял на sourceforge.net очень сильно помог разработчик этого класса с ником Жиган — общение с ним происходило на ветке форума PHPClub, посвященной классу PHPMorphy. Возможности класса по истине впечатляют — советую! Разработчик постоянно улучшает и модифицирует класс. (посмотрев код по классу программирования ощутил себя ребенком по сравнению с автором, реально профессионал).

Есть режим работы синонимайзера в режиме формирования скелета для замен, включу на общий доступ чуть позже.

С заглавными буквами тоже позже разберусь — пока всё строчное.

В общем все желающие могут опробовать синонимазер в работе.

Буду рад выслушать ваши мнения и особенно идеи в улучшении сервиса.

P.S.
Изменения в версиях, свои соображения, а также Ваши предложения переносятся в одноименную тему на форуме «Морфологический синонимайзер на базе PHPMorphy»

ВЕЛКАМ !

У нас 21 комментарий на запись “Морфологический синонимайзер на базе PHPMorphy”

Почему бы Вам не высказать своем мнение! Позвольте нам узнать, что Вы думаете...

  1. 1 On 12.08.2009, Алексей said:

    Только что попробовал синонимизировать готовый текст.
    Первое впечатление: текст не читабельный и его все равно нужно дорабатывать (перечитывать и исправлять). А это доп время и силы.

    Но больше всего порадовал один подобраный синоним:
    БОЛЬШИНСТВО => СЕКСБОЛЬШИНСТВО и СЕГОДНЯ => ДНЕСЬ

    в контекста смотрелось прикольно 🙂

  2. 2 On 13.08.2009, Aravak said:

    ДОРОГИ => ТАРМАКАДАМА
    МЕСТАМИ => ИНДАМИ

    Вот что было на выдаче… когда-то в универе писал что-то подобное, правда на С++, по предмету Компьютерная лингвистика, надо порыться может найду что толковое 🙂

  3. 3 On 16.08.2009, acdel said:

    Идея хорошая, но вот слишком уж конкурентная. На рынке и так много скриптов синонимизации, а вот написать скрипт который бы собирал базу синонимов сам, с учетом морфологии, вот этого увы нет. Ведь если база скудная то и процент замен соответствующий.

  4. 4 On 17.08.2009, Кир said:

    да поржал, ты создал анегдото генератор :)))
    ИМХО у конкурента получилось на много лучше

  5. 5 On 26.12.2009, amnenado said:

    я юзаю- мне очень нравится! при создании сайтов очень даже помогает!

  6. 6 On 02.01.2010, Дмитрий said:

    Если не ошибаюсь то phpsin-GOLD http://www.phpsin.ru/gold/ работает в два раза быстрее и лучше

Оставить комментарий