День: 25.11.2009

  • Сравнение текстов с использованием шинглов

    Для одного из моих белых проектов понадобилось сделать мини-поисковичек – из довольно большого количества статей необходимо выбрать наиболее релевантные определенному запросу. Решил заюзать механизм шинглов, кто не знает принцип такой – по набору слов строится шинг (md5() crc32() и т.д.), соответственно шинглы получаются одно-, двух-, трех-,  …. словные, после чего вычисляется количество совпавших шинглов 2х…