-
Сравнение текстов с использованием шинглов
Для одного из моих белых проектов понадобилось сделать мини-поисковичек – из довольно большого количества статей необходимо выбрать наиболее релевантные определенному запросу. Решил заюзать механизм шинглов, кто не знает принцип такой – по набору слов строится шинг (md5() crc32() и т.д.), соответственно шинглы получаются одно-, двух-, трех-, …. словные, после чего вычисляется количество совпавших шинглов 2х…