Производство фотообоев в Новосибирске. Интернет магазин фотообоев. Изготовление - один день! Каталог 10 000 изображений!
19 Май 2009

Плагиат картинок — поисковики и уникальность графического контента

posted in SEO, Размышления |

Думаю многим известно, что понятие контент складывается далеко не только из текста (хотя есть и  заблуждающиеся, что считают именно так). Некоторые личности даже считают наоборот 🙂

О понятии Уникального контента и его значимости для поисковых машин, так же думаю особо акцентировать не нужно — вещь архиважная!

Так же стоит обратить особое внимание на тенденцию встраиваемости в обычную поисковую выдачу — выдачи из поиска по изображениям (как в гугле, так и в Яндексе). Причем с улучшениями алгоритмов поиска по картинкам, значимость такой выдачи всё увеличивается.

К чему это я всё веду ?

А веду к тому, что по специфике моей (да и думаю Вашей тоже) работы в онлайне авторского контента мне в необходимом количестве не раздобыть никогда,  а быть уличенным в плагиате изображений поисковыми машинами — явно не даст плюсов ресурсам, где это дело будет «застукано».

Таким образом коли решили заимствовать контент — необходимо изменить изображения до степени узнаваемости его поисковиками как «уникальное».

С этой целью поставлю маленький экспериментик — возму парочку картинок с Яндекс.Картинки — немного их изменю и посмотрим как на это среагирует Яндекс.

На последок вопрос — интересует ли онлайн-сервис по «уникализации» картинок ? А то если будет спрос и экспериметн пройдет удачно — можно оформить.

Собственно эксперимент:

Чтоб не просто так — возму в качестве подопытного сайт-визитку знакомого.

Сдёрнув пару картинок с Яндекса (каждая определена поисковиком в пяти разных вариантах — с разным текстовым окружением, разрешением и расширением).

Немного «накину» окружающего текста (чтоб хоть как то искалось по тем же ключевикам, что и картинки доноры), и линку установлю на сайт-визитку.

Капитальный ремонт электродвигателей, перемотка электродвигателей.

Ключевые слова я думаю понятны 🙂 Ремонт электродвигателей. Перемотка электродвигателей.

Ремонт электродвигателя

Рис.1  Ремонт электродвигателя (перемотка обмотки электродвигателя).
Исходное изображение растянули по горизонтали.

Ремонт электродвигателей

Рис.2  Электродвигатель — ремонт электродвигателей.
Исходное изображение зеркально перевернули.

Ремонт электродвигателя

Рис.3  Восстановление обмотки электродвигателя (капитальный ремонт электродвигателя).
Исходное изображение обрезали.

Ремонт электродвигателя

Рис.4  Капитальный ремонт электродвигателя. Восстановление обмотки электродвигателя.
На исходное изображение наложили текст.

Ремонт электродвигателя.

Рис.5  Капитальный ремонт электродвигателя. Восстановление обмотки электродвигателя.
Исходное изображение поместили в рамку.

ВСЁ — ждем индексации для анализа результатов

У нас 24 комментария на запись “Плагиат картинок — поисковики и уникальность графического контента”

Почему бы Вам не высказать своем мнение! Позвольте нам узнать, что Вы думаете...

  1. 1 On 08.07.2009, Виктор said:

    а как яндекс определяет плагиат картинок ? Есть предположение, что яндекс изменяет размер изображения до некой стандартной для себя величины.

  2. 2 On 20.07.2009, stephan said:

    да ну эт все фигня! поисковый бот видит только название картинки!

  3. 3 On 20.07.2009, GTAlex said:

    да что ты говоришь …
    ты видимо вообще не читал пост

  4. 4 On 20.07.2009, SS1001 said:

    А кто нибудь пробовал открыть картинку в редакторе кода и посмотреть что там. А там много интересной информации особенно касаемо файлов сохраненных в фотошопе. Знаю точно, что там прописывается инфа о лицензии (а то как определяют на какой копии продукта отредактирована картинка). Все это в коде спрятано и в полне возможно содержится информация о первоисточнике и какую обработку данный файл претерпел. Adobe в этом плане сильно взволнован возможностями своих продуктов при использовании в не закооных целях и возможно не только они. Так что в полне возможно, что остается какая то инфа об оригинале или в будующем это станет возможным и тогда уникальность графических файлов станет на равне с текстом. А потом придумают прогу которая будет убивать эту инфу из файла, короче все как обычно.
    Касаемо темы — врядли сможет поисковик определить схожесть фотографий. Сейчас это не реально, но если все редакторы графики станут одинакого сожранять тот же самый джепег с доп инфой, то вполе возможно.

  5. 5 On 20.07.2009, Always last said:

    Самое обсуждаемое на блогах:
    Умер реставратор Савва Ямщиков
    Александру Ширвиндту — 75
    В Афганистане разбился вертолет Ми-8

  6. 6 On 07.01.2010, Drozd said:

    Есть сайт http://www.tineye.com который ищет дубликаты,только на зарубежных сайтах.

  7. 7 On 22.01.2010, stomlog said:

    Яндекс.Картинки научились находить одинаковые изображения в интернете.
    http://clubs.ya.ru/company/replies.xml?item_no=14086&ncrnd=9723
    Поиск точных копий картинок никогда не был сложным для поисковиков, но любые небольшие модификации, изменение размеров, добавление надписей и даже просто пережатие JPG помогали картинке стать уникальной и попасть в результаты поиска в виде дубликата. Наше исследование картинок Рунета показало, что из 600 млн картинок половина уникальна (300 млн), вторая половина склеивается в отношении 3:1, 200 из 300 млн имеют дубликаты только на своем сайте. Когда мы начали решать задачу поиска дубликатов, мы просто хотели «почистить» выдачу от повторяющихся картинок и сделать выдачу более разнообразной. Но впоследствии мы поняли, что в наших руках оказалось нечто большее. Веб-мастера не любят в свои страницы вставлять картинки, которые загружаются с других сайтов, они их копируют, и зачастую меняют размеры, чтобы вписать в свой дизайн. Каждой копии картинки доставалось меньше подписей, поэтому не всегда просто было понять, насколько картинка соответствует запросу? Склейка дубликатов позволила найти тот небольшой процент изображений, который интересен многим веб-мастерам, а значит и пользователям. Для таких картинок у нас много подписей, мы можем сравнить их друг с другом и с запросом, чтобы понять, насколько картинка хорошо ему соответствует. Самый многочисленный класс картинок, оказавшийся в выигрыше, это пары — исходное изображение и его уменьшенная копия, лежащие на одном сайте. Оказывается, что маленькие картинки гораздо чаще хорошо подписаны, но они не попадают на первые страницы поисковиков из-за своих размеров. Благодаря новой технологии мы научились находить маленькую картинку, а показывать ее большой оригинал. На странице просмотра картинки мы показываем табличку копий картинки на разных сайтах. Во-первых, это помогает пользователям, которые догадались, что иногда через поиск по картинкам можно найти сайт с интересующей их информацией. Во-вторых, мы сами того не желая, рассказываем веб-мастерам о сайтах, которые без разрешения или же во благо воспользовались их творениями. Для этого достаточно лишь найти свою картинку в поиске. Задача поиска дубликатов оказалась технически сложной. Есть много научных работ на тему интеллектуального сравнения двух изображений, а для специалистов по «компьютерному зрению» задача опознать пару изображений, полученных изменением размеров, не является серьезной задачей. Однако никто из этих специалистов не имел возможности поработать с базой из 600 млн картинок. Попарное их сравнение на одном компьютере потребовало бы около 300 млн лет. К сожалению, обычными методами с помощью хеш-функций задачу решить тоже не удается. Но мы это сделали!

    Дмитрий Михалёв, Федор Романенко. Яндекс.Картинки

  8. 8 On 27.01.2010, 4udov said:

    А быстрее их не выискивать или самому создавать, а купить на каком-то микростоке подписку и забыть об этом.

    Не могу не поделиться новостью 🙂
    http://submit.depositphotos.com?ref=1001300 На этом стоке сейчас бесплатный триал дают, можно бесплатно по 10 стоковых фотографий в день скачивать.

  9. 9 On 22.11.2010, Webeditor said:

    Пройдет еще с десяток лет и поисковики научаться отличать картинки даже с изменениями.

Оставить комментарий