Плагиат картинок — поисковики и уникальность графического контента


Думаю многим известно, что понятие контент складывается далеко не только из текста (хотя есть и  заблуждающиеся, что считают именно так). Некоторые личности даже считают наоборот 🙂

О понятии Уникального контента и его значимости для поисковых машин, так же думаю особо акцентировать не нужно — вещь архиважная!

Так же стоит обратить особое внимание на тенденцию встраиваемости в обычную поисковую выдачу — выдачи из поиска по изображениям (как в гугле, так и в Яндексе). Причем с улучшениями алгоритмов поиска по картинкам, значимость такой выдачи всё увеличивается.

К чему это я всё веду ?

А веду к тому, что по специфике моей (да и думаю Вашей тоже) работы в онлайне авторского контента мне в необходимом количестве не раздобыть никогда,  а быть уличенным в плагиате изображений поисковыми машинами — явно не даст плюсов ресурсам, где это дело будет «застукано».

Таким образом коли решили заимствовать контент — необходимо изменить изображения до степени узнаваемости его поисковиками как «уникальное».

С этой целью поставлю маленький экспериментик — возму парочку картинок с Яндекс.Картинки — немного их изменю и посмотрим как на это среагирует Яндекс.

На последок вопрос — интересует ли онлайн-сервис по «уникализации» картинок ? А то если будет спрос и экспериметн пройдет удачно — можно оформить.

Собственно эксперимент:

Чтоб не просто так — возму в качестве подопытного сайт-визитку знакомого.

Сдёрнув пару картинок с Яндекса (каждая определена поисковиком в пяти разных вариантах — с разным текстовым окружением, разрешением и расширением).

Немного «накину» окружающего текста (чтоб хоть как то искалось по тем же ключевикам, что и картинки доноры), и линку установлю на сайт-визитку.

Капитальный ремонт электродвигателей, перемотка электродвигателей.

Ключевые слова я думаю понятны 🙂 Ремонт электродвигателей. Перемотка электродвигателей.

Ремонт электродвигателя

Рис.1  Ремонт электродвигателя (перемотка обмотки электродвигателя).
Исходное изображение растянули по горизонтали.

Ремонт электродвигателей

Рис.2  Электродвигатель — ремонт электродвигателей.
Исходное изображение зеркально перевернули.

Ремонт электродвигателя

Рис.3  Восстановление обмотки электродвигателя (капитальный ремонт электродвигателя).
Исходное изображение обрезали.

Ремонт электродвигателя

Рис.4  Капитальный ремонт электродвигателя. Восстановление обмотки электродвигателя.
На исходное изображение наложили текст.

Ремонт электродвигателя.

Рис.5  Капитальный ремонт электродвигателя. Восстановление обмотки электродвигателя.
Исходное изображение поместили в рамку.

ВСЁ — ждем индексации для анализа результатов

,

24 комментария на «“Плагиат картинок — поисковики и уникальность графического контента”»

  1. Интересно будет ознакомиться с результатами эксперимента. Будет шикарно, если работают такие простецкие способы уникализации. Если нет, то можно углубиться — комбинировать перечисленные выше методы, менять цвета, менять расположение элементов внутри изображения и т.д.
    Жаль нельзя подписаться на почтовые оповещения именно на эту тему.

  2. Нифига не проиндексило — проверил свою догадку, и к сожалению так и вышло —
    в robots.txt папочка wp_content стоит в disallow !!!
    а все картинки зауплоадченые именно в неё складываются !!!
    так что если юзаете движек на WP и желаете участвовать в поиске по картинкам — смотрите свой robots.txt

    так что судя по всему эксперимент подзатягивается

  3. Для правильности эксперимента не хватает исходного изображения без всяческих изменений.
    Идея действительно интересная и актуальная. Хотя против водяных знаков не попрешь )))

  4. Кстати очень действенный способ изготовления уникальной графики. И не подкапаешься, если что.

  5. Чтобы картинка точно стала уникальной, измените ее размер и нанесите поверх изображения текст — например адрес вашего сайта. у меня постоянно прокатывает

  6. Онлайн-сервис по «уникализации» картинок думаю будет интересен, особенно если бесплатно или за небольшую плату.

  7. Перед тем как делать новый проект, ты бы сначала закончил с сервисом обмена постовыми. А сервис занимающийся уникализацией картинок помойму не актуален.

  8. Немного мнения с другой стороны баррикады…

    Яша мои картинки находил, бывало и весьма подкорректированные!!! Я однажды с трудом свое фото узнал, газета его стырила, правда ссылка старая и иего на их сайте уже не найти …
    Но некоторые ресурсы оказываются честными и ссылку ставят, или фоту убирают.
    Обидно иногда находить свои фоты со срезанным копирайтом и без подписи…

  9. Xager — с сервисом по обмену постовыми я наверное завяжу — обычный линкатор получается. И спросом думаю пользоваться не будет — взаимные ссылки никакого веса не придают.
    То есть чекалку параметров и подбор площадки оставлю — ну и предложение обмена — а контроль самих постовых делать не буду.
    В итоге получится нечто вроде каталога площадок, желающих обменяться — а вот как именно этот обмен пройдёт — пусть уже договариваются сами.
    Скорее всего многие будут просто покупать качественные ссылки, проставленные вручную — в общем сервис для линк-менеджеров 🙂

  10. Эксперементировать стоит. Но графический контент дешевле и проще создать самому, чем искать его всети.

  11. Да не поумнели пока поисковики, чтобы нормально картинки индексить.
    Название свое для картинки и страницы — и все ок. Если совсем уж с гарантией — растяни чуть чуть — изменится расширение и размер. Иногда можно формат сменить — скажеи с PNG на Jpg. Только ИМХО — это пока особого смысла не имеет.

  12. а как яндекс определяет плагиат картинок ? Есть предположение, что яндекс изменяет размер изображения до некой стандартной для себя величины.

  13. А кто нибудь пробовал открыть картинку в редакторе кода и посмотреть что там. А там много интересной информации особенно касаемо файлов сохраненных в фотошопе. Знаю точно, что там прописывается инфа о лицензии (а то как определяют на какой копии продукта отредактирована картинка). Все это в коде спрятано и в полне возможно содержится информация о первоисточнике и какую обработку данный файл претерпел. Adobe в этом плане сильно взволнован возможностями своих продуктов при использовании в не закооных целях и возможно не только они. Так что в полне возможно, что остается какая то инфа об оригинале или в будующем это станет возможным и тогда уникальность графических файлов станет на равне с текстом. А потом придумают прогу которая будет убивать эту инфу из файла, короче все как обычно.
    Касаемо темы — врядли сможет поисковик определить схожесть фотографий. Сейчас это не реально, но если все редакторы графики станут одинакого сожранять тот же самый джепег с доп инфой, то вполе возможно.

  14. Самое обсуждаемое на блогах:
    Умер реставратор Савва Ямщиков
    Александру Ширвиндту — 75
    В Афганистане разбился вертолет Ми-8

  15. Яндекс.Картинки научились находить одинаковые изображения в интернете.
    http://clubs.ya.ru/company/replies.xml?item_no=14086&ncrnd=9723
    Поиск точных копий картинок никогда не был сложным для поисковиков, но любые небольшие модификации, изменение размеров, добавление надписей и даже просто пережатие JPG помогали картинке стать уникальной и попасть в результаты поиска в виде дубликата. Наше исследование картинок Рунета показало, что из 600 млн картинок половина уникальна (300 млн), вторая половина склеивается в отношении 3:1, 200 из 300 млн имеют дубликаты только на своем сайте. Когда мы начали решать задачу поиска дубликатов, мы просто хотели «почистить» выдачу от повторяющихся картинок и сделать выдачу более разнообразной. Но впоследствии мы поняли, что в наших руках оказалось нечто большее. Веб-мастера не любят в свои страницы вставлять картинки, которые загружаются с других сайтов, они их копируют, и зачастую меняют размеры, чтобы вписать в свой дизайн. Каждой копии картинки доставалось меньше подписей, поэтому не всегда просто было понять, насколько картинка соответствует запросу? Склейка дубликатов позволила найти тот небольшой процент изображений, который интересен многим веб-мастерам, а значит и пользователям. Для таких картинок у нас много подписей, мы можем сравнить их друг с другом и с запросом, чтобы понять, насколько картинка хорошо ему соответствует. Самый многочисленный класс картинок, оказавшийся в выигрыше, это пары — исходное изображение и его уменьшенная копия, лежащие на одном сайте. Оказывается, что маленькие картинки гораздо чаще хорошо подписаны, но они не попадают на первые страницы поисковиков из-за своих размеров. Благодаря новой технологии мы научились находить маленькую картинку, а показывать ее большой оригинал. На странице просмотра картинки мы показываем табличку копий картинки на разных сайтах. Во-первых, это помогает пользователям, которые догадались, что иногда через поиск по картинкам можно найти сайт с интересующей их информацией. Во-вторых, мы сами того не желая, рассказываем веб-мастерам о сайтах, которые без разрешения или же во благо воспользовались их творениями. Для этого достаточно лишь найти свою картинку в поиске. Задача поиска дубликатов оказалась технически сложной. Есть много научных работ на тему интеллектуального сравнения двух изображений, а для специалистов по «компьютерному зрению» задача опознать пару изображений, полученных изменением размеров, не является серьезной задачей. Однако никто из этих специалистов не имел возможности поработать с базой из 600 млн картинок. Попарное их сравнение на одном компьютере потребовало бы около 300 млн лет. К сожалению, обычными методами с помощью хеш-функций задачу решить тоже не удается. Но мы это сделали!

    Дмитрий Михалёв, Федор Романенко. Яндекс.Картинки

  16. А быстрее их не выискивать или самому создавать, а купить на каком-то микростоке подписку и забыть об этом.

    Не могу не поделиться новостью 🙂
    http://submit.depositphotos.com?ref=1001300 На этом стоке сейчас бесплатный триал дают, можно бесплатно по 10 стоковых фотографий в день скачивать.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *