Комментарии: Плагиат картинок — поисковики и уникальность графического контента

Автор: Webeditor

Webeditor — Sun, 21 Nov 2010 18:35:54 +0000

Пройдет еще с десяток лет и поисковики научаться отличать картинки даже с изменениями.

Автор: 4udov

4udov — Wed, 27 Jan 2010 14:51:56 +0000

А быстрее их не выискивать или самому создавать, а купить на каком-то микростоке подписку и забыть об этом.

Не могу не поделиться новостью 🙂
http://submit.depositphotos.com?ref=1001300 На этом стоке сейчас бесплатный триал дают, можно бесплатно по 10 стоковых фотографий в день скачивать.

Автор: stomlog

stomlog — Fri, 22 Jan 2010 15:12:00 +0000

Яндекс.Картинки научились находить одинаковые изображения в интернете.
http://clubs.ya.ru/company/replies.xml?item_no=14086&ncrnd=9723
Поиск точных копий картинок никогда не был сложным для поисковиков, но любые небольшие модификации, изменение размеров, добавление надписей и даже просто пережатие JPG помогали картинке стать уникальной и попасть в результаты поиска в виде дубликата. Наше исследование картинок Рунета показало, что из 600 млн картинок половина уникальна (300 млн), вторая половина склеивается в отношении 3:1, 200 из 300 млн имеют дубликаты только на своем сайте. Когда мы начали решать задачу поиска дубликатов, мы просто хотели «почистить» выдачу от повторяющихся картинок и сделать выдачу более разнообразной. Но впоследствии мы поняли, что в наших руках оказалось нечто большее. Веб-мастера не любят в свои страницы вставлять картинки, которые загружаются с других сайтов, они их копируют, и зачастую меняют размеры, чтобы вписать в свой дизайн. Каждой копии картинки доставалось меньше подписей, поэтому не всегда просто было понять, насколько картинка соответствует запросу? Склейка дубликатов позволила найти тот небольшой процент изображений, который интересен многим веб-мастерам, а значит и пользователям. Для таких картинок у нас много подписей, мы можем сравнить их друг с другом и с запросом, чтобы понять, насколько картинка хорошо ему соответствует. Самый многочисленный класс картинок, оказавшийся в выигрыше, это пары — исходное изображение и его уменьшенная копия, лежащие на одном сайте. Оказывается, что маленькие картинки гораздо чаще хорошо подписаны, но они не попадают на первые страницы поисковиков из-за своих размеров. Благодаря новой технологии мы научились находить маленькую картинку, а показывать ее большой оригинал. На странице просмотра картинки мы показываем табличку копий картинки на разных сайтах. Во-первых, это помогает пользователям, которые догадались, что иногда через поиск по картинкам можно найти сайт с интересующей их информацией. Во-вторых, мы сами того не желая, рассказываем веб-мастерам о сайтах, которые без разрешения или же во благо воспользовались их творениями. Для этого достаточно лишь найти свою картинку в поиске. Задача поиска дубликатов оказалась технически сложной. Есть много научных работ на тему интеллектуального сравнения двух изображений, а для специалистов по «компьютерному зрению» задача опознать пару изображений, полученных изменением размеров, не является серьезной задачей. Однако никто из этих специалистов не имел возможности поработать с базой из 600 млн картинок. Попарное их сравнение на одном компьютере потребовало бы около 300 млн лет. К сожалению, обычными методами с помощью хеш-функций задачу решить тоже не удается. Но мы это сделали!

Дмитрий Михалёв, Федор Романенко. Яндекс.Картинки

Автор: Drozd

Drozd — Thu, 07 Jan 2010 06:55:03 +0000

Есть сайт http://www.tineye.com который ищет дубликаты,только на зарубежных сайтах.

Автор: Always last

Always last — Mon, 20 Jul 2009 13:36:17 +0000

Самое обсуждаемое на блогах:
Умер реставратор Савва Ямщиков
Александру Ширвиндту - 75
В Афганистане разбился вертолет Ми-8

Автор: SS1001

SS1001 — Mon, 20 Jul 2009 13:35:22 +0000

А кто нибудь пробовал открыть картинку в редакторе кода и посмотреть что там. А там много интересной информации особенно касаемо файлов сохраненных в фотошопе. Знаю точно, что там прописывается инфа о лицензии (а то как определяют на какой копии продукта отредактирована картинка). Все это в коде спрятано и в полне возможно содержится информация о первоисточнике и какую обработку данный файл претерпел. Adobe в этом плане сильно взволнован возможностями своих продуктов при использовании в не закооных целях и возможно не только они. Так что в полне возможно, что остается какая то инфа об оригинале или в будующем это станет возможным и тогда уникальность графических файлов станет на равне с текстом. А потом придумают прогу которая будет убивать эту инфу из файла, короче все как обычно.
Касаемо темы — врядли сможет поисковик определить схожесть фотографий. Сейчас это не реально, но если все редакторы графики станут одинакого сожранять тот же самый джепег с доп инфой, то вполе возможно.

Автор: GTAlex

GTAlex — Mon, 20 Jul 2009 08:28:33 +0000

да что ты говоришь …
ты видимо вообще не читал пост

Автор: stephan

stephan — Mon, 20 Jul 2009 08:13:25 +0000

да ну эт все фигня! поисковый бот видит только название картинки!

Автор: Виктор

Виктор — Tue, 07 Jul 2009 23:38:59 +0000

а как яндекс определяет плагиат картинок ? Есть предположение, что яндекс изменяет размер изображения до некой стандартной для себя величины.

Автор: burka

burka — Thu, 18 Jun 2009 14:40:15 +0000

бюро для перевода различных текстов http://www.32perevoda.ru