<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Комментарии на: Плагиат картинок&#160;&#8212; поисковики и уникальность графического контента</title>
	<atom:link href="http://gtalex.ru/plagiat-kartinok-poiskoviki-i-unikalnost-graficheskogo-kontenta/feed" rel="self" type="application/rss+xml" />
	<link>http://gtalex.ru/plagiat-kartinok-poiskoviki-i-unikalnost-graficheskogo-kontenta</link>
	<description>SEO, Яндекс, Google, PHP, Apache, nginx, CMS, создание, взлом и защита сайтов...</description>
	<lastBuildDate>Mon, 21 May 2012 10:38:18 +0700</lastBuildDate>
	<generator>http://wordpress.org/?v=abc</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<xhtml:meta xmlns:xhtml="http://www.w3.org/1999/xhtml" name="robots" content="noindex" />
	<item>
		<title>От: Webeditor</title>
		<link>http://gtalex.ru/plagiat-kartinok-poiskoviki-i-unikalnost-graficheskogo-kontenta/comment-page-2#comment-12465</link>
		<dc:creator>Webeditor</dc:creator>
		<pubDate>Sun, 21 Nov 2010 18:35:54 +0000</pubDate>
		<guid isPermaLink="false">http://blog.gtalex.ru/?p=517#comment-12465</guid>
		<description>Пройдет еще с десяток лет и поисковики научаться отличать картинки даже с изменениями.</description>
		<content:encoded><![CDATA[<p>Пройдет еще с десяток лет и поисковики научаться отличать картинки даже с изменениями.</p>]]></content:encoded>
	</item>
	<item>
		<title>От: 4udov</title>
		<link>http://gtalex.ru/plagiat-kartinok-poiskoviki-i-unikalnost-graficheskogo-kontenta/comment-page-2#comment-9239</link>
		<dc:creator>4udov</dc:creator>
		<pubDate>Wed, 27 Jan 2010 14:51:56 +0000</pubDate>
		<guid isPermaLink="false">http://blog.gtalex.ru/?p=517#comment-9239</guid>
		<description>А быстрее их не выискивать или самому создавать, а купить на каком-то микростоке подписку и забыть об этом. 

Не могу не поделиться новостью :) 
http://submit.depositphotos.com?ref=1001300 На этом стоке сейчас бесплатный триал дают, можно бесплатно по 10 стоковых фотографий в день скачивать.</description>
		<content:encoded><![CDATA[<p>А быстрее их не выискивать или самому создавать, а купить на каком-то микростоке подписку и забыть об этом. </p><p>Не могу не поделиться новостью <img src='http://gtalex.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />  </p><p><noindex><a rel="nofollow" title="http://submit.depositphotos.com?ref=1001300" target="_blank" href="http://gtalex.ru/go/http://submit.depositphotos.com?ref=1001300">submit.depositphotos.com?ref=1001300</a></noindex> На этом стоке сейчас бесплатный триал дают, можно бесплатно по 10 стоковых фотографий в день скачивать.</p>]]></content:encoded>
	</item>
	<item>
		<title>От: stomlog</title>
		<link>http://gtalex.ru/plagiat-kartinok-poiskoviki-i-unikalnost-graficheskogo-kontenta/comment-page-2#comment-9168</link>
		<dc:creator>stomlog</dc:creator>
		<pubDate>Fri, 22 Jan 2010 15:12:00 +0000</pubDate>
		<guid isPermaLink="false">http://blog.gtalex.ru/?p=517#comment-9168</guid>
		<description>Яндекс.Картинки научились находить одинаковые изображения в интернете.
http://clubs.ya.ru/company/replies.xml?item_no=14086&amp;ncrnd=9723
 Поиск точных копий картинок никогда не был сложным для поисковиков, но любые небольшие модификации, изменение размеров, добавление надписей и даже просто пережатие JPG помогали картинке стать уникальной и попасть в результаты поиска в виде дубликата. Наше исследование картинок Рунета показало, что из 600 млн картинок половина уникальна (300 млн), вторая половина склеивается в отношении 3:1, 200 из 300 млн имеют дубликаты только на своем сайте. Когда мы начали решать задачу поиска дубликатов, мы просто хотели &quot;почистить&quot; выдачу от повторяющихся картинок и сделать выдачу более разнообразной. Но впоследствии мы поняли, что в наших руках оказалось нечто большее. Веб-мастера не любят в свои страницы вставлять картинки, которые загружаются с других сайтов, они их копируют, и зачастую меняют размеры, чтобы вписать в свой дизайн. Каждой копии картинки доставалось меньше подписей, поэтому не всегда просто было понять, насколько картинка соответствует запросу? Склейка дубликатов позволила найти тот небольшой процент изображений, который интересен многим веб-мастерам, а значит и пользователям. Для таких картинок у нас много подписей, мы можем сравнить их друг с другом и с запросом, чтобы понять, насколько картинка хорошо ему соответствует. Самый многочисленный класс картинок, оказавшийся в выигрыше, это пары - исходное изображение и его уменьшенная копия, лежащие на одном сайте. Оказывается, что маленькие картинки гораздо чаще хорошо подписаны, но они не попадают на первые страницы поисковиков из-за своих размеров. Благодаря новой технологии мы научились находить маленькую картинку, а показывать ее большой оригинал. На странице просмотра картинки мы показываем табличку копий картинки на разных сайтах. Во-первых, это помогает пользователям, которые догадались, что иногда через поиск по картинкам можно найти сайт с интересующей их информацией. Во-вторых, мы сами того не желая, рассказываем веб-мастерам о сайтах, которые без разрешения или же во благо воспользовались их творениями. Для этого достаточно лишь найти свою картинку в поиске. Задача поиска дубликатов оказалась технически сложной. Есть много научных работ на тему интеллектуального сравнения двух изображений, а для специалистов по &quot;компьютерному зрению&quot; задача опознать пару изображений, полученных изменением размеров, не является серьезной задачей. Однако никто из этих специалистов не имел возможности поработать с базой из 600 млн картинок. Попарное их сравнение на одном компьютере потребовало бы около 300 млн лет. К сожалению, обычными методами с помощью хеш-функций задачу решить тоже не удается. Но мы это сделали! 

Дмитрий Михалёв, Федор Романенко. Яндекс.Картинки</description>
		<content:encoded><![CDATA[<p>Яндекс.Картинки научились находить одинаковые изображения в интернете.</p><p><noindex><a rel="nofollow" title="http://clubs.ya.ru/company/replies.xml?item_no=14086&amp;ncrnd=9723" target="_blank" href="http://gtalex.ru/go/http://clubs.ya.ru/company/replies.xml?item_no=14086&amp;ncrnd=9723">clubs.ya.ru/company/repli...6&amp;ncrnd=9723</a></noindex></p><p>Поиск точных копий картинок никогда не был сложным для поисковиков, но любые небольшие модификации, изменение размеров, добавление надписей и даже просто пережатие JPG помогали картинке стать уникальной и попасть в результаты поиска в виде дубликата. Наше исследование картинок Рунета показало, что из 600 млн картинок половина уникальна (300 млн), вторая половина склеивается в отношении 3:1, 200 из 300 млн имеют дубликаты только на своем сайте. Когда мы начали решать задачу поиска дубликатов, мы просто хотели &laquo;почистить&raquo; выдачу от повторяющихся картинок и сделать выдачу более разнообразной. Но впоследствии мы поняли, что в наших руках оказалось нечто большее. Веб-мастера не любят в свои страницы вставлять картинки, которые загружаются с других сайтов, они их копируют, и зачастую меняют размеры, чтобы вписать в свой дизайн. Каждой копии картинки доставалось меньше подписей, поэтому не всегда просто было понять, насколько картинка соответствует запросу? Склейка дубликатов позволила найти тот небольшой процент изображений, который интересен многим веб-мастерам, а значит и пользователям. Для таких картинок у нас много подписей, мы можем сравнить их друг с другом и с запросом, чтобы понять, насколько картинка хорошо ему соответствует. Самый многочисленный класс картинок, оказавшийся в выигрыше, это пары&nbsp;&mdash; исходное изображение и его уменьшенная копия, лежащие на одном сайте. Оказывается, что маленькие картинки гораздо чаще хорошо подписаны, но они не попадают на первые страницы поисковиков из-за своих размеров. Благодаря новой технологии мы научились находить маленькую картинку, а показывать ее большой оригинал. На странице просмотра картинки мы показываем табличку копий картинки на разных сайтах. Во-первых, это помогает пользователям, которые догадались, что иногда через поиск по картинкам можно найти сайт с интересующей их информацией. Во-вторых, мы сами того не желая, рассказываем веб-мастерам о сайтах, которые без разрешения или же во благо воспользовались их творениями. Для этого достаточно лишь найти свою картинку в поиске. Задача поиска дубликатов оказалась технически сложной. Есть много научных работ на тему интеллектуального сравнения двух изображений, а для специалистов по &laquo;компьютерному зрению&raquo; задача опознать пару изображений, полученных изменением размеров, не является серьезной задачей. Однако никто из этих специалистов не имел возможности поработать с базой из 600 млн картинок. Попарное их сравнение на одном компьютере потребовало бы около 300 млн лет. К сожалению, обычными методами с помощью хеш-функций задачу решить тоже не удается. Но мы это сделали! </p><p>Дмитрий Михалёв, Федор Романенко. Яндекс.Картинки</p>]]></content:encoded>
	</item>
	<item>
		<title>От: Drozd</title>
		<link>http://gtalex.ru/plagiat-kartinok-poiskoviki-i-unikalnost-graficheskogo-kontenta/comment-page-2#comment-8988</link>
		<dc:creator>Drozd</dc:creator>
		<pubDate>Thu, 07 Jan 2010 06:55:03 +0000</pubDate>
		<guid isPermaLink="false">http://blog.gtalex.ru/?p=517#comment-8988</guid>
		<description>Есть сайт http://www.tineye.com который ищет дубликаты,только на зарубежных сайтах.</description>
		<content:encoded><![CDATA[<p>Есть сайт <noindex><a rel="nofollow" title="http://www.tineye.com" target="_blank" href="http://gtalex.ru/go/http://www.tineye.com">www.tineye.com</a></noindex> который ищет дубликаты,только на зарубежных сайтах.</p>]]></content:encoded>
	</item>
	<item>
		<title>От: Always last</title>
		<link>http://gtalex.ru/plagiat-kartinok-poiskoviki-i-unikalnost-graficheskogo-kontenta/comment-page-2#comment-8043</link>
		<dc:creator>Always last</dc:creator>
		<pubDate>Mon, 20 Jul 2009 13:36:17 +0000</pubDate>
		<guid isPermaLink="false">http://blog.gtalex.ru/?p=517#comment-8043</guid>
		<description>Самое обсуждаемое на блогах:&lt;br/&gt;Умер реставратор Савва Ямщиков&lt;br/&gt;Александру Ширвиндту - 75&lt;br/&gt;В Афганистане разбился вертолет Ми-8</description>
		<content:encoded><![CDATA[<p>Самое обсуждаемое на блогах:<br />Умер реставратор Савва Ямщиков<br />Александру Ширвиндту&nbsp;&mdash; 75<br />В Афганистане разбился вертолет Ми-8</p>]]></content:encoded>
	</item>
	<item>
		<title>От: SS1001</title>
		<link>http://gtalex.ru/plagiat-kartinok-poiskoviki-i-unikalnost-graficheskogo-kontenta/comment-page-2#comment-8042</link>
		<dc:creator>SS1001</dc:creator>
		<pubDate>Mon, 20 Jul 2009 13:35:22 +0000</pubDate>
		<guid isPermaLink="false">http://blog.gtalex.ru/?p=517#comment-8042</guid>
		<description>А кто нибудь пробовал открыть картинку в редакторе кода и посмотреть что там. А там много интересной информации особенно касаемо файлов сохраненных в фотошопе. Знаю точно, что там прописывается инфа о лицензии (а то как определяют на какой копии продукта отредактирована картинка). Все это в коде спрятано и в полне возможно содержится информация о первоисточнике и какую обработку данный файл претерпел. Adobe в этом плане сильно взволнован возможностями своих продуктов при использовании в не закооных целях и возможно не только они. Так что в полне возможно, что остается какая то инфа об оригинале или в будующем это станет возможным и тогда уникальность графических файлов станет на равне с текстом. А потом придумают прогу которая будет убивать эту инфу из файла, короче все как обычно. 
Касаемо темы - врядли сможет поисковик определить схожесть фотографий. Сейчас это не реально, но если все редакторы графики станут одинакого сожранять тот же самый джепег с доп инфой, то вполе возможно.</description>
		<content:encoded><![CDATA[<p>А кто нибудь пробовал открыть картинку в редакторе кода и посмотреть что там. А там много интересной информации особенно касаемо файлов сохраненных в фотошопе. Знаю точно, что там прописывается инфа о лицензии (а то как определяют на какой копии продукта отредактирована картинка). Все это в коде спрятано и в полне возможно содержится информация о первоисточнике и какую обработку данный файл претерпел. Adobe в этом плане сильно взволнован возможностями своих продуктов при использовании в не закооных целях и возможно не только они. Так что в полне возможно, что остается какая то инфа об оригинале или в будующем это станет возможным и тогда уникальность графических файлов станет на равне с текстом. А потом придумают прогу которая будет убивать эту инфу из файла, короче все как обычно. </p><p>Касаемо темы&nbsp;&mdash; врядли сможет поисковик определить схожесть фотографий. Сейчас это не реально, но если все редакторы графики станут одинакого сожранять тот же самый джепег с доп инфой, то вполе возможно.</p>]]></content:encoded>
	</item>
	<item>
		<title>От: GTAlex</title>
		<link>http://gtalex.ru/plagiat-kartinok-poiskoviki-i-unikalnost-graficheskogo-kontenta/comment-page-2#comment-8034</link>
		<dc:creator>GTAlex</dc:creator>
		<pubDate>Mon, 20 Jul 2009 08:28:33 +0000</pubDate>
		<guid isPermaLink="false">http://blog.gtalex.ru/?p=517#comment-8034</guid>
		<description>да что ты говоришь ...
ты видимо вообще не читал пост</description>
		<content:encoded><![CDATA[<p>да что ты говоришь ...</p><p>ты видимо вообще не читал пост</p>]]></content:encoded>
	</item>
</channel>
</rss>

