<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Insight IT &#187; Сеть</title>
	<atom:link href="http://www.insight-it.ru/category/set/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.insight-it.ru</link>
	<description>Информационные технологии</description>
	<lastBuildDate>Sun, 25 Apr 2010 14:19:58 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.1</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Новый Google: интернет-гигант проливает свет на темы поиска в реальном времени, локального поиска, облачных вычислений и освобождения данных</title>
		<link>http://www.insight-it.ru/set/novyjj-google-internet-gigant-prolivaet-svet-na-temy-poiska-v-realnom-vremeni-lokalnogo-poiska-oblachnykh-vychislenijj-i-osvobozhdeniya-dannykh/</link>
		<comments>http://www.insight-it.ru/set/novyjj-google-internet-gigant-prolivaet-svet-na-temy-poiska-v-realnom-vremeni-lokalnogo-poiska-oblachnykh-vychislenijj-i-osvobozhdeniya-dannykh/#comments</comments>
		<pubDate>Tue, 29 Dec 2009 15:17:27 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Сеть]]></category>
		<category><![CDATA[cloud computing]]></category>
		<category><![CDATA[data liberation]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[local search]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[realtime search]]></category>
		<category><![CDATA[интервью]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[облачные вычисления]]></category>
		<category><![CDATA[освобождение данных]]></category>
		<category><![CDATA[поиск]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=385</guid>
		<description><![CDATA[Когда речь заходит о продуктовых и бизнес стратегиях, Google обычно становится одной из самых скрытных и секретных компаний. Но не смотря на это, интернет-гигант некоторое время назад согласился дать серию интервью, в основном с участием высшего продуктового менеджмета, работающего в штабквартире в Mountain View, CA.
В четырех отдельных интервью, сотрудники Google окунулись в самые насущные темы, [...]]]></description>
			<content:encoded><![CDATA[<p>Когда речь заходит о продуктовых и бизнес стратегиях, Google обычно становится одной из самых скрытных и секретных компаний. Но не смотря на это, интернет-гигант некоторое время назад согласился дать серию интервью, в основном с участием высшего продуктового менеджмета, работающего в штабквартире в Mountain View, CA.</p>
<p>В четырех отдельных интервью, сотрудники Google окунулись в самые насущные темы, наиболее актуальные для компании в целом. Среди них оказались различные вопросы, начиная с поиска в реальном времени, локального поиска, и заканчивая облачными вычислениями, а также так называемой возможностью освобождения данных. Под освобождением данных имеется ввиду комплекс мер, направленных на предоставлении пользователям возможности экспортировать их файлы и другую цифровую информацию из продуктов Google (если они сами этого захотят, конечно же).</p>
<p>Достаточно любопытный факт: менеджеры Google реально очень скучные. И им правда нравится выглядеть именно так (по крайней мере пока их PR-коллеги находятся рядом). Они не разговаривают о конкурентах. Они не делают прогнозов о развитии индустрии. И они не говорят конкретно кто над чем работает внутри Google. Просто-напросто они фокусируются на совершенствовании своих продуктов, особенно в направлении удобства использования пользователями, разве этого не достаточно?</p>
<p>Возможно Jack Menzel, старший продукт-менеджер, лучше всего это выразил, когда пошутил о &laquo;неблагодарности&raquo; работы над веб-поиском в Google: &laquo;Вы демонстрируете [новую функцию поиска] людям, а они говорят: &#39;Да, вроде она работает, ну и что?&#39;&raquo; (Как быстро все мы забываем, каково это было искать информацию в Интернете всего несколько лет назад.) Что ж, без дальнейших предисловий, перейдем к основным моментам, связанным с различными аспектами работы Google.</p>
<p><span id="more-385"></span> <em>По мотивам <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.xconomy.com/national/2009/12/21/the-new-google-internet-giant-opens-up-about-real-time-and-local-search-cloud-computing-and-data-liberation/?single_page=true"  target="_blank" rel="external nofollow">статьи на xconomy.com</a></noindex>, автор <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.xconomy.com/author/ghuang/" title="Posts by Gregory T. Huang"  target="_blank" rel="external nofollow">Gregory T. Huang</a></noindex>.</em></p>
<h2>Поиск в реальном времени</h2>
<p>Google активно работает над максимально оперативным обновлением результатов поиска по сети Интернет, в том числе и по социальным медиа вроде Twitter или Facebook, практически так же быстро, как такая информация и публикуется.</p>
<p>Menzel, бывший сотрудник Microsoft, который изучал компьютерное ремесло в University of Washington, возглавляет продуктовую группу на данном фронте. Он говорит, что компания Google работала над ускорением процесса индексации и ранжирования на протяжении уже многих лет: когда-то данные обновлялись раз в месяц, потом обновление стало ежедневным, чтобы поспевать за блогами и новостными сайтами. В течении прошлого года <a href="/tag/twitter" target="_blank">Twitter</a> стал популярен и, как следствие, появилась достаточно критичная потребность в обновлении информации за считанные секунды или в крайнем случае минуты. &laquo;Мы двигались по направлению к тому, чтобы становиться все быстрее и быстрее, на протяжении уже достаточно длительного периода времени&raquo;, говорит Menzel. &laquo;Данная траектория развития была выбрана уже давно. Каждый шаг в данном направлении приводит к все новым и новым проблемам и трудностям. Мы верим, что именно получение доступа к свежей информации является одним из ключевых факторов, являющихся залогом успеха Google.&raquo; (В число остальных факторов, относящихся к самому поиску, входят такие показатели как релевантность, быстрота получения результата и полнота контента.)</p>
<p>Menzel считает, что самой сложной задачей является не просто быстродействие, а релевантность результатов потребностям пользователей (возможно, кто-то привык называть этот показатель словом <em>&laquo;пертинентность&raquo;</em>). &laquo;Это очень, очень непросто собирать свежий короткоживущий контент и ранжировать его рядом с, скажем, статьями из New York Times или просто постами из блогов.&raquo; Стоит заметить, что когда контент появился буквально только что, обычно на него еще практически никто не успел сослаться, а значит Google не может полноценно использовать PageRank, их классическую технологию.</p>
<p>Вместо этого, они &laquo;тяжело опираются на все то, что они выявили в течении последних 10 лет&raquo;, говорит Menzel. Это включает в себя, например, способы отбрасывания контента, который скорее всего является иррелевантным или спамом, в более общем случае.  Помимо этого он упоминал &laquo;совершенно новые сигналы&raquo;, скажем &laquo;новые языковые модели&raquo;, которые позволяют понять какие обновления являются релевантыми, а какие&nbsp;&mdash; просто горстка никому не нужных данных от какого-нибудь ученого-океанографа, или методы определения насколько тот или иной создатель контента авторитетен в своей области.</p>
<p>Говоря о будущем, Menzel повторил то, что казалось бы на сегодняшний день говорят все о поиске: еще рано. &laquo;На самом деле мы лишь начали работать над данной задачей и у нас все еще очень долгий путь впереди&raquo;. Он надеется, что в течении 5 лет Google сделает поиск намного более персонализированным, чем он есть сегодня. Например, Google будет знать что ты увлекаешься футболом, но привык называть его не &laquo;soccer&raquo;, а &laquo;football&raquo;, то есть помимо прочего поисковая система должна понимать кем является каждый ее конкретный пользователь, как и с кем он связан, кем он является в реальной жизни, где находится, и, тем самым, помогать ему организовывать всю информацию вокруг него.</p>
<p>&laquo;Поиск&nbsp;&mdash; все еще очень далекая от решения проблема,&raquo;&nbsp;&mdash; говорит Menzel.  "Существует еще масса вещей, которые очень не просто найти в Интернете."</p>
<h2>Локальный поиск</h2>
<p>В эту категорию попадают все виды поисковых запросов, так или иначе связынных с географической информацией, скажем &laquo;отели в Гонг-Конге&raquo; или &laquo;рестораны в Сиэттле&raquo;, а также запросы с мобильных устройств на поиск близлежайших мест, заведений, достопримечательностей и прочих объектов.</p>
<p>Carter Maslan, директор продуктового менеджмента в области локального поиска в Google, называет эту область &laquo;организацией мировой информации географически&raquo; , или созданием быстрого и простого гида по &laquo;гео-Интернету&raquo;. Самым сложным моментом в данном вопросе по его мнению является отображение всех этих различных способов выражения пользовательского запроса на очень большой массив локализированных данных, а также возвращение правильного ответа на полученный запрос в минимальные сроки.</p>
<p>Maslan, еще один экс-сотрудник Microsoft, говорит, что Google обрабатывает большое количество поисковых запросов для анализа того, как люди предпочитают искать локальную информацию, и как с географической точки зрения создаются ссылки на различные вещи. По его мнению конечная цель заключается в том, чтобы сделать поиск и обнаружение мест рядом с собой практически не требующим от пользователя каких-либо усилий. Наиболее знакомые сценарии, это помощь в ориентировании в новом окружении, скажем после приземления в аэропорту, или поиск баров во время ночной прогулки по пригородам Нью-Йорка.</p>
<p>Складывается впечатление, что все это должно плотно вписываться в более широкую стратегию Google, связанную с мобильными технологиями. &laquo;Ваш телефон знает многое&raquo;  - говорит Maslan. &laquo;Он знает где Вы сейчас находитесь, он может определить в каком направлении Вы направляетесь. Все не ограничивается только текстом в окошке для поискового запроса. Мы хотим вывести мобильную информацию на передний план.&raquo; Существующим на данный момент примером является <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.google.com/mobile/goggles/"  target="_blank" rel="external nofollow">Google Goggles</a></noindex>, приложение, которое позволяет сфотографировать логотип, достопримечательность или какое-то место и мгновенно получить информацию о нем.</p>
<p>Maslan считает, что основной отличительной чертой Google в области локального поиска является &laquo;открытость для всех источников&raquo;, что достаточно сложно с технической точки зрения. Это включает в себя пребывание в состоянии &laquo;активной глобальности&raquo;, а не просто в индексировании информации о ключевых станциях метро. &laquo;Масштаб, с которым Google работает с картографическими и гео-кодированными данными, в совокупности с пониманием принципов работы Интернета является ключем для успешной работы в данной области&raquo;.</p>
<p>Возможно в скором будущем мы увидим вещи вроде карт и списков компаний или мест от Google в еще большем количестве мест и языков по всему миру, с еще более точной информацией, чутко реагирующей на локальные события вроде открытия, закрытия или перемещения предприятий и организаций. &laquo;Мы четко понимаем, какие именно вещи у нас получаются лучше всего&raquo;&nbsp;&mdash; говорит Maslan. &laquo;У нас есть небольшие команды из людей, фанатично настроенных на реализацию их наиболее правильным образом&raquo;.</p>
<h2>Облачные вычисления</h2>
<p>Наверняка все наслышаны о знаменитых вычислениях &laquo;в облаках&raquo;, то есть с использованием программного обеспечения, работающем на удаленных серверах, часто нескольких одновременно и в виртуализированном окружении, а не прямо на персональном компьютере. В этом ключе Google наиболее интересует выполнение повседневных задач, таких как работа с электронной почтой, составление расписаний и управление документами. На самом деле это всего лишь часть более широкой стратегии Google по облачным вычисления&nbsp;&mdash; именно она создает видимость того, что потребитили, предприятия и организации арендуют вычислительный мощности и хранилища данных через Интернет, так как это дешевле и более эффективно для многих приложений.</p>
<p>Ken Norton, старший продукт-менеджер Google (а также выпускник Boston University и бывший предприниматель), поведал о Google Apps и стратегии компании в области облачных вычислений. Команда Norton&#39;а работает конкретно над Google Calendar, но Google Apps также включают в себя и другие продукты, такие как Gmail, Google Talk, Google Docs и Google Sites. “Сеть выигрывает на том, как приложения будут потребляться”&nbsp;&mdash; он сказал.</p>
<p>Ключевым преимуществом Google на данном фронте является масштаб и инфраструктура. &laquo;У нас есть настолько много серверов и датацентров по всему миру, что мы можем содержать их достаточно дешево и эффективно&raquo;&nbsp;&mdash; говорит Norton. Это преимущество оказывает влияние и на индивидуальные устройства, так как оно &laquo;открывает новые возможности&raquo; для потребителей, возможность использовать веб-приложения с любого типа устройств, будь то смартфон, нетбук или обычный полноразмерный ноутбук.</p>
<p>Работа Google в области облачных вычислений сфокусирована на двух уровнях: на первом располагаются готовые программные продукты вроде Google Apps, направленные на прямое потребление конечными пользователями (как индивидуальными, так и корпоративными); второй же уровень занимает App Engine, &laquo;облачная&raquo; платформа, предназначенная для использования разработчиками программного обеспечения для эффективного построения их собственных веб-продуктов.</p>
<p>Относительно прогнозов на следующий год на фронте облачных вычислений, Norton сказал, что &laquo;мы постоянно совершенствуемся&raquo;. В 2009 году было запущенно более 100 основных новых функциональных возможностей в Google Apps&nbsp;&mdash; таких вещей, как видео чат в GTalk или Gmail offline. Он считает, что Google &laquo;продолжит делать акцент на коммуникационных предложениях&raquo;. Помимо развития Gmail и Calendar, это включает в себя доведение до ума Google Docs и придание более завершенного вида набору их возможностей. Norton говорит, что Google также ищет возможности по расширению своих предложений в области коллаборации, в том числе в виде продуктов для крупного бизнеса, совместимыми с различными системами обеспечения безопасности для аутентификации.</p>
<p>Подведем черту: все выглядит как-будто Google совершает переход от фокусирования на бесплатных потребительских продуктах, работающих в &laquo;облаках&raquo;, к более активной работе над платными облачными сервисами для бизнес-пользователей.</p>
<h2>Освобождение данных</h2>
<p>Последнее время в компании все больше внимания уделяется предоставлению пользователям легко экспортировать их данные из продуктов Google, таких как Blogger, Google Maps, Google Docs, Chrome и App Engine (пользовательские данные разработчиков). На первый взгляд это может показаться очередным капризом PR-менеджеров, но на самом деле за этим фактом стоит более глубокая и интересная инновационная стратегия.</p>
<p>Brian Fitzpatrick, ветеран opensource разработок, возглавляет двухлетний проект от офисов Google в Чикаго. Основная идея заключается в оказании помощи пользователям, если они хотят получить свои файлы и другие данные из облака Google, чтобы у них была возможность перейти на какую-то другую систему, если они захотят. &laquo;Большинство людей не думает о возможности экспорта данных до тех пор пока не станет слишком поздно&raquo;&nbsp;&mdash; говорит Fitzpatrick. &laquo;Мы надеемся, что если вы прекратите использование одного нашего продукта сегодня, то у вас будет возможность попробовать другой продукт завтра.&raquo;</p>
<p>Помимо &laquo;создания правильных возможностей для пользователей&raquo; существует и другая мотивация. &laquo;Мы, как компания, старательно работаем над такими вещами, как поиск. Если пользователи становятся привязанным к вашим продуктам, то вы становитесь более самодовольными, расслабленными. Если же уйти достаточно просто, то вы будете серьезно мотивированны делать свои продукты как можно лучше, чтобы избежать ухода пользователей любой ценой.&raquo;</p>
<p>Что ж, теперь у нас есть эта возможность. Google считает, что эта открытость с точки зрения пользовательских данных, заставит компанию работать более старательно для удержания пользовательской базы. Fitzpatrick не знает других компаний, которые бы открыто заявляли об инициативе создания подобных возможностей для своих пользователей.</p>
<p>По его мнению наибольшая трудность лежит не собственно в разработке такого функционала, а в повышение осведомленности пользователей о наличии возможности экспортировать свои данные из облака. &laquo;Достаточно сложно заставить пользователей думать, что это на самом деле важно&raquo;. Но в целом этот подход достаточно достаточно хорошо вписывается в понятие о том, как потребители и корпоративные пользователи заботятся о всех своих данных, когда все большая и большая их част мигрирует &laquo;в облака&raquo; и как Google хочет быть ответственным за организацию мировых данным, шаг за шагом, на протяжении всего пути.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/set/novyjj-google-internet-gigant-prolivaet-svet-na-temy-poiska-v-realnom-vremeni-lokalnogo-poiska-oblachnykh-vychislenijj-i-osvobozhdeniya-dannykh/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>it&#039;s a pic</title>
		<link>http://www.insight-it.ru/set/its-a-pic/</link>
		<comments>http://www.insight-it.ru/set/its-a-pic/#comments</comments>
		<pubDate>Tue, 27 May 2008 16:35:48 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Сеть]]></category>
		<category><![CDATA[it\'s a pic]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[изображение]]></category>
		<category><![CDATA[информационные технологии]]></category>
		<category><![CDATA[поиск]]></category>
		<category><![CDATA[поисковые системы]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=80</guid>
		<description><![CDATA[Не удивлюсь, если заголовок этого поста вам не сказал ровным счетом ничего&#160;&#8212; это вполне логично. Именно эту ситуацию я и хотел бы сегодня исправить: it&#39;s a pic представляет собой...

...очередной интернет-проект. Хотели увидеть что-то более грандиозное?&#160;&#8212; читайте дальше!
Начать наверное стоит с обозначения основной сути: поисковая система изображений, ориентированная на глобальный рынок. Да-да, мы уже видели поиск [...]]]></description>
			<content:encoded><![CDATA[<p><img src="/wp-content/uploads/itsapic-logo.png" alt="it's a pic logo" title="логотип" style="float:left; margin:16px 4px;" />Не удивлюсь, если заголовок этого поста вам не сказал ровным счетом ничего&nbsp;&mdash; это вполне логично. Именно эту ситуацию я и хотел бы сегодня исправить: <strong>it&#39;s a pic</strong> представляет собой...<br />
<span id="more-80"></span><br />
...очередной интернет-проект. Хотели увидеть что-то более грандиозное?&nbsp;&mdash; читайте дальше!</p>
<p>Начать наверное стоит с обозначения основной сути: поисковая система изображений, ориентированная на глобальный рынок. Да-да, мы уже видели поиск картинок в исполнении Google/Yahoo!/MSN/Яндекс/Рамблер (нужное подчеркнуть)&nbsp;&mdash; скажете вы, так в чем же разница?</p>
<p>Сейчас объясню. Никогда не возникало мысли, что частенько поиск картинок в обычных поисковых системах по большей части выдает всякий бред, очень слабо коррелирующий с тем, что Вы на самом деле искали? Основная их проблема заключается в том, что способов провести ассоциацию между текстом и изображением не так-то много. Чаще всего в их распоряжении лишь HTML-документы, ссылающиеся на изображение. То есть на основании атрибута <strong>alt</strong> у тэга <strong>&lt;img /&gt;</strong> и изредка anchor-текста обычных ссылок, поисковая система должна составить представление о том, что же на самом деле изображено в графическом файле. Варианты ручного построения таких соответствий тоже существуют, но либо нужно платить огромнейшему количеству человек за рутинную работу (что-то на грани фантастики&nbsp;&mdash; количество изображений в Сети измеряется числом с слишком большим количеством нулей) или подталкивать людей заниматься этим бесплатно, оформив это, например, в виде online-игры. Обычно в таких играх двум участникам одновременно предоставляется один и тот же набор изображений, а их задачей является последовательно вводить свои ассоциации связанные с текущим изображением. Если они оба ввели одно и то же слово&nbsp;&mdash; оно ассоциируется с изображением, а пользователям начисляются виртуальные очки. В общем поиск изображений по ключевым словам&nbsp;&mdash; задача, связанная с массой проблем и неточностей.</p>
<p><strong>It&#39;s a pic</strong> является как раз поисковой системой, призванной избавить людей, ищущих изображения от всех этих проблем с неточностью и некорректностью результатов. Чтобы не придумывать каких-то временных решений проблемы было решено искоренить основательно: основная идея заключается в использовании в качестве критерия поиска не набор ключевых слов, а просто изображение. Сказать, что два изображения похожи, компьютеру намного проще, чем сказать что на картинке нарисован, например, жираф&nbsp;&mdash; именно на это и делает ставку этот проект.</p>
<p>Выглядит это примерно следующим образом: допустим Вы хотите найти побольше изображений заката и выбрать наиболее приглянувшееся, для этого достаточно загрузить в систему с локального компьютера изображение заката (хотя если оно уже присутствует в Сети&nbsp;&mdash; можно и просто указать URL) и собственно говоря нажать кнопку &laquo;Найти&raquo;&nbsp;&mdash; вот и все! Вот ваши результаты:<br />
<a href="/wp-content/uploads/itsapic-scr-s.png" target="_blank"><img src="/wp-content/uploads/itsapic-scr-s.png" alt="пример работы it's a pic" title="пример работы" /></a></p>
<p>Наверное Вы уже заметили, что написав приличную часть поста я так до сих пор и не дал ссылки на саму поисковую систему. У этого есть достаточно простая причина&nbsp;&mdash; проект находится в стадии <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.itsapic.com"  target="_blank" rel="nofollow">закрытого β-тестирования</a></noindex> (что вы собственно говоря могли прочитать и на скриншоте чуть выше). Так что недостаточная точность поиска вполне объясняется скромной базой данных изображений&nbsp;&mdash; можно заметить на все том же скриншоте семизначную цифру количества изображений в его базе. Но даже из такого небольшого количества изображений системе удается достаточно точно выбрать похожие на образец экземпляры и отсортировать их в соответствии с их релевантностью оригиналу.</p>
<p>Наверняка у Вас снова напрашивается вопрос: а как же я собственно попал в закрытую бету проекта и узнал так много о нем еще до его запуска? Нет, мне никто так до сих пор и не дает эксклюзивной информации о проектах, но эта информация была получена и не из Сети. Не буду тянуть и раскрою все карты: я просто-напросто с недавних пор участвую в этом проекте. Собственно говоря одной из основных моих задач является вывод этой системы из закрытой бета-версии в открытую, то есть обеспечить работоспособность алгоритмов при несколько больших нагрузках, чем один-два разработчика одновременно, ищущих что-то просто для проверки и тестирования.</p>
<p><script type="text/javascript">
</script></p>
<p>А пост этот на самом деле я написал с несколько более коварными целями, чем просто поведать читателям о проекте: на данный момент <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.mvk-it.com/hiring.html"  target="_blank" rel="nofollow">активно ведется рекрутинг сотрудников на разные роли в этом проекте</a></noindex> и я надеюсь, что среди читателей найдутся люди, заинтересованные в том, чтобы тоже принять в нем участие. Если Вы считаете себя как раз таким человеком&nbsp;&mdash; можете попробовать связаться со <a href="/author" target="_blank">мной</a> или отправить письмо на указанный по ссылке выше почтовый ящик:<img src="/wp-content/uploads/itsapic-mail.png" alt="jobs mvk-it com"  style="display:inline; margin-top:2px;" />.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/set/its-a-pic/feed/</wfw:commentRss>
		<slash:comments>40</slash:comments>
		</item>
		<item>
		<title>DMOZ.org</title>
		<link>http://www.insight-it.ru/set/seo/dmozorg/</link>
		<comments>http://www.insight-it.ru/set/seo/dmozorg/#comments</comments>
		<pubDate>Mon, 19 May 2008 14:14:39 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[DMOZ.org]]></category>
		<category><![CDATA[ODP]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[Open Directory Project]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[каталог]]></category>
		<category><![CDATA[редактор]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=78</guid>
		<description><![CDATA[Возможно Вы уже обратили внимание, что в начале мая данный блог был добавлен в один из крупнейших (если не самый крупнейший) каталог интернет-ресурсов&#160;&#8212; DMOZ.org, также известный как Open Directory Project.  Само по себе это событие достаточно значимо для любого сайта, но я почему-то не счел нужным писать по этому поводу отдельный пост, видимо просто [...]]]></description>
			<content:encoded><![CDATA[<p>Возможно Вы уже обратили внимание, что в начале мая данный блог был добавлен в один из крупнейших (если не самый крупнейший) каталог интернет-ресурсов&nbsp;&mdash; <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://dmoz.org"  target="_blank" rel="nofollow"><strong>DMOZ.org</strong></a></noindex>, также известный как <em>Open Directory Project</em>.  Само по себе это событие достаточно значимо для любого сайта, но я почему-то не счел нужным писать по этому поводу отдельный пост, видимо просто так как других слов кроме как &laquo;Ура! Мой блог попал в DMOZ!!!&raquo; у меня тогда не нашлось.</p>
<p>Сегодня же произошло другое событие, связанное с этим крупным каталогом: я <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.dmoz.org/profiles/m11.html"  target="_blank" rel="nofollow">стал редактором</a></noindex> очень небольшого его раздела&nbsp;&mdash; <strong>World/Russian/Компьютеры/Программирование/Блоги</strong>. Раздел и правда оказался очень маленький&nbsp;&mdash; сегодняшним же утром за часок-другой разгреб все заявки, которые там лежали нерасмотренными. В целом впечатления от данного процесса очень положительные&nbsp;&mdash; нашел несколько интересных сайтов в заявках, которые потом еще достаточно долго читал просто так, уже после принятия решения о добавлении в каталог. Хотелось бы конечно раздел побольше, но я думаю всему свое время. Если у кого-нибудь из Вас есть блоги, подходящие под тематику выделенного мне раздела&nbsp;&mdash; <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.dmoz.org/cgi-bin/add.cgi?where=World/Russian/%d0%9a%d0%be%d0%bc%d0%bf%d1%8c%d1%8e%d1%82%d0%b5%d1%80%d1%8b/%d0%9f%d1%80%d0%be%d0%b3%d1%80%d0%b0%d0%bc%d0%bc%d0%b8%d1%80%d0%be%d0%b2%d0%b0%d0%bd%d0%b8%d0%b5/%d0%91%d0%bb%d0%be%d0%b3%d0%b8"  rel="nofollow" target="_blank">добавляйте их</a></noindex>, с удовольствием рассмотрю.<br />
<img src="/wp-content/uploads/dmoz-logo.gif" alt="DMOZ Logo" title="DMOZ" style="float: right; margin:4px;" /></p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/set/seo/dmozorg/feed/</wfw:commentRss>
		<slash:comments>26</slash:comments>
		</item>
		<item>
		<title>hCard</title>
		<link>http://www.insight-it.ru/set/mikroformaty/hcard/</link>
		<comments>http://www.insight-it.ru/set/mikroformaty/hcard/#comments</comments>
		<pubDate>Sun, 13 Apr 2008 19:51:03 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Микроформаты]]></category>
		<category><![CDATA[hcard]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[XHTML]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[персональная информация]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/microformats/hcard/</guid>
		<description><![CDATA[hCard представляет собой реализацию спецификации  RFC 2426 (более известной как vCard) в виде микроформата. Основной его целью является предоставление стандарта оформления персональных данных на просторах Сети, но помимо этого имеется возможность указания информации об компаниях, организациях или местах.

Как и любой другой микроформат, hCard реализуется без нарушения стандартов XHTML с помощью атрибутов тэга class, причем [...]]]></description>
			<content:encoded><![CDATA[<p><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://microformats.org/wiki/hcard"  target="_blank" rel="nofollow">hCard</a></noindex> представляет собой реализацию спецификации  <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.ietf.org/rfc/rfc2426.txt"  target="_blank" rel="nofollow">RFC 2426</a></noindex> (более известной как vCard) в виде микроформата. Основной его целью является предоставление стандарта оформления персональных данных на просторах Сети, но помимо этого имеется возможность указания информации об компаниях, организациях или местах.<br />
<span id="more-65"></span><br />
Как и любой другой микроформат, hCard реализуется без нарушения стандартов XHTML с помощью атрибутов тэга <strong>class</strong>, причем какие именно тэги используются&nbsp;&mdash; не важно. Для оформления данных используя этот микроформат достаточно лишь объявить какой-либо тэг hCard объектом с помощью <strong>class="vcard"</strong> и разместить внутри него все тэги, обозначающие какое-либо свойство объекта. Большая часть информации, предоставляемой в соответствии с этим микроформатом является опциональной,  единственным обязательным свойством является имя объекта&nbsp;&mdash; <strong>class="fn"</strong>. Помимо этого в атрибуте <strong>profile</strong> тэга <strong>&lt;head&gt;</strong> принято указывать адрес <strong>http://www.w3.org/2006/03/hcard</strong>.</p>
<p>В целом все свойства объектов hCard можно поделить на семь групп:</p>
<dl>
<dt><strong>идентификационные</strong></dt>
<dd>&ndash; различные варианты имен объекта.</dd>
<dt><strong>адресные</strong></dt>
<dd>&ndash; указания различных адресов, каким-либо образом ассоциирующихся с объектом: место жительство, работы и тому подобные.</dd>
<dt><strong>телекоммуникационные</strong></dt>
<dd>&ndash; любые формы контактной информации: номера телефонов, факс, адреса электронной почты и так далее.</dd>
<dt><strong>географические</strong></dt>
<dd>&ndash; месторасположение объекта.</dd>
<dt><strong>организационные</strong></dt>
<dd>&ndash; информация о должности и компании или организации, в которой работает объект.</dd>
<dt><strong>уточняющие</strong></dt>
<dd>&ndash; любая дополнительная информация об объекте.</dd>
<dt><strong>безопасность</strong></dt>
<dd>&ndash; ограничение доступа к информации в hCard.</dd>
</dl>
<p>Значением каждого свойства является видимый пользователю текст, получающийся в результате обработки документа браузером (или другим парсером данных). Но стоит несколько остановиться на свойстве photo, так как для него действуют несколько другие правила размещения значения:</p>
<ul>
<li>при использовании свойства photo в тэге <strong>&lt;a&gt;</strong>, значением является адрес из атрибута <strong>href</strong>;</li>
<li>в тэге <strong>&lt;img&gt;</strong>, значением является само изображение, то есть значение атрибута <strong>src</strong></li>
<li>в <strong>&lt;object&gt;</strong>, значением является атрибут <strong>data</strong>, то есть его источник данных.</li>
</ul>
<p>Раз уж зашла речь об размещении значений свойств, то сразу хочется сказать об небольшом исключении в виде тэга <strong>&lt;abbr&gt;</strong>, где оно задается в атрибуте <strong>title</strong>, а внутри самого тэга&nbsp;&mdash; некое более удобное для чтения людьми его представление.</p>
<p>Если тэг, обозначенный любым свойством, содержит какую-либо информацию помимо самого значения свойства, то для отделения релевантного контента от лишней информации можно разместить внутри тэга свойства дочерние объекты, обозначив их атрибутом <strong>class="value"</strong>. Это даст понять парсеру микроформата, что собрав воедино (методом конкатенации) все значения помеченных таким образом объектов он сможет получить значение исходного свойства. Описание получилось несколько запутанным, так что лучше продемонстрировать этот принцип на примере, в котором значению свойства <strong>fn</strong> будет присвоено значение &laquo;Иван Блинков&raquo;:</p>
<pre lang="XHTML">
<div class="vcard">
<p class="fn"><span="value">Иван </span>подпрыгнул три раза на месте,
  обернулся и увидел написанную на стене
  свою фамилию: <span class="value">Блинков</span>.
</div>
</pre>
<p>Как не трудно заметить, значение свойства разбавлено массой ненужной информации, но с помощью тэгов с атрибутом <strong>class="value"</strong> мне удалось выделить лишь важную информацию, не поменяв при этом внешний вид документа. Парсер микроформатов, читая этот документ, соединит обе части и получит в итоге как раз &laquo;Иван Блинков&raquo;, что и будет соответствовать желаемому имени объекта.</p>
<p>Вы заметили в предыдущем примере пробел после моего имени? Он был поставлен для того, чтобы при конкатенации составные части значения не слились в одно слово &laquo;ИванБлинков&raquo;,  не самый удобный подход к решению проблемы, но у него есть альтернатива в виде тэга <strong>&lt;abbr;&gt;</strong> (не забываем про упомянутое чуть выше исключение):</p>
<pre lang="XHTML">
<div class="vcard">
<abbr class="fn" title="Иван Блинков">Иван</abbr>
  подпрыгнул три раза на месте,
  обернулся и увидел написанную на стене
  свою фамилию: Блинков.
</div>
</pre>
<p>Общей информации на сегодня хватит, так что перейду к деталям реализации.</p>
<table width="100%" cellspacing="0" border="1" cellpadding="2">
<tbody>
<tr align="center">
<td colspan="2">
<h4>Идентификационные свойства</h4>
</td>
</tr>
<tr>
<th width="30%" valign="top" align="left"><strong>Свойство</strong></th>
<th width="70%" valign="top" align="left"><strong>Описание</strong></th>
</tr>
<tr>
<td valign="top">fn</td>
<td valign="top">полное имя объекта <em>(formatted name)</em></td>
</tr>
<tr>
<td valign="top">n</td>
<td valign="top">имя, используется для идентификации составных частей fn <em>(name)</em></td>
</tr>
<tr>
<td valign="top">nickname</td>
<td valign="top">прозвище</td>
</tr>
<tr>
<td valign="top">bday</td>
<td valign="top">день рождения в формате <strong>YYYY-MM-DD</strong> <em>(birthday) </em></td>
</tr>
<tr>
<td valign="top">photo</td>
<td valign="top">фотография</td>
</tr>
</tbody>
</table>
<p>Свойство <strong>fn</strong> уже успели слегка обсудить, так что перейдем сразу к <strong>n</strong>. Как уже было сказано, используется он для детализации составных частей полного имени объекта, для чего оно имеет ряд подсвойств, используемых в дочерних элементах:</p>
<dl>
<dt><strong>given-name</strong></dt>
<dd>&ndash; имя.</dd>
<dt><strong>additional-name</strong></dt>
<dd>&ndash; отчество.</dd>
<dt><strong>family-name</strong></dt>
<dd>&ndash; фамилия.</dd>
<dt><strong>honorific-preffix</strong></dt>
<dd>&ndash; какой-либо префикс к имени, отображающий социальный статус человек.</dd>
<dt><strong>honorific-suffix</strong></dt>
<dd>&ndash; суффикс с тем же смыслом.</dd>
</dl>
<p>Выглядит это все примерно так, ничего сложного:</p>
<pre lang="XHTML">
<div class="vcard">
<p class="fn n">
    <span="given-name">Иван</span>
    <span="additiona-name">Иванович</span>
    <span="family-name">Блинков</span>
</div>
</pre>
<h4>Адресные свойства</h4>
<p>Адрес может быть указан в двух формах:</p>
<ul>
<li><strong>adr</strong>&nbsp;&mdash; структурированной (с указанием составных частей);</li>
<li><strong>label</strong>&nbsp;&mdash; не структурированной.</li>
</ul>
<p>Для структурированного адреса используются подсвойства по аналогии с <strong>n</strong>:</p>
<table width="100%" cellspacing="0" border="1" cellpadding="2">
<tbody>
<tr>
<th width="30%" valign="top" align="left"><strong>Свойство</strong></th>
<th width="70%" valign="top" align="left"><strong>Описание</strong></th>
</tr>
<tr>
<td valign="top">post-office-box</td>
<td valign="top">почтовый адрес</td>
</tr>
<tr>
<td valign="top">extended-address</td>
<td valign="top">полный адрес (с номером подъезда, квартиры и т.д.)</td>
</tr>
<tr>
<td valign="top">street-address</td>
<td valign="top">улица</td>
</tr>
<tr>
<td valign="top">locality</td>
<td valign="top">город</td>
</tr>
<tr>
<td valign="top">region</td>
<td valign="top">регион, штат или провинция</td>
</tr>
<tr>
<td valign="top">postal-code</td>
<td valign="top">индекс</td>
</tr>
<tr>
<td valign="top">region</td>
<td valign="top">регион, штат или провинция</td>
</tr>
<tr>
<td valign="top">type</td>
<td valign="top">тип адреса, то есть то, как он связан с исходным идивидом, должен принимать одно из значений: dom, parcel, home, work, pref</td>
</tr>
</tbody>
</table>
<p><strong>label</strong> же используется просто для написания адреса по тому же принципу, как если бы Вы писали его, например, на конверте традиционного письма. Возможно использование подсвойства <strong>type</strong> как и в <strong>adr</strong>.</p>
<p>С телекоммуникационными свойствами все проще:</p>
<ul>
<li>телефон&nbsp;&mdash; <strong>tel</strong>;</li>
<li>адрес электронной почты&nbsp;&mdash; <strong>email</strong>;</li>
<li>почтовый клиент&nbsp;&mdash; <strong>mailer</strong> (не понятно&nbsp;&mdash; и зачем он тут сдался?).</li>
</ul>
<p>Телефонный номер может иметь тип (<strong>type</strong>):</p>
<ul>
<li><strong>home</strong>&nbsp;&mdash; домашний</li>
<li><strong>msg</strong>&nbsp;&mdash; имеется автоответчик</li>
<li><strong>work</strong>&nbsp;&mdash; рабочий</li>
<li><strong>pref</strong>&nbsp;&mdash; предпочтительный</li>
<li><strong>voice</strong>&nbsp;&mdash; голосовой</li>
<li><strong>fax</strong>&nbsp;&mdash; факс</li>
<li><strong>cell</strong>&nbsp;&mdash; мобильный aka сотовый</li>
<li><strong>video</strong>&nbsp;&mdash; для видеоконференций</li>
<li><strong>pager</strong>&nbsp;&mdash; пэйджер</li>
<li><strong>bbs</strong>&nbsp;&mdash; bulletin board system</li>
<li><strong>modem</strong>&nbsp;&mdash; возможно использование модема</li>
<li><strong>isdn</strong>&nbsp;&mdash; integrated services digital network</li>
<li><strong>pcs</strong>&nbsp;&mdash; personal communication service</li>
</ul>
<p>Географические свойства также не отличаются особой сложностью:</p>
<ul>
<li><strong>tz</strong>&nbsp;&mdash; временная зона</li>
<li><strong>long</strong>&nbsp;&mdash; широта</li>
<li><strong>lat</strong>&nbsp;&mdash; долгота</li>
</ul>
<p>С ручным заполнением этих свойств могут возникнуть некоторые проблемы, но при интеграции веб-приложения с сервисом вроде Google Earth&nbsp;&mdash; должно быть вполне удобно.</p>
<p>Свойства, описывающие индивида с точки зрения работы, немногочисленны:</p>
<ul>
<li><strong>title</strong>&nbsp;&mdash; должность</li>
<li><strong>role</strong>&nbsp;&mdash; роль</li>
<li><strong>logo</strong>&nbsp;&mdash; ссылка на логотип компании</li>
<li><strong>agent</strong>&nbsp;&mdash; указание представителя индивида, например секретаря, например в виде ссылки на его hCard</li>
<li><strong>org</strong>&nbsp;&mdash; название компании</li>
</ul>
<p>Дополнительные свойства:</p>
<ul>
<li><strong>category</strong>&nbsp;&mdash; категория, то есть чем по сути является данный hCard, например&nbsp;&mdash; визитка</li>
<li><strong>note</strong>&nbsp;&mdash; какие-либо замечания к остальным свойствам</li>
<li><strong>rev</strong>&nbsp;&mdash; время последнего редактирования hCard, то есть время на которое данная информация является актуальной</li>
<li><strong>sort-string</strong>&nbsp;&mdash; отмечает какая часть hCard (обычно часть имени), которая будет использована при сортировке списка из нескольких hCard</li>
<li><strong>sound</strong>&nbsp;&mdash; адрес, указывающий на звуковой файл с правильным произношением имени индивида</li>
<li><strong>url</strong>&nbsp;&mdash; адрес персонального или корпоративного сайта</li>
<li><strong>uid</strong>&nbsp;&mdash; уникальный идентификационный номер в каком-либо специфицированном IANA формате (подсвойство <strong>type</strong> указывает в каком именно)</li>
</ul>
<p>Для обеспечения ограничения доступа к данным из <a href="/tag/hcard" target="_blank">hCard</a> используется два свойства&nbsp;&mdash; <strong>class</strong> и <strong>key</strong>. <strong>class</strong> определяет уровень доступа по примерно тому же принципу, что и в <a href="/tag/oop" target="_blank">ООП</a>: <em>public</em> или <em>confidentional</em>. А свойство <strong>key</strong> предоставляет публичный ключ, для расшифровки данных с закрытым доступом.</p>
<p>Хочется добавить, что благодаря своей структурированной архитектуре данный микроформат может использоваться в более широком спектре случаев, чем просто предоставление персональных данных, например, можно описывать и просто организацию или какое-либо место. Те же самые принципы могут быть использованы и при оформление персональных данных в формате <a href="/tag/xml" target="_blank">XML</a>&nbsp;&mdash; достаточно лишь использовать те же самые атрибуты hCard для произвольных тэгов <a href="/tag/xml" target="_blank">XML</a>.</p>
<p>В заключение хочу сказать, что в качестве источников информации для данной статьи были использованы <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://microformats.org/wiki/hcard"  target="_blank" rel="nofollow">официальная вики</a></noindex> и <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.xfront.com/microformats/hCard.html"  target="_blank" rel="nofollow">презентация от Robert Costello</a></noindex>, а подписаться на <a href="/feed" target="_blank"><strong>RSS</strong></a> можно вот <a href="/feed" target="_blank"><strong>ТУТ</strong></a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/set/mikroformaty/hcard/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>nofollow: за и против</title>
		<link>http://www.insight-it.ru/set/mikroformaty/nofollow-za-i-protiv/</link>
		<comments>http://www.insight-it.ru/set/mikroformaty/nofollow-za-i-protiv/#comments</comments>
		<pubDate>Sun, 24 Feb 2008 13:51:42 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Микроформаты]]></category>
		<category><![CDATA[crawler]]></category>
		<category><![CDATA[nofollow]]></category>
		<category><![CDATA[rel-nofollow]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[spider]]></category>
		<category><![CDATA[поисковые системы]]></category>
		<category><![CDATA[принцип работы поисковых систем]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/microformats/nofollow-za-i-protiv/</guid>
		<description><![CDATA[Наверняка каждый владелец любого интернет-ресурса хоть раз сталкивался с этим микроформатом, rel-nofollow. Изначально он был введен для обозначения ссылок, оставленных кем-либо, кроме создателя самой веб-страницы, и, как следствие. для снятие с него ответственности за эту ссылку. Активнее всего этот микроформат влияет на работу большинства поисковых систем, оказывая влияние на учет ссылок в определении тех или [...]]]></description>
			<content:encoded><![CDATA[<p>Наверняка каждый владелец любого интернет-ресурса хоть раз сталкивался с этим микроформатом, <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://microformats.org/wiki/rel-nofollow"  target="_blank" rel="nofollow">rel-nofollow</a></noindex>. Изначально он был введен для обозначения ссылок, оставленных кем-либо, кроме создателя самой веб-страницы, и, как следствие. для снятие с него ответственности за эту ссылку. Активнее всего этот микроформат влияет на работу большинства поисковых систем, оказывая влияние на учет ссылок в определении тех или иных параметров, присваиваемых страницам (Google PageRank, например). В общем случае ссылки, помеченные атрибутом <strong>rel=&quot;nofollow&quot;</strong>, из этого процесса исключаются.<br />
<span id="more-48"></span><br />
Но не все так однозначно, насчет этого микроформата сложилось масса мнений, так как несмотря на свое, казалось бы, предназначение бороться со спамом на форумах / блогах / социальных сетях / новостных порталах (нужное подчеркнуть), направленным на создание входящих ссылок на тот или иной ресурс, порой им злоупотребляют и используют там, где это было бы излишним.</p>
<h3>Против</h3>
<ul>
<li>nofollow не в состоянии полностью предотвратить спам в ресурсах указанных выше типов;</li>
<li>название &laquo;nofollow&raquo; лишь сбивает с толку, <a href="/tag/crawler" target="_blank">crawler</a>&#39;ы все равно следуют по таким ссылкам;</li>
<li>nofollow порой вредит <em>естественным</em> ссылкам на сайты, которые вполне заслуженно могли бы и получить свою входящую ссылку при расчете того же, например, PageRank;</li>
<li>для использования простыми пользователями, этот микроформат абсолютно бесполезен;</li>
<li>благодаря nofollow поисковые системы порой не в состоянии отличить ссылки на сайты добросовестных читателей ресурса от ссылок спаммеров;</li>
<li>он препятствует возможности людей, оставляющих комментарии, привлечь внимание к какой-либо странице;</li>
<li>если взглянуть со стороны поисковых систем, nofollow препятствует Сети выглядеть как сеть, в прямом смысле этого слова;</li>
<li>единственные кто получают какую-либо пользу от этого микроформата&nbsp;&mdash; поисковые системы.</li>
</ul>
<h3>За</h3>
<ul>
<li>но тем не менее, если ссылка размещается посетителем только ради влияния на позицию своего ресурса в поисковых системах, наличие <strong>nofollow</strong> заставит его как минимум задуматься: а стоит ли?</li>
<li>помимо поисковых систем, данный микроформат может служить инструментом вебмастера для организации более эффективной перелинковки страниц в рамках одного сайта;</li>
<li>в недалеком будущем, возможно, движки сайтов смогут ставить атрибут <strong>nofollow</strong> не на всех подряд ссылках, оставленных посетителями, а только на подозрительных с их точки зрения (которая могла бы определяться, допустим, средствами эвристического анализа);</li>
<li>так как oформлен он в виде <a href="/tag/mikroformaty" target="_blank">микроформата</a>, он не противоречит стандартам <a href="/tag/xhtml">XHTML</a> и <a href="/tag/html" target="_blank">HTML</a>.</li>
</ul>
<p>Не смотря на множество спорных моментов, этот микроформат определенно имеет свою скромную роль в жизни Сети. Использовать его или нет&nbsp;&mdash; дело каждого, но по-моему если применять его в меру и только по прямому назначению, то он только несомненно помогает развитию как Сети в целом, так и конкретного ресурса в отдельности, особенно с точки зрения эффективности взаимодействия с поисковыми системами.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/set/mikroformaty/nofollow-za-i-protiv/feed/</wfw:commentRss>
		<slash:comments>22</slash:comments>
		</item>
		<item>
		<title>Отношения online</title>
		<link>http://www.insight-it.ru/set/mikroformaty/otnosheniya-online/</link>
		<comments>http://www.insight-it.ru/set/mikroformaty/otnosheniya-online/#comments</comments>
		<pubDate>Sat, 16 Feb 2008 10:07:27 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Микроформаты]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[xfn]]></category>
		<category><![CDATA[XHTML]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[семантика]]></category>
		<category><![CDATA[Сеть]]></category>
		<category><![CDATA[технология]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/microformats/otnosheniya-online/</guid>
		<description><![CDATA[Допустим, у Вас появилось желание оставить на своем интернет-ресурсе ссылку на сайт своего старого друга. Объяснить этот факт простому читателю достаточно просто: &#60;a&#160;href=&#34;www.site.ru&#34;&#62;Сайт&#160;моего&#160;друга&#60;/a&#62;, но поймет ли такую надпись очередной раз инспектирующий Ваш сайт crawler какой-нибудь поисковой системы? Может быть Вы просто злостно торгуете ссылками со своего сайта?

Как Вы могли уже догадаться, для решения этой достаточно [...]]]></description>
			<content:encoded><![CDATA[<p>Допустим, у Вас появилось желание оставить на своем интернет-ресурсе ссылку на сайт своего старого друга. Объяснить этот факт простому читателю достаточно просто: <strong>&lt;a&nbsp;href=&quot;www.site.ru&quot;&gt;Сайт&nbsp;моего&nbsp;друга&lt;/a&gt;</strong>, но поймет ли такую надпись очередной раз инспектирующий Ваш сайт <a href="/tag/crawler" taret="_blank">crawler</a> какой-нибудь поисковой системы? Может быть Вы просто злостно торгуете ссылками со своего сайта?<br />
<span id="more-43"></span><br />
Как Вы могли уже догадаться, для решения этой достаточно узкоспециализированной задачи&nbsp;&mdash; выражение отношений с владельцем сайта, на который указывает ссылка&nbsp;&mdash; существует специальный <a href="/net/xhtml/mikroformaty/" target="_blank">микроформат</a> под названием <a href="/tag/xfn" target="_blank"><strong>XFN</strong></a>, что расшифровывается как <em>XHTML Friends Network</em>. С его помощью любой человек, у которого есть сайт может продемонстрировать всем желающим в каких отношениях он находится с владельцем сайта, на который он ссылается.</p>
<p>Реализуется этот микроформат с помощью атрибута <strong>rel</strong> тэга <strong>&lt;a&gt;</strong>, возможные варианты значения (имеется возможность их комбинировать):</p>
<table summary="Значения атрибута rel, используемые в микроформате XFN." border="1" cellspacing="0" style="padding: 1px; width: 100%;">
<thead>
<tr>
<th>Категории значений</th>
<td><strong><em>Значения XFN</em></strong></td>
</tr>
</thead>
<tbody>
<tr>
<th>дружба:</th>
<td>
 <code title="кто-либо, кого Вы считаете другом.">&lt;strong&gt;friend&lt;/strong&gt;</code> <code title="знакомый, просто пару раз здоровались или недолго общались.">&lt;strong&gt;acquaintance&lt;/strong&gt;</code> <code title="кто-либо, с кем Вы знаете как связаться в случае необходимости.">&lt;strong&gt;contact&lt;/strong&gt;</code></td>
</tr>
<tr>
<th>физические:</th>
<td><code title="кто-либо, с кем вы когда-то лично встречались.">&lt;strong&gt;met&lt;/strong&gt;</code></td>
</tr>
<tr>
<th>профессиональные:</th>
<td><code title="коллега по работе.">&lt;strong&gt;co-worker&lt;/strong&gt;</code>&nbsp;<code title="коллега по учебе или иной форме активности.">&lt;strong&gt;colleague&lt;/strong&gt;</code>
</td>
</tr>
<tr>
<th>географические:</th>
<td><code title="живете на одной улице.">&lt;strong&gt;co-resident&lt;/strong&gt;</code>&nbsp;<code title="сосед.">&lt;strong&gt;neighbor&lt;/strong&gt;</code></td>
</tr>
<tr>
<th>семейные:</th>
<td><code title="ребенок (в том числе и приемные).">&lt;strong&gt;child&lt;/strong&gt;</code>&nbsp;<code title="родители (в том числе и приемные).">&lt;strong&gt;parent&lt;/strong&gt;</code>&nbsp;<code title="все братья и сетры.">&lt;strong&gt;sibling&lt;/strong&gt;</code>&nbsp;<code title="муж/жена.">&lt;strong&gt;spouse&lt;/strong&gt;</code><br />
 <code title="дальний родственник.">&lt;strong&gt;kin&lt;/strong&gt;</code></td>
</tr>
<tr>
<th>романтические:</th>
<td><code title="муза, источник вдохновения.">&lt;strong&gt;muse&lt;/strong&gt;</code>&nbsp;<code title="Кто-либо, к кому у Вас страстное увлечение.">&lt;strong&gt;crush&lt;/strong&gt;</code>&nbsp;<code title="Кто-либо, с кем Вы встречаетесь.">&lt;strong&gt;date&lt;/strong&gt;</code>&nbsp;<code title="Кто-либо, в кого Вы влюбились">&lt;strong&gt;sweetheart&lt;/strong&gt;</code></td>
</tr>
<tr>
<th>личность:</th>
<td><code title="Ссылка на самого себя на другом сайте. Обязательно должна быть симметрична. Отношение 'me' неявно подразумевается между поддиректорией и всем ее содержимым.">&lt;strong&gt;me&lt;/strong&gt;</code></td>
</tr>
</tbody>
</table>
<p>Как не трудно заметить, практически все возможные варианты отношений могут быть описаны одним из значений или их комбинацией. Наш пример из начала этого поста с использованием XFN выглядел бы: <strong>&lt;a&nbsp;href=&quot;www.site.ru&quot;&nbsp;rel=&quot;friend&nbsp;met&quot;&gt;Сайт&nbsp;моего&nbsp;друга&lt;/a&gt;</strong></p>
<p>Помимо этого есть еще один маленький нюанс, необходимый для того, чтобы browser&#39;ы и поисковые системы знали, что данная страница оффциально поддерживает этот микроформат, для этого необходимо указать следующий атрибут тэгу <strong>&lt;head&gt;</strong>:</p>
<p><code>&lt;head profile=&quot;http://gmpg.org/xfn/11&quot;&gt;</code></p>
<p>Этот пост был написан по мотивам <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.gmpg.org/xfn/"  target="_blank" rel="nofollow">оффициального сайта XFN</a></noindex>, если Вас заинтересовал этот микроформат, возможно имеет смысл посетить и его: там можно найти FAQ, утилиты для автоматической генерации кода, а также всю остальную информацию по данному микроформату (на английском естественно).</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/set/mikroformaty/otnosheniya-online/feed/</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
		<item>
		<title>Микроформаты</title>
		<link>http://www.insight-it.ru/set/xhtml/mikroformaty/</link>
		<comments>http://www.insight-it.ru/set/xhtml/mikroformaty/#comments</comments>
		<pubDate>Sun, 27 Jan 2008 16:31:21 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[XHTML]]></category>
		<category><![CDATA[Микроформаты]]></category>
		<category><![CDATA[hcard]]></category>
		<category><![CDATA[hreview]]></category>
		<category><![CDATA[html]]></category>
		<category><![CDATA[xfn]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[семантика]]></category>
		<category><![CDATA[смысл]]></category>
		<category><![CDATA[технология]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/xhtml/mikroformaty/</guid>
		<description><![CDATA[
Не смотря на тот факт, что эта технология еще только начинает получать широкое распространение и применение на просторах Сети, слов о ней уже написано немало, не вижу ни одной причины почему бы мне тоже не написать несколько слов о микроформатах.
Основной идеей микроформатов является попытка дополнить смыслом существующие элементы стандартов разметки&#160;&#8212; XHTML и HTML, такого рода [...]]]></description>
			<content:encoded><![CDATA[<p><img style="margin: 1px 8px; float: left;" src="/wp-content/uploads/microformats.png" title="Microformats" alt="Microformats" /></p>
<p>Не смотря на тот факт, что эта технология еще только начинает получать широкое распространение и применение на просторах Сети, слов о ней уже написано немало, не вижу ни одной причины почему бы мне тоже не написать несколько слов о <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://microformats.org" target="_blank" rel="nofollow" >микроформатах.</a></noindex></p>
<p>Основной идеей микроформатов является попытка дополнить смыслом существующие элементы стандартов разметки&nbsp;&mdash; XHTML и HTML, такого рода смысл нынче модно назвать словом <em>семантика</em>, что так или иначе влияет как на людей, пользующихся услугами Сети, так и на программы, обслуживающие ее функционирование.</p>
<p><span id="more-33"></span></p>
<h3>Что представляют собой микроформаты?</h3>
<p>Строго говоря, микроформаты являются набором форматов данных, основывающихся на существующих широкораспространенных стандартах представления данных (в частности XHTML), каждый из них предназначен для решения конкретной узкоспециализированной задачи, то есть для  обеспечения конкретной семантикой конкретной части стандарта.</p>
<p>Как не трудно догадаться, измение существующих и добавление новых тэгов к стандарту XHTML в микроформатах недопустимо, ведь иначе документ перестанет соответствовать исходному стандарту. Именно по-этому для реализации микроформатов используются атрибуты тэгов XHTML, в которых допускаются некоторые вольности&nbsp;&mdash; <strong>rel</strong> и <strong>class</strong>.</p>
<h3>Что же может дать осмысленность разметки?</h3>
<p>В перспективе вся эта затея направлена на повышение качества сервисов, предоставляемых в Сети. На данный момент большая часть сервисов, основанных на анализе данных расположенных в Сети, способна лишь на частичное использование разметки документа для уточнения смысла той или иной информации. Показать это лучше всего на примере: тэги <strong>&lt;em&gt;</strong> и <strong>&lt;strong&gt;</strong> говорят о том, что содержащаяся внутри них информация имеет некий смысловой акцент, но в то же время многие другие тэги не несут за собой никакой дополнительной смысловой информации, помимо содержащегося внутри них текста. Одним из таких тэгов является <strong>&lt;a&gt;</strong>, который говорит о наличии ссылки на некоторую интернет-страницу, как-то связанную с текстом между открывающим и закрывающим тэгами, а также расположенную по URL, указанному в атрибуте <strong>href</strong>, можно конечно к этому прибавить атрибут <strong>title</strong>, но так или иначе на этом информация о ресурсе, на который ссылается автор документа, заканчивается. Один из микроформатов, позволяющих расширить возможности простых ссылок, называется <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.gmpg.org/xfn/"  target="_blank" rel="nofollow">XFN</a></noindex> и предоставляет авторам документов возможность описать свое отношение к другим авторам, на работы которых они ссылаются, выглядит это примерно следующим образом:</p>
<p style=""><strong>&lt;a href=&quot;http://www.my-friend.ru&quot; rel=&quot;friend&quot;&gt;Сайт моего друга&lt;/a&gt;</strong></p>
<p>Теперь понять, что сайт, на который происходит ссылка, является сайтом друга автора текущего документа, может не только читатель, но и программа, занимающаяся индексированием страниц Сети для какого-либо сервиса, например этот микроформат полезен для повышения качества работы социальных сетей. Это была лишь небольшая часть возможностей микроформата XFN, подробнее останавливаться на нем не буду&nbsp;&mdash; ведь каждый из них явно заслуживает отдельной записи.</p>
<h3>Классификация</h3>
<p>Наверняка к Вам в голову приходила мысль: а почему необходимо пользоваться именно вот этими микроформатами? Если в XHTML допускаются любые значения тэгов <strong>rel</strong> и <strong>class</strong>, почему я не могу придумать свои микроформаты и пользоваться ими? Ответ прост: микроформаты призваны повысить качество Сети вцелом, а не какого-то конкретного сайта отдельно. Только часть микроформатов получила широкое распространение, и именно ими приходится пользоваться всем остальным сайтам под влиянием <em>сетевого эффекта</em> (т.е. того факта, что ценность технологии прямо пропорциональна обширности ее применения, в нашем случае в рамках Сети), просто чтобы быть совместимыми с остальной частью Интернета.</p>
<p>Но не смотря на это&nbsp;&mdash; количество и разнообразие распространенных микроформатов велико, и как-либо классифицировать их достаточно сложно. Самым простым и точным вариантом можно назвать разделение по структуре формата:</p>
<ul>
<li><em>элементарные</em>&nbsp;&mdash; применимые только к одному конкретному типу тэгов. В эту группу попадают упомянутый выше <strong>XFN</strong>, а также множество других, например <strong>rel-tag</strong>, <strong>rel-nofollow</strong>, и так далее;</li>
<li><em>композитные (или составные)</em>&nbsp;&mdash; имеют более сложную структуру, и для своей реализации требуют модификации нескольких тэгов одного элемента. Микроформаты из этой категории предназначены для описания более сложной структуры, например <strong>hCard</strong>, используемый для описания людей или организаций (можно посмотреть на пример его использования <a target="_blank" href="/author">на моей странице &quot;О себе&quot;</a>).</li>
</ul>
<p>Это пожалуй единственный общепринятый тип классификации микроформатов, можно конечно попытаться провести границы по типам используемых атрибутов или модифицируемых тэгов, но такого рода классификации несущественны и не являются широко распространенными.</p>
<h3>Применение на практике</h3>
<p>Вариантов их применения на сегодняшний день не так уж и много. Как я уже упоминал, эта технология еще находится лишь на пути к получению повсеместной распространенности на просторах Сети, но уже сейчас они проявили себя достаточно, чтобы оказывать влияние на многие аспекты сети Интернет:</p>
<ul style="text-align: justify;">
<li>Многие поисковые системы активно используют при составлении своего индекса микроформат <strong>rel-nofollow</strong>, об этом мне уже <a href="/net/seo/putevoditel-dlya-robotov/" target="_blank">доводилось упоминать в одной из предыдущих записей</a>;</li>
<li>Plug-in для Firefox под названием <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/https://addons.mozilla.org/en-US/firefox/addon/4106" target="_blank" rel="nofollow" ><em>Operator</em></a></noindex>&nbsp;&mdash; позволяет просматривать используемые на текущей странице микроформаты, а также предлагает небольшой ассортимент действий, с ними связанных. Например, <strong>hCard</strong> предлагается экспортировать в адресную книгу, а для <strong>rel-tag</strong>&nbsp;&mdash; осуществить поиск по скромному списку интернет-сервисов. <img src="/wp-content/uploads/firefox-operator.gif" alt="Operator screenshot" title="Operator menu" style="margin: 8px; display: block;" /> Лично я уже достаточно его себе установил и всегда держу включенным, не для того, чтобы реально им пользоваться, а просто чтобы быть в курсе, что тот или иной ресурс вдруг начал поддерживать эту замечательную технологию;</li>
<li>Появляется все больше и больше CMS, поддерживающих различные микроформаты &quot;из коробки&quot; или с помощью plug-in&#39;ов, что ведет к все более активному расширению списка сайтов, следующих этим стандартам представления данных. <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://wordpress.org" target="_blank" rel="nofollow" >WordPress</a></noindex>, на которой работает этот блог, тоже относится к категории CMS, поддерживающих микроформаты, в чем вы можете убедиться, установив упомянутый в предыдущем пункте <em>Operator</em>. Сам по себе этот факт какой-либо полезности не несет, но является лишним стимулом для разработчиков программного обеспечения и интернет-ресурсов, поддерживающих микроформаты.</li>
</ul>
<p>Этот список можно было бы продолжать еще достаточно долго, так что позволю себе остановиться, ограничившись лишь перечислением наиболее актуальных с моей точки зрения аспектов применения микроформатов.</p>
<h3>Подводим итоги</h3>
<p>По сути являясь своеобразной &quot;надстройкой&quot; над XHTML, микроформаты создаются по принципу &quot;чем проще&nbsp;&mdash; тем лучше&quot;, но в то же время благодаря своей узкой специализации и простоте, каждый из них способен быть составной частью модульной структуры форматов данных, способной поднять Сеть на качественно новый уровень развития.</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/set/xhtml/mikroformaty/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Путеводитель для роботов</title>
		<link>http://www.insight-it.ru/set/seo/putevoditel-dlya-robotov/</link>
		<comments>http://www.insight-it.ru/set/seo/putevoditel-dlya-robotov/#comments</comments>
		<pubDate>Thu, 17 Jan 2008 22:13:52 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[crawler]]></category>
		<category><![CDATA[robots exclusion protocol]]></category>
		<category><![CDATA[robots.txt]]></category>
		<category><![CDATA[spider]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[информационные технологии]]></category>
		<category><![CDATA[поисковые системы]]></category>
		<category><![CDATA[принцип работы поисковых систем]]></category>
		<category><![CDATA[технология]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/seo/putevoditel-dlya-robotov/</guid>
		<description><![CDATA[Ни для кого не секрет, что одним их основных факторов, влияющих на расположение страниц интернет-ресурса на просторах поисковых систем, является уникальность контента (или другими словами&#160;&#8212; содержания). Конечно же простейшим способом избежать дублирующегося контента является просто собственноручная его генерация (или в крайнем случае с помощью наемных работников или посетителей Вашего сайта). Но, к сожалению, это позволяет [...]]]></description>
			<content:encoded><![CDATA[<p>Ни для кого не секрет, что одним их основных факторов, влияющих на расположение страниц интернет-ресурса на просторах поисковых систем, является уникальность контента (или другими словами&nbsp;&mdash; содержания). Конечно же простейшим способом избежать дублирующегося контента является просто собственноручная его генерация (или в крайнем случае с помощью наемных работников или посетителей Вашего сайта). Но, к сожалению, это позволяет избежать лишь повторов между разными сайтами. Помимо этого свою роль играют и повторы в рамках одного сайта. Наверняка Вы замечали, что многие CMS размещают один и тот же текст на разных страницах сайта: например на обычной странице, в RSS-ленте и каком-нибудь архиве.</p>
<p>Именно для решения этой маленькой проблемы и была создана технология под названием <strong>Robots Exclusion Protocol</strong>. С ее помощью можно минимизировать возможность повторов содержимого, проиндексированного поисковыми системами в рамках одного сайта, а также исключить из индекса неинформативные страницы.</p>
<p><span id="more-27"></span></p>
<p>Надеюсь, что Вы представляете себе в чем заключается принцип работы поисковых систем, но в любом случае не вижу причин для того чтобы не рассказать вкратце об этом. Помимо собственно сайта, где пользователи вводят ключевую фразу для поиска, любая поисковая система имеет еще две части: базу данных (другими словами&nbsp;&mdash; индекс сайтов) и специальной программы (которую чаще всего называют <em>пауком</em> или по-английски&nbsp;&mdash; <em>crawler</em> или <em>spider</em>, но иногда используется более общий термин&nbsp;&mdash; <em>робот</em>). Эта программа запущена на серверах поисковых систем во множестве экземпляров и основной целью их работы является пополнение и обновления индекса поисковой системы. Сам же сайт лишь делает выборку из индекса в соответствии с запросом и сортирует результат.</p>
<p>Принцип работы такого класса программ я уже упоминал в <a href="/net/otkuda-voznikaet-spam-i-kak-s-nim-borotsya" title="Откуда возникает спам и как с ним бороться" target="_blank">записи о борьбе со спамом</a>, так что повторюсь лишь вкратце в надежде, что Вы ее уже читали: они перемещаются по просторам Сети следуя по гиперссылкам, и на каждой странице, куда они попадают, стараются выполнить заранее определенное действие, в нашем случае&nbsp;&mdash; проиндексировать ее.</p>
<p>Обсуждаемая нами технология дает возможность веб-мастеру предоставить crawler&#39;ам, образно говоря, <em>путеводитель</em> по его сайту. Методов для этого имеется несколько:</p>
<ul>
<li>Любой crawler прежде чем перейти на новый домен проверяет существование файла по адресу http://www.некий-домен.ru/robots.txt. В таком файле веб-мастер может разместить директивы для потенциальных компьютеризированных посетителей в соответствии с <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.robotstxt.org/norobots-rfc.txt" target="_blank" >соответствующим стандартом</a></noindex>. Если поисковый робот обнаруживает этот файл, то прочитав его он корректирует свой маршрут обхода всего интернет-ресурса в соответствии с указанными директивами.</li>
<li>Внутри заголовка любой HTML-страницы или любого другого документа, передаваемого по http протоколу (с помощью заголовков самого протокола), можно разместить специальный meta-tag для роботов, который также должен соответствовать <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.robotstxt.org/meta.html" target="_blank" >стандарту, опубликованному в 1996 году</a></noindex>.</li>
<li>Основной частью <em>путеводителя</em> чаще всего является карта <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://sitemaps.org/"  target="_blank">сайта в формате XML</a></noindex>. С ее помощью программа может быстро определить весь ассортимент страниц, которые ей было бы неплохо проиндексировать.</li>
<li>Самым последним был воплощен в жизнь метод, основанный на <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://microformats.org/wiki/rel-nofollow"  target="_blank">микроформатах</a></noindex>. Реализуется он с помощью параметра <strong>rel="nofollow"</strong>, указанного внутри тэга  &lt;a&gt;, который обозначает ссылку, не предназначенную для перехода по ней пауком.</li>
</ul>
<p>Карты сайтов и директивы robots.txt предназначены для определения маршрута путешествия crawler&#39;а, в то время как микроформаты и meta-тэги&nbsp;&mdash; для влияния на сам процесс индексации.</p>
<p>У каждого из описанных выше методов есть своя узкая специализация:</p>
<ul>
<li>robots.txt предоставляет базовый набор директив для роботов, которым они следуют даже в случае конфликтов с другими использованными методами.</li>
<li>Карта сайта влияет на последовательность и набор страниц, посещенных пауком, с помощью указания приоритетов страниц или времени последней модификации.</li>
<li>Мета-тэги распространяют свое действие на весь документ и влияет на индексирование страниц (если они одновременно присутствуют как в заголовке (X) HTML документа, так и в заголовках <strong>X-Robots-Tags</strong> HTTP-протокола, то приоритет считается выше у заголовков протокола).</li>
<li>Микроформаты позволяют в случае необходимости переопределять параметры любого конкретного тэга документа, не смотря на указания в мета-тэгах.</li>
</ul>
<p>С синтаксисом robots.txt лучше всего ознакомиться прямо в соответствующей спецификации, ссылку на которую я уже приводил (хотя возможно в будущем я всетаки соберусь написать запись и по этому поводу). Не знаю занимается ли кто-нибудь генерацией карт сайта вручную, но для общего развития будет полезно изучить и ее формат, неплохим примером может послужить <a href="/sitemap.xml" target="_blank" title="XML Sitemap">XML-карта этого блога</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/set/seo/putevoditel-dlya-robotov/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Мы делаем новости!</title>
		<link>http://www.insight-it.ru/set/xml/my-delaem-novosti/</link>
		<comments>http://www.insight-it.ru/set/xml/my-delaem-novosti/#comments</comments>
		<pubDate>Mon, 07 Jan 2008 20:42:17 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[XML]]></category>
		<category><![CDATA[RSS]]></category>
		<category><![CDATA[аггрегатор]]></category>
		<category><![CDATA[новости]]></category>
		<category><![CDATA[Сеть]]></category>
		<category><![CDATA[технология]]></category>
		<category><![CDATA[хранение данных]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/xml/my-delaem-novosti/</guid>
		<description><![CDATA[
Ярко-рыжий логотип, который можно увидеть на практически любом сайте, наверняка не раз привлекал Ваше внимание. Если Ваше любопытство хоть раз заставляло Вас перейти по ссылке, которая чаще всего стоит за таким логотипом, то Вы наверняка уже успели представить себе о чем пойдет речь.
Такая ссылка в подавляющем большинстве случаев ведет на новости сайта, на котором она [...]]]></description>
			<content:encoded><![CDATA[<p><a href="/feed" target="_blank"><img alt="RSS Logo." title="Логотип RSS" src="/wp-content/uploads/rss.png" style="margin: 0 10px; float: right;" /></a></p>
<p align="justify">Ярко-рыжий логотип, который можно увидеть на практически любом сайте, наверняка не раз привлекал Ваше внимание. Если Ваше любопытство хоть раз заставляло Вас перейти по ссылке, которая чаще всего стоит за таким логотипом, то Вы наверняка уже успели представить себе о чем пойдет речь.</p>
<p align="justify">Такая ссылка в подавляющем большинстве случаев ведет на новости сайта, на котором она расположена, представленные в формате представления данных под названием RSS (хотя это даже не обязательно должны быть новости в обычном понимании этого слова, с помощью этого формата можно публиковать любой контент). Этот формат предоставляет пользователям возможность подписываться на <i>каналы</i> новостей с помощью специально предназначенных для этого программ&nbsp;&mdash; <i>аггрегаторов</i>, позволяя иметь быстрый и удобный доступ ко всем интересующим его/ее информационным ресурсам, без необходимости собственно посещать все эти сайты.</p>
<p>О процессе создания такого канала я и хочу Вам рассказать.</p>
<p><span id="more-18"></span></p>
<p align="justify">Конечно же многие CMS поддерживают автоматическую генерацию RSS-каналов, и <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.wordpress.org" target="_blank" >WordPress</a></noindex>, на которой работает <a href="/about">этот блог</a>, к ним относится. <a href="/feed">RSS-канал этого блога</a>, хоть и не является новостным по сути, но также прекрасно генерируется из постов блога. Но для того, чтобы работать с технологией обычно бывает не лишним понимать как она работает, по-этому в этой записи я поведаю Вам о ручном составлении RSS-канала, а в одной из последующих&nbsp;&mdash; об автоматической генерации.</p>
<p align="justify">Прежде всего стоит сказать, что RSS является методом, основанным на XML и предназначенным для оперативного распространения новостей и контента сайта как среди потенциальных читателей, так и среди других сайтов.</p>
<p align="justify">Как следствие, на RSS распространяются все <a href="/net/xml/9-osnovnyx-pravil-napisaniya-xml">правила написания XML-документов</a>, с которыми имеет смысл ознакомиться перед тем, как продолжить чтение этой записи. Помимо них, для RSS существует отдельный стандарт и соответственно набор не менее простых правил.</p>
<p align="justify">В качестве примера можно использовать любой понравившийся канал, например мой. Для того, чтобы увидеть сам текст документа, необходимо нажать правой кнопкой мыши на открытый в браузере документ и выбрать пункт, называющийся как-нибудь вроде &quot;Просмотр исходного кода страницы&quot; или &quot;View Page Source&quot;.</p>
<p align="justify">По сравнению с XML, RSS-документ должен обладать четко определенной структурой:</p>
<ol align="justify">
<li>За стандартным XML-заголовком открывается корневой элемент, содержащий указание версии RSS:
<pre lang="RSS"><rss version="2.0"></rss></pre>
    (не забываем его закрывать в конце документа)</li>
<li>В корневой элементе должен должен содержаться ровно один элемент <strong>&lt;channel&gt;</strong>, символизирующий наш канал</li>
<li>Внутри <strong>&lt;channel&gt;</strong> обязательно должны содержаться три элемента:
<ul>
<li><strong>&lt;title&gt;</strong>&nbsp;&mdash; заголовок канала</li>
<li><strong>&lt;link&gt;</strong>&nbsp;&mdash; ссылка на сам сайт</li>
<li><strong>&lt;description&gt;</strong>&nbsp;&mdash; описание канала</li>
</ul>
</li>
<li>Помимо них он должен содержать один или несколько элементов <strong>&lt;item&gt;</strong>, которые будут обозначать одну конкретную новость, запись, пост, статью, заметку, не важно какое из этих слов больше подходит к каждому конкретному случаю&nbsp;&mdash; суть от этого не меняется.</li>
<li>Элементы между парой тэгов <strong>&lt;item&gt;</strong>, как ни странно, тоже должны в себя включать в себя волшебно-обязательные элементы, разница лишь в значении, которое им придается:
<ul>
<li><strong>&lt;title&gt;</strong>&nbsp;&mdash; заголовок новости-записи-поста-статьи-заметки</li>
<li><strong>&lt;link&gt;</strong>&nbsp;&mdash; ссылка на нее же, обычно на страницу внутри сайта</li>
<li><strong>&lt;description&gt;</strong>&nbsp;&mdash; собственно говоря сам текст</li>
</ul>
</li>
</ol>
<p align="justify">Перечисленного выше вполне достаточно для написания простейшего RSS-канала, но возможности RSS далеко выходят за рамки просто размещения в Сети текстовых сообщений. Для их реализации стандартом предусмотрен еще целый ряд тэгов,&nbsp; доступных для использования. Позволю себе привести краткую справку по основным из них (для полноты картины повторю обязательные):</p>
<table width="100%" cellspacing="0" border="1">
<tbody>
<tr colspan="2">
<h4 align="center">Дочерние элементы &lt;channel&gt;</h4>
</tr>
<tr>
<th width="30%" valign="top" align="left"><strong>Элемент</strong></th>
<th width="70%" valign="top" align="left"><strong>Описание</strong></th>
</tr>
<tr>
<td valign="top">&lt;category&gt;</td>
<td valign="top">Не обязателен, определяет одну или несколько категорий для канала, позволяет <em>аггрегаторам</em> группировать записи по этому параметру</td>
</tr>
<tr>
<td valign="top">&lt;cloud&gt;</td>
<td valign="top">Не обязателен, используется для осуществления об обновлении канала с помощь. технологии RPC</td>
</tr>
<tr>
<td valign="top">&lt;copyright&gt;</td>
<td valign="top">Опционально, предназначен для предупреждения о необходимости соблюдения авторских прав</td>
</tr>
<tr>
<td valign="top">&lt;description&gt;</td>
<td valign="top">Обязательное описание канала</td>
</tr>
<tr>
<td valign="top">&lt;docs&gt;</td>
<td valign="top">Необязательная ссылка на описания формата, использованного в данном канале</td>
</tr>
<tr>
<td valign="top">&lt;generator&gt;</td>
<td valign="top">Указание программы, сгенерировавшей канал, обычно они сами заполняют этот тэг. В случае заполнения вручную он вообще не нужен</td>
</tr>
<tr>
<td valign="top">&lt;image&gt;</td>
<td valign="top">Опциональное отображение логотипа канала в <em>аггрегаторе</em></td>
</tr>
<tr>
<td valign="top">&lt;language&gt;</td>
<td valign="top">Определяет язык, на котором написано содержимое канала. Не обязательно, но желательно</td>
</tr>
<tr>
<td valign="top">&lt;lastBuildDate&gt;</td>
<td valign="top">Время последнего обновления содержимого канала. Опционально.</td>
</tr>
<tr>
<td valign="top">&lt;link&gt;</td>
<td valign="top">Обязательная ссылка канала</td>
</tr>
<tr>
<td valign="top">&lt;managingEditor&gt;</td>
<td valign="top">Адрес электронной почты редактора канала, не обязателен.</td>
</tr>
<tr>
<td valign="top">&lt;pubDate&gt;</td>
<td valign="top">Опциональная дата последней публикации на канале</td>
</tr>
<tr>
<td valign="top">&lt;rating&gt;</td>
<td valign="top">Опциональный PICS рейтинг канала</td>
</tr>
<tr>
<td valign="top">&lt;skipDays&gt;</td>
<td valign="top">Количество дней, которые аггрегатор должен пропускать между проверкой обновлений канала</td>
</tr>
<tr>
<td valign="top">&lt;skipHours&gt;</td>
<td valign="top">По аналогии с предыдущим, только в часах</td>
</tr>
<tr>
<td valign="top">&lt;textInput&gt;</td>
<td valign="top">Определяет текстовое поле, которое может отображаться рядом с каналом. Не обязательно.</td>
</tr>
<tr>
<td valign="top">&lt;title&gt;</td>
<td valign="top">Обязательная тема канала</td>
</tr>
<tr>
<td valign="top">&lt;ttl&gt;</td>
<td valign="top">Время в минутах, в течении которого канал может отображаться из кэша <em>аггрегатора</em></td>
</tr>
<tr>
<td valign="top">&lt;webMaster&gt;</td>
<td valign="top">Адрес электронной почты веб-мастера, не обязательно.</td>
</tr>
</tbody>
</table>
<p>&nbsp;</p>
<table width="100%" cellspacing="0" border="1" class="ex">
<tbody>
<tr colspan="2">
<h4 align="center">Дочерние элементы &lt;item&gt;</h4>
</tr>
<tr>
<th width="30%" valign="top" align="left">Элемент</th>
<th width="70%" valign="top" align="left">Описание</th>
</tr>
<tr>
<td valign="top">&lt;author&gt;</td>
<td valign="top">Название говорит само за себя&nbsp;&mdash; автор, указывать не обязательно</td>
</tr>
<tr>
<td valign="top">&lt;category&gt;</td>
<td valign="top">Категория или категории, куда можно отнести запись. Опционально</td>
</tr>
<tr>
<td valign="top">&lt;comments&gt;</td>
<td valign="top">Ссылка на комментарии к записи. Опционально.</td>
</tr>
<tr>
<td valign="top">&lt;description&gt;</td>
<td valign="top">Обязательное описние записи, то есть само ее содержание</td>
</tr>
<tr>
<td valign="top">&lt;enclosure&gt;</td>
<td valign="top">Существует возможность по желанию сопровождать запись ссылкой на меда-файл так или иначе с ней связанный</td>
</tr>
<tr>
<td valign="top">&lt;guid&gt;</td>
<td valign="top">Уникальный идентификатор элемента</td>
</tr>
<tr>
<td valign="top">&lt;link&gt;</td>
<td valign="top">Обязательная ссылка записи</td>
</tr>
<tr>
<td valign="top">&lt;pubDate&gt;</td>
<td valign="top">Дата публкации. Не обязательно.</td>
</tr>
<tr>
<td valign="top">&lt;source&gt;</td>
<td valign="top">Опциональная ссылка на внешний источник записи</td>
</tr>
<tr>
<td valign="top">&lt;title&gt;</td>
<td valign="top">Обязательный заголовок записи</td>
</tr>
</tbody>
</table>
<p>&nbsp;</p>
<p align="justify">Более подробно о каждом из них можно узнать, ознакомившись со <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://cyber.law.harvard.edu/rss/rss.html" >спецификацией на английском</a></noindex>. Напоследок хочу напомнить, что вся эта запись представлена лишь для общего понимания принципов организации RSS-документа. На практике в большинстве случаев такие документы генерируются автоматически, о чем и пойдет речь в одной из последующих записей.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/set/xml/my-delaem-novosti/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>9 основных правил написания XML</title>
		<link>http://www.insight-it.ru/set/xml/9-osnovnyx-pravil-napisaniya-xml/</link>
		<comments>http://www.insight-it.ru/set/xml/9-osnovnyx-pravil-napisaniya-xml/#comments</comments>
		<pubDate>Sun, 06 Jan 2008 18:53:52 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[XML]]></category>
		<category><![CDATA[markup]]></category>
		<category><![CDATA[описание данных]]></category>
		<category><![CDATA[хранение данных]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/xml/9-osnovnyx-pravil-napisaniya-xml/</guid>
		<description><![CDATA[Правила написания XML являются в равной степени простыми и строгими, что делает как ручное составление XML документов, так и написание программ, умеющих анализировать и генерировать XML документы, достаточно несложными задачами. Помимо этого, правильно написанный документ в этом формате говорит сам за себя&#160;&#8212; прочитав его не трудно понять о чем речь.
В этой записи я планирую перечислить [...]]]></description>
			<content:encoded><![CDATA[<p>Правила написания XML являются в равной степени простыми и строгими, что делает как ручное составление XML документов, так и написание программ, умеющих анализировать и генерировать XML документы, достаточно несложными задачами. Помимо этого, правильно написанный документ в этом формате говорит сам за себя&nbsp;&mdash; прочитав его не трудно понять о чем речь.</p>
<p>В этой записи я планирую перечислить и объяснить все 9 правил, с использованием примеров.</p>
<p><span id="more-17"></span></p>
<p>В качестве примера будет использован следующий XML документ, описывающий книгу:</p>
<pre lang="XML">
<xml version="1.0" encoding="UTF-8">
<book>
  <author>R. A. Salvatore</author>
  <text>
    <chapter>Well met!</chapter>
  </text>
</book>
</pre>
<p>Не правда ли легко понять, что речь идет именно о книге?</p>
<h4>Теперь самое подходящее время перейти непосредственно к правилам оформления документов.</h4>
<ol>
<li><strong>Документ должен начинаться с определения типа документа, </strong>содержащее указание версии XML (в нашем случае&nbsp;&mdash; 1.0) и кодировку символов (соответственно&nbsp;&mdash; UTF-8)</li>
<li><strong>Должен содержать ровно один корневой элемент</strong>&nbsp;&mdash; в нашем пимере это &lt;book&gt; &lt;/book&gt;</li>
<li><strong>Каждому открывающему тэгу должен соответствовать один закрывающий.</strong> Как не трудно заметить это правило соблюдается в примере, если Вы привыкли в HTML оставлять тэги открытыми примерно следующим образом:
<pre lang="HTML">
Какой-то текст</pre>
    то изучение XML может стать неплохим поводом отучиться от этой вредной привычки.</li>
<li><strong>XML тэги чувствительны к регистру символов. </strong>Тэги &lt;Book&gt;и &lt;book&gt; считаются разными, запись &lt;Book&gt; &lt;/book&gt; будет считаться ошибочной.</li>
<li><strong>Тэги должны быть расположены строго друг внутри друга. </strong>Продемонстрирую на отдельном примере:
<pre lang="XML">
<book></book>
<book></pre>
</li>
<li><strong>Значения всех атрибутов всегда должны быть заключены в кавычки. </strong>Например:      &lt;title subtitle=&quot;The Dark Elf Trilogy&quot;&gt;Sojourn&lt;/title&gt;&nbsp;&mdash; верно, а &lt;title subtitle=The Dark Elf Trilogy&gt;Sojourn&lt;/title&gt;&nbsp;&mdash; нет.</li>
<li><strong>Последовательно расположенные пробелы не объединяются в один.</strong> Имейте это ввиду, если вы привыкли к HTML.</li>
<li><strong>Конец строки обозначается просто переводом на новою строку, без возврата каретки.</strong> Во многих приложениях для обозначения конца строки используется возврат каретки совместно с переводом на новую строку (<font color="#0000ff">/r/n</font>), в XML же принято для этих целей использовать просто перевод на новую строку (<font color="#0000ff">/n</font>).</li>
<li><strong>Комментарии обозначаются так же как и в HTML:</strong> &lt;!&ndash;&ndash;комментарий&ndash;&ndash;&gt;</li>
</ol>
<p>Как Вы могли уже убедиться этот формат оформления данных представляет собой всего лишь текст, разбавленный некоторым количеством тэгов и следующий простым правилам. Не стоит ожидать от него чего-то большего.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/set/xml/9-osnovnyx-pravil-napisaniya-xml/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

<!-- Dynamic page generated in 1.431 seconds. -->
<!-- Cached page generated by WP-Super-Cache on 2010-09-10 01:42:29 -->
