Microformats

Не смотря на тот факт, что эта технология еще только начинает получать широкое распространение и применение на просторах Сети, слов о ней уже написано немало, не вижу ни одной причины почему бы мне тоже не написать несколько слов о микроформатах.

Основной идеей микроформатов является попытка дополнить смыслом существующие элементы стандартов разметки - XHTML и HTML, такого рода смысл нынче модно назвать словом семантика, что так или иначе влияет как на людей, пользующихся услугами Сети, так и на программы, обслуживающие ее функционирование.

Что представляют собой микроформаты?

Строго говоря, микроформаты являются набором форматов данных, основывающихся на существующих широкораспространенных стандартах представления данных (в частности XHTML), каждый из них предназначен для решения конкретной узкоспециализированной задачи, то есть для обеспечения конкретной семантикой конкретной части стандарта.

Как не трудно догадаться, измение существующих и добавление новых тэгов к стандарту XHTML в микроформатах недопустимо, ведь иначе документ перестанет соответствовать исходному стандарту. Именно по-этому для реализации микроформатов используются атрибуты тэгов XHTML, в которых допускаются некоторые вольности - rel и class.

Что же может дать осмысленность разметки?

В перспективе вся эта затея направлена на повышение качества сервисов, предоставляемых в Сети. На данный момент большая часть сервисов, основанных на анализе данных расположенных в Сети, способна лишь на частичное использование разметки документа для уточнения смысла той или иной информации. Показать это лучше всего на примере: тэги <em> и <strong> говорят о том, что содержащаяся внутри них информация имеет некий смысловой акцент, но в то же время многие другие тэги не несут за собой никакой дополнительной смысловой информации, помимо содержащегося внутри них текста. Одним из таких тэгов является <a>, который говорит о наличии ссылки на некоторую интернет-страницу, как-то связанную с текстом между открывающим и закрывающим тэгами, а также расположенную по URL, указанному в атрибуте href, можно конечно к этому прибавить атрибут title, но так или иначе на этом информация о ресурсе, на который ссылается автор документа, заканчивается. Один из микроформатов, позволяющих расширить возможности простых ссылок, называется XFN и предоставляет авторам документов возможность описать свое отношение к другим авторам, на работы которых они ссылаются, выглядит это примерно следующим образом:

<a href="http://www.my-friend.ru" rel="friend">
    Сайт моего друга
</a>

Теперь понять, что сайт, на который происходит ссылка, является сайтом друга автора текущего документа, может не только читатель, но и программа, занимающаяся индексированием страниц Сети для какого-либо сервиса, например этот микроформат полезен для повышения качества работы социальных сетей. Это была лишь небольшая часть возможностей микроформата XFN, подробнее останавливаться на нем не буду - ведь каждый из них явно заслуживает отдельной записи.

Классификация

Наверняка к Вам в голову приходила мысль: а почему необходимо пользоваться именно вот этими микроформатами? Если в XHTML допускаются любые значения тэгов rel и class, почему я не могу придумать свои микроформаты и пользоваться ими? Ответ прост: микроформаты призваны повысить качество Сети вцелом, а не какого-то конкретного сайта отдельно. Только часть микроформатов получила широкое распространение, и именно ими приходится пользоваться всем остальным сайтам под влиянием сетевого эффекта (т.е. того факта, что ценность технологии прямо пропорциональна обширности ее применения, в нашем случае в рамках Сети), просто чтобы быть совместимыми с остальной частью Интернета.

Но не смотря на это - количество и разнообразие распространенных микроформатов велико, и как-либо классифицировать их достаточно сложно. Самым простым и точным вариантом можно назвать разделение по структуре формата:

  • элементарные - применимые только к одному конкретному типу тэгов. В эту группу попадают упомянутый выше XFN, а также множество других, например rel-tag, rel-nofollow*, и так далее;
  • композитные (или составные) - имеют более сложную структуру, и для своей реализации требуют модификации нескольких тэгов одного элемента. Микроформаты из этой категории предназначены для описания более сложной структуры, например hCard, используемый для описания людей или организаций (можно посмотреть на пример его использования на моей странице "О себе").

Это пожалуй единственный общепринятый тип классификации микроформатов, можно конечно попытаться провести границы по типам используемых атрибутов или модифицируемых тэгов, но такого рода классификации несущественны и не являются широко распространенными.

Применение на практике

Вариантов их применения на сегодняшний день не так уж и много. Как я уже упоминал, эта технология еще находится лишь на пути к получению повсеместной распространенности на просторах Сети, но уже сейчас они проявили себя достаточно, чтобы оказывать влияние на многие аспекты сети Интернет:

  • Многие поисковые системы активно используют при составлении своего индекса микроформат rel-nofollow, об этом мне уже доводилось упоминать в одной из предыдущих записей;
  • Plug-in для Firefox под названием Operator - позволяет просматривать используемые на текущей странице микроформаты, а также предлагает небольшой ассортимент действий, с ними связанных. Например, hCard предлагается экспортировать в адресную книгу, а для rel-tag - осуществить поиск по скромному списку интернет-сервисов. Operator screenshot Лично я уже достаточно его себе установил и всегда держу включенным, не для того, чтобы реально им пользоваться, а просто чтобы быть в курсе, что тот или иной ресурс вдруг начал поддерживать эту замечательную технологию;
  • Появляется все больше и больше CMS, поддерживающих различные микроформаты "из коробки" или с помощью plug-in'ов, что ведет к все более активному расширению списка сайтов, следующих этим стандартам представления данных. WordPress, на которой работает этот блог, тоже относится к категории CMS, поддерживающих микроформаты, в чем вы можете убедиться, установив упомянутый в предыдущем пункте Operator. Сам по себе этот факт какой-либо полезности не несет, но является лишним стимулом для разработчиков программного обеспечения и интернет-ресурсов, поддерживающих микроформаты.

Этот список можно было бы продолжать еще достаточно долго, так что позволю себе остановиться, ограничившись лишь перечислением наиболее актуальных с моей точки зрения аспектов применения микроформатов.

Подводим итоги

По сути являясь своеобразной "надстройкой" над XHTML, микроформаты создаются по принципу "чем проще - тем лучше", но в то же время благодаря своей узкой специализации и простоте, каждый из них способен быть составной частью модульной структуры форматов данных, способной поднять Сеть на качественно новый уровень развития.

27 января 2008 |  Иван Блинков  |  Теория