<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Insight IT &#187; Hadoop</title>
	<atom:link href="http://www.insight-it.ru/tag/hadoop/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.insight-it.ru</link>
	<description>Информационные технологии</description>
	<lastBuildDate>Tue, 31 Jan 2012 09:34:08 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Аналитика в реальном времени от Facebook</title>
		<link>http://www.insight-it.ru/tekhnologii/analitika-v-realnom-vremeni-ot-facebook/</link>
		<comments>http://www.insight-it.ru/tekhnologii/analitika-v-realnom-vremeni-ot-facebook/#comments</comments>
		<pubDate>Thu, 24 Mar 2011 16:14:38 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Технологии]]></category>
		<category><![CDATA[Facebook]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[HBase]]></category>
		<category><![CDATA[Insights]]></category>
		<category><![CDATA[Ptail]]></category>
		<category><![CDATA[Puma]]></category>
		<category><![CDATA[Scribe]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=1062</guid>
		<description><![CDATA[HBase в Facebook завоевывает все более и более крепкие позиции, в прошлый раз я рассказывал о применении HBase в роли системы хранения данных для их новой системы обмена сообщений. Вторым продуктом, который теперь полноценно использует данную технологию, является система сбора и обработки статистики в реальном времени под названием Insights. Социальные кнопки (см. слева от поста) [...]]]></description>
			<content:encoded><![CDATA[<p><a href="/tag/hbase/" target="_blank">HBase</a> в <a href="/tag/facebook/" target="_blank">Facebook</a> завоевывает все более и более крепкие позиции, в прошлый раз я рассказывал о применении HBase в роли системы хранения данных для их новой системы обмена сообщений. Вторым продуктом, который теперь полноценно использует данную технологию, является система сбора и обработки статистики в реальном времени под названием Insights. Социальные кнопки (см. слева от поста) стали одним из основных источников трафика для многих сайтов, новая система аналитики позволит владельцам сайтов и страниц лучше понимать как пользователи взаимодействуют и оптимизировать свои интернет-ресурсы, основываясь на данных в реальном времени. Итак, 20 миллиардов событий в день (200 тысяч в секунду) с задержкой не более 30 секунд, как же можно этого достичь?<span id="more-1062"></span><br />
<img class="alignnone size-full wp-image-1196" title="facebook analytics" src="http://www.insight-it.ru/wp-content/uploads/2011/03/facebook-analytics.jpg" alt="" width="628" height="181" /></p>
<h2>Цели сервиса</h2>
<ul>
<li>Дать пользователям надежные счетчики в реальном времени по ряду метрик</li>
<li>Предоставлять анонимные данных &#8212; нельзя узнать кто конкретно были эти люди</li>
<li>Продемонстрировать ценность социальных плагинов и виджетов. Что они дают сайту или бизнесу?</li>
<li>Концепция воронки: сколько людей увидело плагин, сколько совершило действие, сколько было привлечено пользователей обратно на интернет-ресурс</li>
<li>Сделать данные более оперативными: сокращение частоты обновлений с 48 часов до 30 секунд</li>
</ul>
<h2>Задачи</h2>
<ul>
<li>Множество типов метрик, более 100: показы, лайки, просмотры и клики в новостной ленте, демография и.т.д.</li>
<li>Большой поток данных: 20 миллиардов событий в день</li>
<li>Неравномерное распределение данных: за большинство контента практически не голосуют, но некоторые материалы набирают просто невероятное количество лайков</li>
</ul>
<h2>Неудавшиеся попытки</h2>
<h2>MySQL</h2>
<ul>
<li>В каждой строке идентификатор и значение счетчика</li>
<li>Привело к очень высокой активности в СУБД</li>
<li>Статистика считается за каждые сутки, создание новых счетчиков в полночь приводило к большому скачку операций записи</li>
<li>Пришлось пробовать искать способы решать проблему распределения счетчиков, пробовали учитывать временные зоны пользователей</li>
<li>Пики операций записи неминуемо вели к блокировкам</li>
<li>Решение оказалось не очень хорошо подходящим для данной конкретной задачи</li>
</ul>
<h2>Счетчики в памяти</h2>
<ul>
<li>Казалось бы: если столкнулись с проблемами ввода-вывода &#8212; надо перенести все в память</li>
<li>Никаких проблем с масштабируемостью &#8212; счетчики находятся в памяти, обновление практически мгновенно, легко распределить по серверам</li>
<li>Но на практике оказалось, что при таком подходе теряется точность, видимо из-за неатомарности операций или других последствий столь прямолинейной реализации, подробностей нет</li>
<li>Погрешность даже в 1% посчитали неприемлемой и от данного варианта отказались</li>
</ul>
<h2>MapReduce</h2>
<ul>
<li>Предыдущий вариант реализации был создан с помощью <a href="/tag/hadoop/" target="_blank">Hadoop</a> + <a href="/tag/hive/" target="_blank">Hive</a></li>
<li>Подход гибкий, легко справляется с большим входящим потоком информации и объемами данным</li>
<li>Основной минус: даже близко не в реальном времени, слишком комплексная система</li>
</ul>
<h2>Cassandra</h2>
<ul>
<li>Вариант с <a href="/tag/cassandra/" target="_blank">Cassandra</a> рассматривался, но так и не был реализован</li>
<li>Причины были опубликованы достаточно сомнительные: высокие требования к доступности данных и производительности записи</li>
<li>По всем данным у Cassandra нет абсолютно никаких проблем ни с одним, ни с другим</li>
</ul>
<h1>Победитель: HBase + Scribe + Ptail + Puma</h1>
<p>В целом система, на которой остановился выбор, выглядит следующим образом:</p>
<ul>
<li>HBase хранит все данные на распределенном кластере</li>
<li>Используется система логов, новые данные дописываются в конец</li>
<li>Система обрабатывает события и записывает результат в хранилище</li>
<li>Пользовательский интерфейс забирает данные из хранилища и отображает пользователям</li>
</ul>
<p>Как обрабатывается один запрос:</p>
<ul>
<li>Пользователь жмет на кнопку Like</li>
<li>Браузер инициирует AJAX запрос к серверу Facebook</li>
<li>Запрос записывается в лог в HDFS с помощью Scribe</li>
<li>Ptail &#8212; внутренний инструмент для чтения данных из нескольких Scribe-логов, на выходе данные разделяются на три потока, которые отправляются в разные кластеры в разных датацетрах:
<ul>
<li>Просмотры плагинов и виджетов</li>
<li>Просмотры в новостной ленте</li>
<li>Действия (плагины + новостная лента)</li>
</ul>
</li>
<li>Puma &#8212; механизм для пакетной записи данных в HBase для снижения влияния &#171;горячих&#187; материалов:
<ul>
<li>HBase может справиться с очень большим потоком операций записи, но популярные материалы могут заставить упереться во ввод-вывод даже её</li>
<li>В среднем пакет запросов собирается в течении 1.5 секунд, хотелось бы больше &#8212; но из-за огромного количества URL очень быстро заканчивается оперативная память</li>
</ul>
</li>
<li>Отображение данных пользователю:
<ul>
<li>Сам код для отображения написан на <a href="/tag/php/" target="_blank">PHP</a></li>
<li>Работа с HBase осуществляется из <a href="/tag/java/" target="_blank">Java</a></li>
<li>Для взаимодействия по традиции используется <a href="/tag/thrift/" target="_blank">Thrift</a></li>
</ul>
</li>
<li>Система кэширования используется для ускорения отображения страниц:
<ul>
<li>Чем более старые данные запрашиваются, тем реже они пересчитываются</li>
<li>Многое зависит от типа запрашиваемой статистики</li>
</ul>
</li>
<li>MapReduce:
<ul>
<li>Данные передаются для дальнейшего анализа с помощью Hive</li>
<li>Сами логи удаляются через какой-то период времени</li>
<li>Помимо этого старая система анализа статистики все еще в действии, она используется для регулярных проверок результатов новой системы, а также в роли запасного плана, если что-то пойдет не так</li>
</ul>
</li>
</ul>
<h2>О проекте</h2>
<ul>
<li>Продолжительность 5 месяцев</li>
<li>2 с половиной разработчика самой системы</li>
<li>2 разработчика пользовательского интерфейса</li>
<li>Всего было задействовано около 14 человек, включая менеджмент, дизайнера и системных администраторов</li>
</ul>
<h2>Направления развития</h2>
<ul>
<li>Списки популярных материалов: при текущем подходе их составление является сложной задачей</li>
<li>Отдельные пользовательские счетчики</li>
<li>Обобщение приложения для использования с другими сервисами, а не только с социальными плагинами</li>
<li>Распределение системы на несколько датацентров</li>
</ul>
<h2>Подводим итоги</h2>
<p>У новых систем аналитики и сообщений много общего: большой поток входящих данных для записи, HBase и требование работы в реальном времени. Facebook делает ставку на HBase, Hadoop и HDFS, не смотря на громоздкость системы, когда другие предпочитают Cassandra из-за её простой схемы масштабирования, поддержку нескольких датацентров и легкость в использовании. Какой путь окажется выигрышным &#8212; покажет время.</p>
<h2>Источники информации</h2>
<ul>
<li><a href="http://highscalability.com/blog/2011/3/22/facebooks-new-realtime-analytics-system-hbase-to-process-20.html">Facebook&#8217;s New Realtime Analytics System: HBase To Process 20 Billion Events Per Day</a></li>
<li><a href="http://www.facebook.com/note.php?note_id=10150103900258920" target="_blank">Building Realtime Insights</a> (<a href="http://www.facebook.com/video/video.php?v=707216889765&amp;oid=9445547199&amp;comments" target="_blank">видео</a>)</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/tekhnologii/analitika-v-realnom-vremeni-ot-facebook/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Архитектура Twitter. Два года спустя.</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-twitter-dva-goda-spustya/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-twitter-dva-goda-spustya/#comments</comments>
		<pubDate>Sat, 05 Mar 2011 17:47:27 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Apache]]></category>
		<category><![CDATA[Cassandra]]></category>
		<category><![CDATA[featured]]></category>
		<category><![CDATA[Flock]]></category>
		<category><![CDATA[FlockDB]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[HBase]]></category>
		<category><![CDATA[Kestrel]]></category>
		<category><![CDATA[Memcached]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[Pig]]></category>
		<category><![CDATA[Ruby]]></category>
		<category><![CDATA[Ruby on Rails]]></category>
		<category><![CDATA[Scala]]></category>
		<category><![CDATA[Scribe]]></category>
		<category><![CDATA[Twitter]]></category>
		<category><![CDATA[Unicorn]]></category>
		<category><![CDATA[архитектура Twitter]]></category>
		<category><![CDATA[интернет-проекты]]></category>
		<category><![CDATA[социальная сеть]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=942</guid>
		<description><![CDATA[В далеком 2008м я уже публиковал статью про архитектуру Twitter, но время летит стремительно и она уже абсолютно устарела. За это время аудитория Twitter росла просто фантастическими темпами и многое поменялось и с технической точки зрения. Интересно что новенького у одного из самых популярных социальных интернет-проектов? Статистика 3 год, 2 месяца и 1 день потребовалось [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.insight-it.ru/wp-content/uploads/2011/03/twitter.png"><img class="aligncenter size-full wp-image-959" title="Twitter" src="http://www.insight-it.ru/wp-content/uploads/2011/03/twitter.png" alt="Twitter" width="430" height="126" /></a></p>
<p>В далеком 2008м я уже публиковал статью про <a href="/net/scalability/arkhitektura-twitter/" target="_blank">архитектуру Twitter</a>, но время летит стремительно и она уже абсолютно устарела. За это время аудитория Twitter росла просто фантастическими темпами и многое поменялось и с технической точки зрения. Интересно что новенького у одного из самых популярных социальных интернет-проектов?<span id="more-942"></span></p>
<h2>Статистика</h2>
<ul>
<li>3 год, 2 месяца и 1 день потребовалось Twitter, чтобы набрать 1 миллиард твитов</li>
<li>На сегодняшний день, чтобы отправить миллиард твитов пользователям нужна всего одна неделя</li>
<li>752% рост аудитории за 2008 год</li>
<li>1358% рост аудитории за 2009 год (без учета API, по данным comScore)</li>
<li>175 миллионов зарегистрированных пользователей на сентябрь 2010 года</li>
<li>460 тысяч регистраций пользователей в день</li>
<li>9й сайт в мире по популярности (по данным Alexa, год назад был на 12 месте)</li>
<li>50 миллионов твитов в день год назад, 140 миллионов твитов в день месяц назад, 177 миллионов твитов в день на 11 марта 2011г.</li>
<li>Рекорд по количеству твитов за секунду 6939, установлен через минуту после того, как Новый Год 2011 наступил в Японии</li>
<li>600 миллионов поисков в день</li>
<li>Лишь 25% трафика приходится на веб сайт, остальное идет через API</li>
<li>Росто числа мобильных пользователей за последний год 182%</li>
<li><strong>6 миллиардов</strong> запросов к API в день, около 70 тысяч в секунду</li>
<li>8, 29, 130, 350, 400 &#8212; это количество сотрудников Twitter на январь 2008, январь 2009, январь 2010, январь и март 2011, соответственно</li>
</ul>
<p>Самая свежая <a href="http://blog.twitter.com/2011/03/numbers.html" target="_blank">статистика про Twitter</a>.</p>
<h2>Платформа</h2>
<ul>
<li><a href="/tag/apache/" target="_blank">Apache</a> + mod_proxy</li>
<li><a href="/tag/unicorn/" target="_blank">Unicorn</a></li>
<li><a href="/tag/ruby/" target="_blank">Ruby</a> + <a href="/tag/ror/" target="_blank">Ruby on Rails</a></li>
<li><a href="/tag/scala/" target="_blank">Scala</a></li>
<li><a href="/tag/flock/" target="_blank">Flock</a></li>
<li><a href="/tag/memcached/" target="_blank">memcached</a></li>
<li><a href="/tag/kestrel/" target="_blank">Kestrel</a></li>
<li><a href="/tag/mysql/" target="_blank">MySQL</a></li>
<li><a href="/tag/cassandra/" target="_blank">Cassandra</a></li>
<li><a href="/tag/scribe/" target="_blank">Scribe</a></li>
<li><a href="/tag/hadoop/" target="_blank">Hadoop</a>, <a href="/tag/hbase/" target="_blank">HBase</a> и <a href="/tag/pig/" target="_blank">Pig</a></li>
</ul>
<p>Сравните с аналогичным разделом предыдущей статьи о Twitter &#8212; увидите много новых лиц, подробнее ниже.</p>
<h2>Оборудование</h2>
<ul>
<li>Сервера расположены в NTT America</li>
<li>Никаких облаков и виртуализации, существующие решения страдают слишком высокими задержками</li>
<li>Более тысячи серверов</li>
<li>Планируется переезд в собственный датацентр</li>
</ul>
<h2>Что такое твит?</h2>
<ul>
<li>Сообщение длиной до 140 символов + метаданные</li>
<li>Типичные запросы:
<ul>
<li>по идентификатору</li>
<li>по автору</li>
<li>по @упоминаниям пользователей</li>
</ul>
</li>
</ul>
<h2>Архитектура</h2>
<h3><a href="http://www.insight-it.ru/wp-content/uploads/2011/03/twitter-request-flow.jpeg"><img class="aligncenter size-medium wp-image-953" title="Процесс обработки запроса в Twitter" src="http://www.insight-it.ru/wp-content/uploads/2011/03/twitter-request-flow-293x300.jpg" alt="Процесс обработки запроса в Twitter" width="293" height="300" /></a></h3>
<h3>Unicorn</h3>
<p>Сервер приложений для Rails:</p>
<ul>
<li>Развертывание новых версий кода <strong>без простоя</strong></li>
<li>На 30% меньше расход вычислительных ресурсов и оперативной памяти, по сравнению с другими решениями</li>
<li>Перешли с mod_proxy_balancer на mod_proxy_pass</li>
</ul>
<h3>Rails</h3>
<p>Используется в основном для генерации страниц, работа за сценой реализована на чистом Ruby или Scala.</p>
<p>Столкнулись со следующими проблемами:</p>
<ul>
<li>Проблемы с кэшированием, особенно по части инвалидации</li>
<li>ActiveRecord генерирует не самые удачные SQL-запросы, что замедляло время отклика</li>
<li>Высокие задержки в очереди и при репликации</li>
</ul>
<h3>memcached</h3>
<ul>
<li>memcached не идеален. Twitter начал сталкиваться с Segmentation Fault в нем очень рано.</li>
<li>Большинство стратегий кэширования основываются на длинных TTL (боллее минуты).</li>
<li>Вытеснение данных делает его непригодным для важных конфигурационных данных (например флагов &#171;темного режима&#187;, о котором пойдет речь ниже).</li>
<li>Разбивается на несколько пулов для улучшения производительности и снижения риска вытеснения.</li>
<li>Оптимизированная библиотека для доступа к memcached из Ruby на основе libmemcached + FNV hash, вместо чистого Ruby и md5.</li>
<li>Twitter является одним их наиболее активных проектов, участвующих в разработке libmemcached.</li>
</ul>
<h3>MySQL</h3>
<ul>
<li>Разбиение больших объемов данных является тяжелой задачей.</li>
<li>Задержки в репликации и вытеснение данных из кэша является причиной нарушения целостности данных с точки зрения конечного пользователя.</li>
<li>Блокировки создают борьбу за ресурсы для популярных данных.</li>
<li>Репликация однопоточна и происходит недостаточно быстро.</li>
<li>Данные социальных сетей плохо подходят для реляционных СУБД:
<ul>
<li>NxN отношения, социальный граф и обход деревьев &#8212; не самые подходящие задачи для таких баз данных</li>
<li>Проблемы с дисковой подсистемой (выбор файловой системы, noatime, алгоритм планирования)</li>
<li>ACID практически не требуется</li>
<li>Для очередей также практически непригодны</li>
</ul>
</li>
<li>Twitter сталкивался с большими проблемами касательно таблиц пользователей и их статусов</li>
<li>Читать данные с мастера при Master/Slave репликации = медленная смерть</li>
</ul>
<h3>FlockDB</h3>
<p>Масштабируемое хранилище для данных социального графа:</p>
<ul>
<li>Разбиение данных через Gizzard</li>
<li>Множество серверов MySQL в качестве низлежащей системы хранения</li>
<li>В Twitter содержит 13 миллиардов ребер графа и обеспечивает 20 тысяч операций записи и 100 тысяч операций чтения в секунду</li>
<li>Грани хранятся и индексируются в обоих направлениях</li>
<li>Поддерживает распределенный подсчет количества строк</li>
<li><a href="https://github.com/twitter/flockdb" target="_blank">Open source!</a></li>
</ul>
<p>Среднее время на выполнение операций:</p>
<ul>
<li>Подсчет количества строк: 1мс</li>
<li>Временные запросы: 2мс</li>
<li>Запись: 1мс для журнала, 16мс для надежной записи</li>
<li>Обход дерева: 100 граней/мс</li>
</ul>
<p>Подробнее про эволюцию систем хранения данных в Twitter <a href="http://www.slideshare.net/nkallen/q-con-3770885" target="_blank">в презентации Nick Kallen</a>.</p>
<h3>Cassandra</h3>
<p>Распределенная система хранения данных, ориентированная на работу в реальном времени:</p>
<ul>
<li>Изначально разработана в <a href="/tag/facebook/" target="_blank">Facebook</a></li>
<li>Очень высокая производительность на  запись</li>
<li>Из слабых сторон: высокая задержка при случайном доступе</li>
<li>Децентрализованная, способна переносить сбои оборудования</li>
<li>Гибкая схема данных</li>
<li><span style="color: #000000;"><del>Планируется полный переход на нее по следующему алгоритму: </del></span>
<ul>
<li><span style="color: #000000;"><del>Все твиты пишутся и в Cassandra и в MySQL</del></span></li>
<li><span style="color: #000000;"><del>Динамически часть операций чтения переводится на Cassandra</del></span></li>
<li><span style="color: #000000;"><del>Анализируется реакция системы, что сломалось</del></span></li>
<li><span style="color: #000000;"><del>Полностью отключаем чтение из Cassandra, чиним неисправности</del></span></li>
<li><span style="color: #000000;"><del>Начинаем сначала</del></span></li>
</ul>
</li>
<li><strong><a href="http://engineering.twitter.com/2010/07/cassandra-at-twitter-today.html" target="_blank">Обновление:</a> </strong>стратегия по поводу использования Cassandra изменилась, попытки использовать её в роли основного хранилища для твитов прекратились, но она продолжает использоваться для аналитики и географической информации.</li>
</ul>
<p>Подробнее почему Twitter пришел к решению использовать Cassandra можно прочитать <a href="http://www.slideshare.net/ryansking/scaling-twitter-with-cassandra" target="_blank">в отдельной презентации</a>.</p>
<p>Помимо всего прочего Cassandra <span style="color: #000000;"><del>планируется использовать</del></span> используется для аналитики в реальном времени.</p>
<h3>Scribe</h3>
<p>Пользователи Twitter генерируют огромное количество данных, около 15-25 Гб  в минуту, более 12 Тб в день, и эта цифра удваивается несколько раз в год.</p>
<p>Изначально для сбора логов использовали syslog-ng, но он очень быстро перестал справляться с нагрузкой.</p>
<p>Решение нашлось очень просто: <a href="/tag/facebook/" target="_blank">Facebook</a> столкнулся с аналогичной проблемой и разработал проект Scribe, который был опубликован в opensource.</p>
<p>По сути это фреймворк для сбора и агрегации логов, основанный на <a href="/tag/thrift/" target="_blank">Thrift</a>. Вы пишете текст для логов и указываете категорию, остальное он берет на себя.</p>
<p>Работает локально, надежен даже в случае потери сетевого соединения, каждый узел знает только на какой сервер передавать логи, что позволяет создавать масштабируемую иерархию для сбора логов.</p>
<p>Поддерживаются различные системы для записи в данным,  в том числе обычные файлы и HDFS (о ней ниже).</p>
<p>Этот продукт полностью решил проблему Twitter со сбором логов, используется около 30 различных категорий. В процессе использования была создана и опубликована масса доработок. Активно сотрудничают с командой Facebook в развитии проекта.</p>
<h3>Hadoop</h3>
<p>Как Вы обычно сохраняете 12Тб новых данных, поступающих каждый день?</p>
<p>Если считать, что средняя скорость записи современного жесткого диска составляет 80Мбайт в секунду, запись 12Тб данных заняла бы почти 48 часов.</p>
<p>На одном даже очень большом сервере данную задачу не решить, логичным решением задачи стало использование кластера для хранения и анализа таких объемов данных.</p>
<p>Использование кластерной файловой системы добавляет сложности, но позволяет меньше заботиться о деталях.</p>
<p>Hadoop Distributed File System (HDFS) предоставляет возможность автоматической репликации и помогает справляться со сбоями оборудования.</p>
<p>MapReduce framework позволяет обрабатывать огромные объемы данных, анализируя пары ключ-значение.</p>
<p>Типичные вычислительные задачи, которые решаются с помощью Hadoop в Twitter:</p>
<ul>
<li>Вычисление связей дружбы в социальном графе (grep и awk не справились бы, self join в MySQL на таблицах с миллиардами строк &#8212; тоже)</li>
<li>Подсчет статистики (количество пользователей и твитов, например подсчет количества твитов занимает 5 минут при 12 миллиардах записей)</li>
<li>Подсчет PageRank между пользователями для вычисления репутации.</li>
</ul>
<p>В твиттер используется бесплатный дистрибутив от Cloudera, версия Hadoop 0.20.1, данные храняться <a href="https://github.com/kevinweil/hadoop-lzo" target="_blank">в сжатом по алгоритму LZO виде</a>, библиотеки для работы с данными опубликованы под названием <a href="https://github.com/kevinweil/elephant-bird" target="_blank">elephant-bird</a>.</p>
<h3>Pig</h3>
<p>Для того чтобы анализировать данные с помощью MapReduce обычно необходимо разрабатывать код на Java, что далеко не все умеют делать, да и трудоемко это.</p>
<p>Pig представляет собой высокоуровневый язык, позволяющий трансформировать огромные наборы данных шаг за шагом.</p>
<p>Немного напоминает SQL, но намного проще. Это позволяет писать в 20 раз меньше кода, чем при анализе данных с помощью обычных MapReduce работ.  Большая часть работы по анализу данных в Twitter осуществляется с помощью Pig.</p>
<h3>Данные</h3>
<p>Полу-структурированные данные:</p>
<ul>
<li>логи Apache, RoR, MySQL, A/B тестирования, процесса регистрации</li>
<li>поисковые запросы</li>
</ul>
<p>Структурированные данные:</p>
<ul>
<li>Твиты</li>
<li>Пользователи</li>
<li>Блок-листы</li>
<li>Номера телефонов</li>
<li>Любимые твиты</li>
<li>Сохраненные поиски</li>
<li>Ретвиты</li>
<li>Авторизации</li>
<li>Подписки</li>
<li>Сторонние клиенты</li>
<li>География</li>
</ul>
<p>Запутанные данные:</p>
<ul>
<li>Социальный граф</li>
</ul>
<p><strong>Что же они делают с этим всем?</strong></p>
<ul>
<li>Подсчет математического ожидания, минимума, максимума и дисперсии следующих показателей:
<ul>
<li>Количество запросов за сутки</li>
<li>Средняя задержка, 95% задержка</li>
<li>Распределение кодов HTTP-ответов (по часам)</li>
<li>Количество поисков осуществляется каждый день</li>
<li>Количество уникальных запросов и пользователей</li>
<li>Географическое распределение запросов и пользователей</li>
</ul>
</li>
<li>Подсчет вероятности, ковариации, влияния:
<ul>
<li>Как отличается использование через мобильные устройства?</li>
<li>Как влияет использование клиентов сторонних разработчиков?</li>
<li>Когортный анализ</li>
<li>Проблемы с сайтом (киты и роботы, подробнее ниже)</li>
<li>Какие функциональные возможности цепляют пользователей?</li>
<li>Какие функциональные возможности чаще используются популярными пользователями?</li>
<li>Корректировка и предложение поисковых запросов</li>
<li>A/B тестирование</li>
</ul>
</li>
<li>Предсказания, анализ графов, естественные языки:
<ul>
<li>Анализ пользователей по их твитам, твитов, на которые они подписаны, твитам их фоловеров</li>
<li>Какая структура графа ведет к успешным популярным сетям</li>
<li>Пользовательская репутация</li>
<li>Анализ эмоциональной окраски</li>
<li>Какие особенности заставляют людей ретвитнуть твит?</li>
<li>Что влияет на глубину дерева ретвитов ?</li>
<li>Долгосрочное обнаружение дубликатов</li>
<li>Машинное обучение</li>
<li>Обнаружения языка</li>
</ul>
</li>
</ul>
<p>Подробнее про обработку данных <a href="http://www.slideshare.net/kevinweil/nosql-at-twitter-nosql-eu-2010" target="_blank">в презентации Kevin Weil</a>.</p>
<h3>HBase</h3>
<p>Twitter начинают строить настоящие сервисы на основе Hadoop, например поиск людей:</p>
<ul>
<li>HBase используется как изменяемая прослойка над HDFS</li>
<li>Данные экспортируются из HBase c помощью периодической MapReduce работы:
<ul>
<li>На этапе Map использются также данные из FlockDB и нескольких внутренних сервисов</li>
<li>Собственная схема разбиения данных</li>
<li>Данные подтягиваются через высокопроизводительный, горизонтально масштабируемый сервис на Scala (<a href="http://www.slideshare.net/al3x/building-distributed-systems-in-scala" target="_blank">подробнее о построении распределенных сервисов на Scala</a>)</li>
</ul>
</li>
</ul>
<p>На основе HBase разрабатываются и другие продукты внутри Twitter.</p>
<p>Основными её достоинствами являются гибкость и легкая интеграция с Hadoop и Pig.</p>
<p>По сравнению с Cassandra:</p>
<ul>
<li>&#171;Их происхождение объясняет их сильные и слабые стороны&#187;</li>
<li>HBase построен на основе системы по пакетной обработке данных, высокие задержки, работает далеко не в реальном времени</li>
<li>Cassandra построена с нуля для работы с низкими задержками</li>
<li>HBase легко использовать при анализе данных как источник или место сохранения результатов, Cassandra для этого подходит меньше, но они работают над этим</li>
<li>HBase на данный момент единственную точку отказа в виде мастер-узла</li>
<li>В твиттере HBase используется для аналитики, анализа и создания наборов данных, а Cassandra &#8212; для онлайн систем</li>
</ul>
<h3>Loony</h3>
<p>Централизованная система управления оборудованием.</p>
<p>Реализована с использованием:</p>
<ul>
<li><a href="/tag/python/" target="_blank">Python</a></li>
<li><a href="/tag/django/" target="_blank">Django</a></li>
<li><a href="/tag/mysql/" target="_blank">MySQL</a></li>
<li><a href="http://www.lag.net/paramiko/" target="_blank">Paraminko</a> (реализация протокола SSH на Python, разработана и опубликована в opensource в Twitter)</li>
</ul>
<p>Интегрирована с LDAP, анализирует входящую почту от датацентра и автоматически вносит изменения в базу.</p>
<h3>Murder</h3>
<p>Система развертывания кода и ПО, основанная на протоколе BitTorrent.</p>
<p>Благодаря своей P2P природе позволяет обновить более тысячи серверов за 30-60 секунд.</p>
<h3>Kestrel</h3>
<p>Распределенная очередь, работающая по протоколу memcache:</p>
<ul>
<li>set &#8212; поставить в очередь</li>
<li>get &#8212; взять из очереди</li>
</ul>
<p>Особенности:</p>
<ul>
<li>Отсутствие строгого порядка выполнения заданий</li>
<li>Отсутствие общего состояния между серверами</li>
<li>Разработана на <a href="/tag/scala/" target="_blank">Scala</a></li>
</ul>
<h3>Daemon&#8217;ы</h3>
<p>Каждый твит обрабатывается с помощью daemon&#8217;ов.</p>
<p>В unicorn обрабатываются только HTTP запросы, вся работа за сценой реализована в виде отдельных daemon&#8217;ов.</p>
<p>Раньше использовалось много разных демонов, по одному на каждую задачу (Rails), но перешли к меньшему их количеству, способному решать несколько задач одновременно.</p>
<h3>Как они справляются с такими темпами роста?</h3>
<p>Рецепт прост, но эффективен, подходит практически для любого интернет-проекта:</p>
<ul>
<li><em>обнаружить самое слабое место в системе;</em></li>
<li><em>принять меры по его устранению;</em></li>
<li><em>перейти к следующему самому слабому месту.</em></li>
</ul>
<p>На словах звучит и правда примитивно, но на практике нужно предпринять ряд мер, чтобы такой подход был бы реализуем:</p>
<ul>
<li>Автоматический сбор метрик (причем в агрегированном виде)</li>
<li>Построение графиков (RRD, Ganglia)</li>
<li>Сбор и анализ логов</li>
<li>Все данные должны получаться с минимальной задержкой, как можно более близко к реальному времени</li>
<li>Анализ:
<ul>
<li>Из данных необходимо получать <em>информацию</em></li>
<li>Следить за динамикой показателей: стало лучше или хуже?</li>
<li>Особенно при развертывании новых версий кода</li>
<li>Планирование использования ресурсов намного проще, чем решение экстренных ситуаций, когда они на исходу</li>
</ul>
</li>
</ul>
<p>Примерами агрегированных метрик в Twitter являются &#171;киты&#187; и &#171;роботы&#187;, вернее их количество в единицу времени.</p>
<p><strong>Что такое &#171;робот&#187;?</strong></p>
<p><strong><a href="http://www.insight-it.ru/wp-content/uploads/2011/03/twitter-Bot.png"><img class="aligncenter size-full wp-image-943" title="Twitter Робот" src="http://www.insight-it.ru/wp-content/uploads/2011/03/twitter-Bot.png" alt="Twitter Робот" width="400" height="273" /></a><br />
</strong></p>
<ul>
<li>Ошибка внутри Rails (HTTP 500)</li>
<li>Непойманное исключение</li>
<li>Проблема в коде или нулевой результат</li>
</ul>
<p><strong>Что такое &#171;кит&#187;?</strong></p>
<p><strong><a href="http://www.insight-it.ru/wp-content/uploads/2011/03/whale.png"><img class="aligncenter size-full wp-image-944" title="Twitter Кит" src="http://www.insight-it.ru/wp-content/uploads/2011/03/whale.png" alt="Twitter Кит" width="530" height="398" /></a><br />
</strong></p>
<ul>
<li>HTTP ошибка 502 или 503</li>
<li>В твиттер используется фиксированный таймаут в 5 секунд (лучше кому-то показать ошибку, чем захлебнуться в запросах)</li>
<li>Убитый слишком длинный запрос к базе данных (mkill)</li>
</ul>
<p>Значительное превышение нормального количества китов или роботов в минуту является поводом для беспокойством.</p>
<p>Реализован этот механизм простым bash-скриптом, который просматривает агрегированные логи за последние 60 секунд, подсчитывает количество китов/роботов и рассылает уведомления, если значение оказалось выше порогового значения. Подробнее про работу команды оперативного реагирования <a href="http://www.slideshare.net/netik/billions-of-hits-scaling-twitter" target="_blank">в презентации John Adams</a>.</p>
<h3>&#171;Темный режим&#187;</h3>
<p>Для экстренных ситуаций в Twitter предусмотрен так называемый &#171;темный режим&#187;, который представляет собой набор механизмов для отключения тяжелых по вычислительным ресурсам или вводу-выводу функциональных частей сайта. Что-то вроде стоп-крана для сайта.</p>
<p>Имеется около 60 выключателей, в том числе и полный режим &#171;только для чтения&#187;.</p>
<p>Все изменения в настройках этого режима фиксируются в логах и сообщаются руководству, чтобы никто не баловался.</p>
<h2>Подводим итоги</h2>
<ul>
<li>Не бросайте систему на самотек, начинайте собирать метрики и их визуализировать как можно раньше</li>
<li>Заранее планируйте рост требуемых ресурсов и свои действия в случае экстренных ситуаций</li>
<li>Кэшируйте по максимуму все, что возможно</li>
<li>Все инженерные решения не вечны, ни одно из решений не идеально, но многие будут нормально работать в течение какого-то периода времени</li>
<li>Заранее начинайте задумываться о плане масштабирования</li>
<li>Не полагайтесь полностью на memcached и базу данных &#8212; они могут Вас подвести в самый неподходящий момент</li>
<li>Все данные для запросов в реальном времени должны находиться в памяти, диски в основном для записи</li>
<li>Убивайте медленные запросы (mkill) прежде, чем они убьют всю систему</li>
<li>Некоторые задачи могут решаться путем предварительного подсчета и анализа, но далеко не все</li>
<li>Приближайте вычисления к данным по возможности</li>
<li>Используйте не mongrel, а unicorn для RoR</li>
</ul>
<p><strong>Спасибо за внимание, <a href="/feed/" target="_blank">жду Вас снова</a>! Буду рад, если Вы <a href="http://twitter.com/blinkov" target="_blank">подпишитесь на меня в Twitter</a>, с удовольствием пообщаюсь со всеми читателями <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </strong></p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-twitter-dva-goda-spustya/feed/</wfw:commentRss>
		<slash:comments>60</slash:comments>
		</item>
		<item>
		<title>Новое поколение MapReduce в Apache Hadoop</title>
		<link>http://www.insight-it.ru/masshtabiruemost/novoe-pokolenie-mapreduce-v-apache-hadoop/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/novoe-pokolenie-mapreduce-v-apache-hadoop/#comments</comments>
		<pubDate>Sat, 19 Feb 2011 18:23:00 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Apache]]></category>
		<category><![CDATA[Apache Hadoop]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[кластер]]></category>
		<category><![CDATA[кластеризация]]></category>
		<category><![CDATA[кластерные вычисления]]></category>
		<category><![CDATA[разработка]]></category>
		<category><![CDATA[технологии]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=811</guid>
		<description><![CDATA[В большом бизнесе использование нескольких больших кластеров с финансовой точки зрения более эффективно, чем много маленьких. Чем больше машин в кластере, тем большими наборами данных он может оперировать, больше задач могут выполняться одновременно. Реализация MapReduce в Apache Hadoop столкнулась с потолком масштабируемости на уровне около 4000 машин в кластере. Разрабатывается следующее поколение Apaсhe Hadoop MapReduce,  в [...]]]></description>
			<content:encoded><![CDATA[<div>
<p>В большом бизнесе использование нескольких больших кластеров с финансовой точки зрения более эффективно, чем много маленьких. Чем больше машин в кластере, тем большими наборами данных он может оперировать, больше задач могут выполняться одновременно. Реализация <a href="/tag/mapreduce/" target="_blank">MapReduce</a> в <a href="/tag/apache/" target="_blank">Apache</a> <a href="/tag/hadoop/" target="_blank">Hadoop</a> столкнулась с потолком масштабируемости на уровне около 4000 машин в кластере. Разрабатывается следующее поколение Apaсhe Hadoop MapReduce,  в котором появится общий планировщик ресурсов и отдельный мастер для каждой отдельной задач, управляющий выполнением программного кода. Так как простой оборудования по техническим причинам обходится дорого на таком масштабе, высокий уровень доступности проектируется с самого начала, ровно как и безопасность и многозадачность, необходимые для поддержки одновременного использования большого кластера многими пользователями. Новая архитектура также будет более инновационной, гибкой и эффективной с точки зрения использования вычислительных ресурсов.</p>
<p><span id="more-811"></span></p>
<h2>Предыстория</h2>
<p>Текущая реализация Hadoop MapReduce устаревает на глазах. Основываясь на текущих тенденциях в размерах кластеров и нагрузок на них, JobTracker требует кардинальных доработок, чтобы исправить его дефекты в области масштабируемости, потребления памяти, многопоточности, надежности и производительности. С точки зрения работы с Hadoop при каждом обновлении кластера (даже если это просто багфикс), абсолютно все компоненты кластера, так и приложений, которые на нем работают, должны быть обновлены одновременно. Это так же очень неудобно, так как каждый раз необходимо тестировать все приложения на совместимость с новой версией.</p>
<h2>Требования</h2>
<p>Прежде чем кардинально что-то менять в Hadoop mapreduce, необходимо понять какие же основные требования предъявляются к вычислительным кластерам на практике. Наиболее значительными требованиями к Hadoop следующего поколения являются:</p>
<ul>
<li>Надежность</li>
<li>Доступность</li>
<li>Масштабируемость &#8212; кластеры из как минимум 10 тысяч машин, 200 тысяч вычислительных ядер и даже больше</li>
<li>Обратная и прямая совместимость &#8212; возможность быть уверенным, что приложение будет работать на новой версии так же, как оно работало на старой</li>
<li>Контроль над обновлениями</li>
<li>Предсказуемые задержки</li>
<li>Эффективное использование ресурсов</li>
</ul>
<p>Среди менее значительных требований:</p>
<ul>
<li>Поддержка альтернативных парадигм разработки (помимо MapReduce)</li>
<li>Поддержка сервисов с коротким жизненным циклом</li>
</ul>
<p>Если учесть перечисленные выше требования, то становится очевидно, что инфраструктура обработки данных в Hadoop должна быть кардинальным образом изменена. В сообществе Hadoop люди в целом приходят к общему мнению, что текущая архитектура MapReduce не способна решить текущие задачи, которые перед ней ставится, и что требуется кардинальный рефакторинг кодовой базы.</p>
<h2>MapReduce следующего поколения</h2>
<p>Фундаментальной идеей смены архитектуры является разделение двух основных функций JobTracker&#8217;а на два отдельных части:</p>
<ul>
<li>управление ресурсами;</li>
<li>планирования и мониторинга задач.</li>
</ul>
<div>В итоге появляется несколько новых ролей:</div>
<div>
<ul>
<li><strong>ResourceManager</strong> управляет глобальным распределением вычислительных ресурсов между приложениями;</li>
<li><strong>ApplicationMaster</strong> управляет планированием и координацией внутри приложения;</li>
<li><strong>NodeManager</strong> управляет процессами в рамках одной машины.</li>
</ul>
</div>
<div>ApplicationMaster представляет собой библиотеку, с помощью которой можно получить у ResourceManager квоту на вычислительные ресурсы и работать с NodeManager(ами) для выполнения и мониторинга задач.</div>
<div>ResourceManager поддерживает иерархическим очереди приложений, которым может гарантированно выделяться некоторый процент ресурсов кластера. Его функционал ограничивается планированием, никакого мониторинга и отслеживания задач не происходит, а также нет никаких гарантий перезапуска задач, провалившихся из-за проблем с оборудованием или кодом. Планирование основывается на требованиях, которые выставляет приложение с помощью ряда запросов ресурсов (среди них: запросы на вычислительные ресурсы, память, дисковое пространство, сетевой доступ и т.п.). Обратите внимание, что это значительное изменение по сравнению с текущей моделью слотов фиксированного размера, которая является одной из основных причин неэффективного использования ресурсов кластера на данный момент.</div>
<p>NodeManager &#8212; это агент, который работает на каждой машине и несет ответственность за запуск контейнеров приложений, мониторинг используемых ими ресурсов (плюс отчет планировщику).</p>
<p>По одному ApplicationMaster запускается для каждого приложения, они ответственны за запрос необходимых ресурсов у планировщика, запуск задач, отслеживание статусов, мониторинг прогресса и обработку сбоев.</p>
<h2>Архитектура</h2>
<p><a href="http://www.insight-it.ru/wp-content/uploads/2011/02/MapReduce_NextGen.jpg"><img class="aligncenter size-full wp-image-814" title="Следующее поколение MapReduce " src="http://www.insight-it.ru/wp-content/uploads/2011/02/MapReduce_NextGen.jpg" alt="Следующее поколение MapReduce " width="624" height="386" /></a></p>
<h2>Улучшения по сравнению с текущей реализацией MapReduce</h2>
<h3>Масштабируемость</h3>
<p>Разделение управления ресурсами и прикладными задачами позволяет горизонтально расширять кластер более просто и эффективно. JobTracker проводит значительную часть времени пытаясь управлять жизненным циклом каждого приложения, что часто может приводить к различным происшествиям &#8212; переход к отдельному менеджеру для каждого приложения является значительным шагом вперед.</p>
<p>Масштабируемость особенно важна в свете текущих трендов в оборудовании &#8212; на данный момент Hadoop может быть развернут на кластере из 4000 машин. Но 4000 средних машин 2009го года (т.е. по 8 ядер, 16Гб памяти, 4Тб дискового пространства) только вдвое менее  ресурсоемки, чем 4000 машин 2011го года (16 ядер, 48гб памяти, 24Тб дискового пространства). Помимо этого с точки зрения операционных издержек было выгоднее работать в еще больших кластере от 6000 машин и выше.</p>
<h3>Доступность</h3>
<ul>
<li>ResourceManager использует <a href="http://hadoop.apache.org/zookeeper/" target="_blank">Apache ZooKeeper</a> для обработки сбоев. Когда ResourceManager перестает работать, аналогичный процесс может быстро запуститься на другой машине благодаря тому, что состояние кластера было сохранено в ZooKeeper. При таком сценарии все запланированные и выполняющиеся приложения максимум лишь перезапустятся.</li>
<li>ApplicationMaster &#8212; поддерживается создание точек восстановления на уровне приложений. ApplicationMaster может восстановить работу из состояния, сохраненного в HDFS, в случае сбоя.</li>
</ul>
<h3>Совместимость протокола</h3>
<p>Это позволит различным версиям клиентов и серверов Hadoop общаться между собой. Помимо решения многих существующих проблем с обновлением, в будующих релизах появится возможность последовательного обновления кода без простоя системы в целом &#8212; очень большое достижения с точки зрения системного администрирования.</p>
<h3>Инновационность и гибкость</h3>
<p>Основным плюсом предложенной архитектуры является тот факт, что MapReduce по сути становится просто пользовательской библиотекой. Вычислительная же система (ResourceManager и NodeManager) становятся полностью независимыми от специфики MapReduce.</p>
<p>Клиенты получат возможность одновременного использования разных версий MapReduce в одном и том же кластере. Это становится тривиальным, так как отдельная копия ApplicationMaster&#8217;а запускается для каждого приложения. Это дает гибкость в исправлении багов, улучшений и новых возможностей, так как полное обновление кластер перестает быть обязательной процедурой. Это позволяет клиентам обновлять их приложения до новых версий MapReduce вне зависимости от обновлений кластера.</p>
<p><strong>Эффективность использования вычислительных ресурсов</strong></p>
<p>ResourceManager использует общую концепцию для управления ресурсами и планирования по отношению к каждому конкретному приложению. Каждая машина в кластере на концептуальном уровне рассматривается просто как набор ресурсов: память, процессор, ввод-вывод и др. Все машины взаимозаменяемы и приложение может быть назначено на любую из них, основываясь на доступных и запрашиваемых ресурсах. При этом приложения работают в контейнерах, изолированно от других приложений, что дает сильную поддержку многозадачности.</p>
<p>Таким образом эта схема избавляет от текущего механизма map и reduce слотов в Hadoop, который негативно влияет на эффективную утилизацию вычислительных ресурсов.</p>
<h3>Поддержка других парадигм программирования помимо MapReduce</h3>
<p>В предложенной архитектуре используется общий механизм вычислений, не привязанный конкретно к MapReduce, что позволит использовать и другие парадигмы. Имеется возможность реализовать собственный ApplicationMaster, способный запрашивать ресурсы у ResourceManager и использовать их в соответствии с задачей, при этом сохраняются общие принципы изоляции и гарантированного наличия полученных ресурсов. Среди потенциально поддерживаемых парадигм можно назвать MapReduce, MPI, Мaster-Worker, итеративные модели. Все они могут одновременно работать на одном и том же кластере. Это особенно актуально для приложений (например К-средний или Page Rank), где <a href="/masshtabiruemost/piccolo-postroenie-raspredelennykh-sistem-v-11-raz-bystree-hadoop/" target="_blank">другие подходы более чем на порядок эффективнее</a> MapReduce.</p>
<h2>Выводы</h2>
<p>Apache Hadoop, и в частности Hadoop MapReduce &#8212; очень успешный opensource проект по обработке больших объемов данных. Предложенный Yahoo путь его переработки направлен на исправление недостатков архитектуры текущей реализации, при этом повышая доступность, эффективность использования ресурсов и предоставляя поддержку других парадигм распределенных вычислений.</p>
<p>Осталось дело за малым &#8212; собственно реализовать задуманное! <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p><em>Источник информации: <a href="http://developer.yahoo.com/blogs/hadoop/posts/2011/02/mapreduce-nextgen/" target="_blank">http://developer.yahoo.com/blogs/hadoop/posts/2011/02/mapreduce-nextgen/</a></em></p>
<p><em><a href="/feed" target="_blank">Подписаться на RSS можно здесь.</a></em></p>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/novoe-pokolenie-mapreduce-v-apache-hadoop/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Еще раз про HBase</title>
		<link>http://www.insight-it.ru/masshtabiruemost/eshe-raz-pro-hbase/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/eshe-raz-pro-hbase/#comments</comments>
		<pubDate>Wed, 27 Aug 2008 16:29:32 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[HBase]]></category>
		<category><![CDATA[map]]></category>
		<category><![CDATA[кластер]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=88</guid>
		<description><![CDATA[Некоторое время назад Neuronus в одном из комментариев к посту &#171;Hadoop возвращается&#187; не согласился с моим кратким определением HBase как &#171;нереляционная база данных&#187; (позаимствованным, собственно говоря, откуда-то с официального портала продукта). Этот факт подтолкнул меня попытаться найти более корректное определение в англоязычных источниках информации, получилось вполне успешно. Хочется прочитать более детально что к чему? Вперед! [...]]]></description>
			<content:encoded><![CDATA[<p>Некоторое время назад <a href="http://neuronus.blogspot.com" rel="nofollow" target="_blank">Neuronus</a> в одном из комментариев к посту <a href="/net/scalability/hadoop-vozvrashhaetsya/">&#171;Hadoop возвращается&#187;</a> не согласился с моим кратким определением HBase как &#171;нереляционная база данных&#187; (позаимствованным, собственно говоря, откуда-то с официального портала продукта). Этот факт подтолкнул меня попытаться найти более корректное определение в англоязычных источниках информации, получилось вполне успешно. Хочется прочитать более детально что к чему? Вперед!<br />
<span id="more-88"></span><br />
Если Вам уже приходилось иметь дело с этой системой,возможно Вы уже поняли, что самым сложным этапом работы является просто-напросто осознавание того, чем она на самом деле является. Обычно приходится мысленно отказаться от всех привычек, доставшихся при работе с традиционный RDBMS, и начинать постигать базовые принципы организации хранения данных с нуля.</p>
<p>Стоит напомнить, что проект позиционируется как opensource реализация <a href="/tag/bigtable" target="_blank">BigTable</a> от <a href="/tag/google" target="_blank">Google</a>. Да, проекты имплементированы разными людьми на разных языках программирования, но общие идеи и принципы функционирования у них сильно пересекаются. Наиболее значимой общей характеристикой у них является очень схожие модели данных (о чем <a href="http://wiki.apache.org/hadoop/Hbase/HbaseArchitecture#head-daee3a0ce7a6892096ffb43f3cc3e0310d047f48" target="_blank" rel="nofollow">упоминается</a> в вики HBase), а в свою очередь <a href="http://labs.google.com/papers/bigtable.html" target="_blank" rel="nofollow">в документации</a> BigTable она описывается очень четко и определенно, точно определяя чем эти продукты по сути являются:<br />
<blockqoute><br />
A Bigtable is a sparse, distributed, persistent multidimensional sorted map.
</p></blockquote>
<p>Предлагаю по аналогии со <a href="http://jimbojw.com/wiki/index.php?title=Understanding_HBase_and_BigTable" target="_blank" rel="nofollow">статьей в вики</a>, послужившей основой для данного поста, разбить это определение на отдельные слова и последовательно пройтись по ним, попутно составляя в голове полную картину.</p>
<h3>map</h3>
<p>За этим термином нет четкого устоявшегося обозначения в русском языке (да и в английском тоже все далеко не так однозначно), математики обычно называют это <em>отображением одного множества в другое</em>, в то время как если Вы знакомы с программированием, то Вам наверняка больше знакомы будут более знакомы такие обозначения, как <em>ассоциативный массив</em> (<a href="/tag/php" target="_blank">PHP</a>), <em>словарь</em> (<a href="/tag/python" target="_blank">Python</a>), <em>хэш</em> (<a href="/tag/ruby" target="_blank">Ruby</a>) или <em>объект</em> (<a href="/tag/javascript" target="_blank">JavaScript</a>).</p>
<p>По сути же имеется ввиду просто набор однозначно соответствующих пар ключ-значение, в роли которых выступают массивы байт. Во все той же статейке в вики все очень наглядно демонстрируется примерами в нотации <abbr title="JavaScript Object Notation">JSON</abbr>, позволю себе тоже приводить аналогичные примеры. В <abbr title="JavaScript Object Notation">JSON</abbr> наш <strong>map</strong> выглядел бы следующим образом:</p>
<pre lang="javascript">
{
  "qqqq" : "some",
  "abc" : "sample",
  "zz" : "JSON",
  "123" : "map",
  "mnbvcxz" : "looks like this"
}
</pre>
<h3>persistent</h3>
<p>Это прилагательное обозначает всего лишь &#171;постоянный&#187;, то есть в данном контексте оно говорит только о том, что данная система не зависит от использующих ее приложений, а также хранится на устройствах постоянного хранения данных, а не в оперативной памяти.</p>
<h3>distributed</h3>
<p>Распределенность этих систем можно рассматривать с двух точек зрения:</p>
<ul>
<li>Как HBase, так и BigTable сами по себе могут функционировать на большом количестве серверов, которые можно разделить на две большие категории: master и slave. Slave сервера собственно выполняют всю работу с данными, а master &#8212; лишь только координируют их действия и управляют процессом в целом. Этот факт обеспечивают высокую степень устойчивости к сбоям (в HBase правда количество master-серверов ограничено одним, что представляет собой единственную точку, сбой в которой приведет к отказу всей системы, но это лишь временная проблема, которую наверняка устранят в следующих версиях), а также существенно облегчает масштабируемость всей системы так как добавление дополнительных серверов (а значит и увеличение производительности и вместительности системы) достаточно тривиально, безболезненно и не мешает общему ее функционированию.</li>
<li>Помимо этого каждая из этих систем обычно использует для хранения данных кластерную файловую систему (HBase &#8212; <a href="/tag/hdfs" target="_blank">HDFS</a>, а BigTable &#8212; <a href="/tag/gfs" target="_blank">GFS</a>), которые тоже по своей природе являются распределенными и функционируют по схожему принципу, обеспечивая дополнительную сохранность данных, реплицируя их в нескольких экземплярах на нескольких серверах (обычно трех).</li>
</ul>
<h3>sorted</h3>
<p>HBase и BigTable не строят никакие индексы для ускорения процесса извлечения данных, единственное используемое в них правило заключается в следующем: каждый slave-сервер в системе отвечает за определенный диапазон ключей (от и до определенных его значений), и держит все записи в строгом лексикографическом порядке по ключам (заметьте: сортировку значений никто не гарантирует!). Продолжая пример с JSON это выглядело бы примерно вот так:</p>
<pre lang="javascript">
{
  "123" : "map",
  "abc" : "sample",
  "mnbvcxz" : "looks like this",
  "qqqq" : "some",
  "zz" : "JSON"
}
</pre>
<p>Этим фактом можно активно пользоваться при планировании использовании системы, например если в качестве ключей планируется использовать доменные именные имена, то имеет смысл использовать их в &#171;развернутом&#187; виде, например: &#171;com.example.www&#187; вместо &#171;www.example.com&#187;. Это почти наверняка обеспечит попадание всех поддоменов одного и того же домена на один slave-сервер, а также группировку доменов по зонам.</p>
<h3>multidimensional</h3>
<p>До сих пор ключ интерпретировался нами как нечто единое и неделимое, но на самом деле в данной ситуации это далеко не так. На самом деле пространство имен HBase и BigTable имеет несколько пространств, по аналогии с трехмерным материальным пространством, где есть ширина, высота и глубина. Если мы попытаемся представить это с помощью JSON, то это будет выглядеть как набор вложенных простых map&#8217;ов:</p>
<pre lang="javascript">
{
  "table-1":
  {
     "column-family-1":
     {
        "column-1":
        {
           "row-1":
           {
              "timestamp-1": "value-1",
              "timestamp-2": "value-2",
              "timestamp-3": "value-3"
           },
           "row-2":
           {
              "timestamp-1": "value-4",
              "timestamp-2": "value-5",
              "timestamp-3": "value-6"
           }
        },
        "column-2":
        {
           "row-1":
           {
              "timestamp-1": "value-1",
              "timestamp-3": "value-3"
           },
           "row-2":
           {
              "timestamp-1": "value-4",
              "timestamp-2": "value-5",
              "timestamp-3": "value-6"
           }
        }
     "column-family-2":
     {
        "column-1":
        {
           // ...
        },
        "":
        {
           "row-1": "some-value"
        }
        // ...
     }
     }
  }
}
</pre>
<p>Как можно увидеть из примера, таких пространств используется пять:</p>
<ul>
<li>таблицы;</li>
<li>наборы столбцов;</li>
<li>столбцы;</li>
<li>строки;</li>
<li>время;</li>
</ul>
<p>Таким образом, каждое значение в хранилище данных однозначно соответствует ключу, состоящему из пяти компонентов, например в примере значению &#171;value-5&#8243; соответствует ключ, состоящий из:</p>
<ul>
<li>table-1;</li>
<li>column-family-1;</li>
<li>column-1;</li>
<li>row-2;</li>
<li>timestamp-2;</li>
</ul>
<p>Принцип очень похож на используемый в более привычных базах данных, с той лишь разницей, что добавляется еще и время (которое обычно представляется в виде целочисленного значения, обозначающего количество секунд с начала эпохи). Изначально оно задумывалось для предоставления возможности отследить историю изменения данных, но этому дополнительному измерению можно найти и массу нестандартных применений, например используя его как самый обыкновенный стек.</p>
<p>Хочется обратить внимание, что ассортимент наборов столбцов (column family) указывается при создании таблиц, и изменения в них должны производиться с помощью специального запроса, в то время как сами столбцы являются динамическими и для его создания достаточно лишь добавить в него данные.</p>
<h3>sparse</h3>
<p>Развивая мысль предыдущего абзаца, можно понять, что наличие значения столбца в каждой строке вовсе не обязательно, оно запросто может и отсутствовать вовсе. Таким образом каждая строка может содержать произвольное количество значений для столбцов в рамках одной column family, ровно как может и не содержать их вовсе. Несуществующие данные не хранятся в виде какого-либо NULL-значения, они просто отсутствуют. Запрос на несуществующие данные просто вернет пустой результат. Если же взглянуть с другой стороны, то тот же самый факт можно представить и как возможность наличия пробелов в списке ключей строк.</p>
<h3>И напоследок&#8230;</h3>
<p>хочется сказать, что все это лишь дело терминологии, ровно то же самое можно подразумевать и под краткой фразой &#171;нереляционная база данных&#187;, не смотря на то, что она существенно менее точна и полноценна. В данном контексте самое главное лишь чтобы люди просто понимали друг друга. Надеюсь после прочтения этого поста в вашем сознании сложилась четкая картина этого продукта и предоставляемых им возможностей, которая Вам пригодится как для &#171;общего развития&#187;, так и для потенциального практического применения этого продукта. Если остались неясные моменты &#8212; смело оставляйте комментарии. <a href="/feed" target="_blank">Традиционная подписка на RSS</a> &#8212; приветствуется <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/eshe-raz-pro-hbase/feed/</wfw:commentRss>
		<slash:comments>13</slash:comments>
		</item>
		<item>
		<title>Hadoop возвращается</title>
		<link>http://www.insight-it.ru/masshtabiruemost/hadoop-vozvrashhaetsya/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/hadoop-vozvrashhaetsya/#comments</comments>
		<pubDate>Sun, 17 Aug 2008 20:15:48 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Apache]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[HBase]]></category>
		<category><![CDATA[HDFS]]></category>
		<category><![CDATA[MapReduce]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=87</guid>
		<description><![CDATA[Если Вы являетесь постоянным читателем моего блога, то вполне вероятно, что Вы помните мой старый пост об этом замечательном проекте от Apache Foundation. С тех пор он развивался невероятными темпами и очень многое успело измениться, об этом я и хотел бы сегодня поделиться своими впечатлениями. В дополнение к этому планируется небольшая инструкция по развертыванию Hadoop [...]]]></description>
			<content:encoded><![CDATA[<p>Если Вы являетесь постоянным читателем моего блога, то вполне вероятно, что Вы помните мой <a href="/net/scalability/hadoop/" target="_blank">старый пост</a> об этом замечательном проекте от <a href="http://apache.org" target="_blank" rel="nofollow">Apache Foundation</a>. С тех пор он развивался невероятными темпами и очень многое успело измениться, об этом я и хотел бы сегодня поделиться своими впечатлениями. В дополнение к этому планируется небольшая инструкция по развертыванию Hadoop на кластере из большого количества машин, который послужит неплохим развитием темы, начатой в посте <a href="/net/scalability/hadoop-dlya-razrabotchika/">&#171;Hadoop для разработчика&#187;</a>.<br />
<span id="more-87"></span></p>
<h3>Что нового?</h3>
<p>Для начала  вкратце напомню что их себя представляет данный продукт, всего в нем три компонента:</p>
<dl>
<dt>HDFS</dt>
<dd>кластерная файловая система.</dd>
<dt>MapReduce framework</dt>
<dd>программная основа для построения приложений, работающих по одноименной модели.</dd>
<dt>HBase</dt>
<dd>нереляционная база данных.</dd>
</dl>
<p>Повторно повторяться смысла не вижу, все уже давно <a href="/net/scalability/hadoop/" target="_blank">разложено по полочкам</a>. Так что сразу перейдем к глобальным изменениям в проекте, произошедшим с написания вышеупомянутого поста, то есть с февраля. Сразу хочу сказать, что подробно пересказывать <a href="http://svn.apache.org/repos/asf/hadoop/core/trunk/CHANGES.txt" rel="nofollow" target="_blank">release notes</a> у меня нет никакого желания, если Вам интересны все подробности о каждом bugfix&#8217;е или изменении в API, то имеет смысл почитать их в оригинале.</p>
<p>Наиболее значительным событием в развитии Apache Hadoop было, пожалуй, отделение <a href="/tag/hbase" target="_blank">HBase</a> в отдельный проект. Какие же это повлекло последствия? С точки зрения простого смертного наиболее заметен тот факт, что HBase пропал из основного архива или репозитория Hadoop и его теперь нужно качать отдельно <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />  На самом же деле такое обособление лишь ускорило ее развитие, совсем недавно HBase отпраздновала свой релиз версии 0.2.0, включающий в себя массу нововведений и исправленных проблем, например язык запросов HQL был полностью заменен на jirb/jython shell, а также было добавлено кэширование данных в памяти. Помимо этого сильно изменилось API, очень рекомендую заглянуть в <a href="http://hadoop.apache.org/hbase/docs/current/api/index.html" rel="nofollow" target="_blank">javadoc</a> проекта, если Вас это интересует.</p>
<p>На уровне файловой системы наиболее значительным изменением стало добавление еще одного типа узлов &#8212; <strong>Secondary NameNode</strong>. Это нововведение является первым шагом на пути к устранению узких мест в системе (так называемых single points of failure). Название этого типа узлов говорит само за себя: они подстраховывают основной <em>NameNode</em> на случай непредвиденных сбоев. Они создают резервную копию образа метаданных файловой системы и лога транзакций (то есть всех операций с файлами и директориями в HDFS) и периодически ее обновляют. Полноценного автоматического восстановления системы они в случае сбоя на сервере с <em>NameNode</em> они на данный момент не обеспечивают, но сохранность данных на случай, скажем, разрушившегося RAID обеспечить могут.</p>
<p>MapReduce framework тоже несомненно развивается и дорабатывается, но каких-либо особо выдающихся изменений в нем не произошло: появляются дополнительные возможности, исправляются ошибки, снимаются те или иные ограничения. В общем все идет своим чередом.</p>
<h3>Поднимаем кластер</h3>
<div style="border: solid 1px #aaaaaa; background: white; padding: 6px;margin:4px;">
<strong align="center">ВНИМАНИЕ!</strong><br /> Перед продолжением чтения этого раздела, настоятельно рекомендуется прочитать <a href="http://www.insight-it.ru/net/scalability/hadoop-dlya-razrabotchika/" target="_blank">статью о запуске псевдо-кластера из одного компьютера</a>.
</div>
<p>Для начала нам понадобится некоторое количество компьютеров (хотя если у Вас серьезные намерения, то лучше все же гордо называть их серверами, а для &#171;побаловаться&#187; сойдут и обычные рабочие станции с <a href="/tag/linux" target="_blank">Linux</a>). Конкретное количество на самом деле роли не играет, продолжать можно как с 2 серверами, так и с 20 тысячами (по крайней мере теоретически). Хотя пару рекомендаций все же могу дать: при использовании в &#171;боевых&#187; условиях стоит стараться избегать физического совмещения мастер-узлов компонентов системы (<em>NameNode, JobTracker, HMaster</em>) с &#171;рядовыми&#187; серверами, таким образом желательно начинать с, как минимум, 5-7 серверов.</p>
<p>Удостоверившись, что на всем оборудовании установлен какой-нибудь дистрибутив <a href="/tag/linux" target="_blank">Linux</a> или <a href="/tag/unix" target="_blank">Unix</a> (любители особо поизвращаться могут попытать счастья с &#171;окнами&#187; в совокупности с Cygwin) и 5 или 6 версия JRE/JDK (желательно от Sun), можно приступать к настройке каждого узла по тому же принципу, что и для псевдо-кластера (да-да, предупреждение в начале раздела было написано не для мебели). Кстати не забудьте, что <a href="/tag/hbase" target="_blank">HBasе</a> теперь нужно скачивать отдельно. О небольших присутствующих особенностях я расскажу чуть позже, а пока дам маленький совет, который позволит несколько облегчить это непростое дело.</p>
<p>Вручную выполнять одни и те же операции на паре десятков/сотен/тысяч серверов мало того что долго, но и чрезвычайно утомительно. Уже на втором-третьем сервере начнет появляться желание каким-либо образом автоматизировать процесс установки. Конечно же можно воспользоваться специализированным программным обеспечением, скажем <a href="http://www.theether.org/gexec/" target="_blank" rel="nofollow">gexec</a>, но есть и более простой способ: существенно упростить жизнь может простой скрипт на bash в 5 строчек:</p>
<pre lang="bash">
#!/bin/bash
for x in `cat ~/nodes`
do
ssh hadoop@$x $1
done
</pre>
<p>В файле <strong>~/nodes</strong> должен располагаться список IP-адресов всех серверов, тогда получив первым параметром произвольную консольную команду скрипт выполнит ее на каждом сервере. С его помощью можно существенно сократить время, требуемое на выполнение всех необходимых действий для запуска кластера.</p>
<p>После небольшого лирического отступления вернемся собственно к <a href="/tag/hadoop" target="_blank">Hadoop</a>. Как Вы уже, надеюсь, знаете, система использует <strong>ssh</strong> для управления всеми компонентами системы, причем очень желателен беспарольный доступ между всеми узлами. Для этого необходимо собрать в один файл все публичные ключи <strong>~/.ssh/id_rsa.pub</strong> на каждом из узлов (по одному на строчку) и разместить его под именем <strong>~/.ssh/authorized_keys</strong> тоже на каждом из узлов. Кстати для упоминавшегося выше скрипта беспарольный доступ тоже очень желателен.</p>
<p>Следующим этапом нужно подготовить конфигурационные файлы, они должны быть идентичными на всех узлах, так что заполнив их все на одном из узлов нужно скопировать их по всем остальным серверам (очень удобно делать это с помощью <strong>rsync</strong>). Теперь пройдемся по необходимым изменениям в каждом из них:</p>
<dl>
<dt><strong>hadoop-site.xml</strong></dt>
<dd>
<pre lang="XML">
<property>
  <name>fs.default.name</name>
  <value>hdfs://namenode:54310</value>
  <description>The name of the default file system.  A URI whose
  scheme and authority determine the FileSystem implementation.  The
  uri's scheme determines the config property (fs.SCHEME.impl) naming
  the FileSystem implementation class.  The uri's authority is used to
  determine the host, port, etc. for a filesystem.</description>
</property>
<property>
  <name>mapred.job.tracker</name>
  <value>jobtracker:54311</value>
  <description>The host and port that the MapReduce job tracker runs
  at.  If "local", then jobs are run in-process as a single map
  and reduce task.
  </description>
</property>
</pre>
<p>Каждый сервер должен знать где расположен <em>NameNode</em>, по-этому он явно указывается в полном пути к файловой системе, практически аналогичная ситуация и с <em>JobTracker</em>. Вместо namenode и jobtracker необходимо указать их IP-адреса или доменные имена (или в крайнем случае &#8212; имя в <strong>/etc/hosts</strong>)
</dd>
<dt><strong>masters</strong></dt>
<dd>
Вопреки логике, здесь указывается список всех <em>SecondaryNameNode</em>. Одного-двух серверов здесь будет вполне достаточно, самое главное не указывать здесь адрес основного <em>NameNode</em>, лучше всего подойдет какой-нибудь другой мастер-сервер, может быть дополненный одним из обычных узлов кластера. Выделять под это отдельный сервер смысла не много, так как нагрузка на них минимальна.
</dd>
<dt><strong>slaves</strong></dt>
<dd>
Список всех рядовых серверов, по одному на строку (опять же: IP или доменное имя). На них будут запущенны <em>DataNode</em> и <em>TaskTracker</em>.
</dd>
<dt><strong>hbase-site.xml</strong></dt>
<dd>
<pre lang="XML">
<property>
     <name>hbase.master</name>
     <value>hmaster:60000</value>
     <description>The host and port that the HBase master runs at</description>
   </property>
<property>
     <name>hbase.rootdir</name>
     <value>hdfs://namenode/hbase</value>
     <description>location of HBase instance in dfs</description>
   </property>
</pre>
<p>Первое изменение достаточно очевидно: <em>HRegionServer</em> должны знать где находится <em>HMaster</em>, о чем им и сообщает первое свойство (заменяем hmaster на соответствующий адрес). А вот второе свойство является следствием &#171;обособления&#187; HBase от Hadoop, о котором шла речь ранее. Теперь имеется возможность использовать их отдельно (с локальной файловой системой вместо HDFS), а так как появился выбор файловой системы &#8212; ее адрес необходимо указывать полностью. В данном случае указан адрес HDFS (такой же как в <strong>hadoop-site.xml</strong>).
</dd>
<dt><strong>regionservers</strong></dt>
<dd>
Вполне очевидный конфигурационный файл, по аналогии со <strong>slaves</strong>, заполняется списком адресов для запуска <em>HRegionServer</em>. Часто совпадает с упомянутым <strong>slaves</strong>, обычно достаточно просто скопировать.
</dd>
</dl>
<p>Удостоверившись, что с конфигурационными файлами все нормально и что они на всех серверах совпадают, можно приступать собственно к запуску. Этот процесс практически полностью совпадает с запуском на одном узле, хотя обычно проще желать это тоже простеньким скриптом примерно такого вида:</p>
<pre lang="bash">
#!/bin/bash
ssh hadoop@namenode ~/hadoop/bin/start-dfs.sh
ssh hadoop@jobtracker ~/hadoop/bin/start-mapred.sh
ssh hadoop@hmaster ~/hbase/bin/start-hbase.sh
</pre>
<p>Если мы нигде не ошиблись и все сделано правильно, то кластер благополучно запустится, что легко проследить выполнив на каждом узле команду <strong>jps</strong> и проверив соответствие запущенных компонентов запланированному (читай: указанному в конфигурационных файлах).</p>
<p>В целом процесс достаточно прост и не занимает много времени, если Вы все же столкнулись с какими-либо проблемами в процессе &#8212; обращайтесь, вполне возможно, что я смогу помочь. Удостовериться, что все нормально можно абсолютно так же, как и для псевдо-кластера &#8212; с помощью MapReduce задач, идущих в комплекте с Hadoop. Выглядеть это может, например, вот так:</p>
<pre lang="bash">
~/hadoop/bin/hadoop jar hadoop-*-examples.jar pi 4 10000
</pre>
<p>По-хорошему надо было бы написать подобную инструкцию сразу после первой, но почему-то как-то не сложилось&#8230;</p>
<h3>Заключение</h3>
<p>На данный момент <a href="/tag/hadoop" target="_blank">Hadoop</a> стал еще более работоспособным, по сравнению с его февральским состоянием. Сообщество использующих его разработчиков растет с каждым днем, а все ошибки и проблемы исправляются очень и очень оперативно, многие коммерческие проекты могут позавидовать таким темпам развития. Хоть до по-настоящему стабильного релиза еще далеко, данный продукт уже сейчас очень активно используется в достаточно большом количестве крупных интернет-проектов.</p>
<p>На закуску небольшой бонус в виде моей небольшой вводной презентации об Apache Hadoop, правда слегка устаревшей (была подготовлена 1 июня 2008г.):</p>
<div style="width:425px;text-align:left;margin:20px 0;" id="__ss_558641"><a style="font:14px Helvetica,Arial,Sans-serif;display:block;margin:12px 0 3px 0;text-decoration:underline;" href="http://www.slideshare.net/m11/apache-hadoop-presentation?src=embed" title="Apache Hadoop">Apache Hadoop</a><object style="margin:0px" width="425" height="355"><param name="movie" value="http://static.slideshare.net/swf/ssplayer2.swf?doc=hadoop-1219003116800762-9&#038;stripped_title=apache-hadoop-presentation" /><param name="allowFullScreen" value="true"/><param name="allowScriptAccess" value="always"/><embed src="http://static.slideshare.net/swf/ssplayer2.swf?doc=hadoop-1219003116800762-9&#038;stripped_title=apache-hadoop-presentation" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="425" height="355"></embed></object</div>
<p>Если Вы еще не успели подписаться на <a href="/feed" target="_blank">RSS</a> &#8212; сейчас самое время!</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/hadoop-vozvrashhaetsya/feed/</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
		<item>
		<title>Hypertable</title>
		<link>http://www.insight-it.ru/masshtabiruemost/hypertable/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/hypertable/#comments</comments>
		<pubDate>Sat, 05 Apr 2008 17:27:01 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[C++]]></category>
		<category><![CDATA[GPL]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[HDFS]]></category>
		<category><![CDATA[HQL]]></category>
		<category><![CDATA[Hypertable]]></category>
		<category><![CDATA[KFS]]></category>
		<category><![CDATA[opensource]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/scalability/hypertable/</guid>
		<description><![CDATA[Hypertable является еще одним opensource проектом, направленным на воспроизведение функционала BigTable от Google. Поставленная перед проектом цель заключается в реализации системы хранения данных на базе распределенной файловой системы, позволяющей перейти на новый уровень производительности при работе с гигантскими объемами данных. Принцип работы Hypertable прост до безобразия: Hypertable хранит данные в табличном формате, сортируя записи по [...]]]></description>
			<content:encoded><![CDATA[<p><img src="/wp-content/uploads/hypertable-logo.gif" style="float: right; margin: 5px;" alt="Hypertable" title="Hypertable" /><br />
<a href="http://www.hypertable.org" target="_blank" rel="nofollow">Hypertable</a> является еще одним opensource проектом, направленным на воспроизведение функционала <a href="/tag/bigtable" target="_blank">BigTable</a> от <a href="/tag/google" target="_blank">Google</a>. Поставленная перед проектом цель заключается в реализации системы хранения данных на базе распределенной файловой системы, позволяющей перейти на новый уровень производительности при работе с гигантскими объемами данных.<br />
<span id="more-63"></span><br />
Принцип работы <a href="/tag/hypertable" target="_blank">Hypertable</a> прост до безобразия:</p>
<ul>
<li>Hypertable хранит данные в табличном формате, сортируя записи по основному ключу;</li>
<li>для хранимых данных не используются какие-либо типы данных, любая ячейка интерпретируется как байтовая строка;</li>
<li>масштабируемость достигается путем разбиения таблиц на смежные интервалы строк и хранения их на разных физических машинах;</li>
<li>в системе используется два типа серверов:
<dl>
<dt><strong>Master Server</strong></dt>
<dd>&ndash; как и во многих других подобных системах мастер-сервер выполняет обязанности скорее административного характера: он управляет работой Range серверов, работает с метаданными (которые хранятся просто в отдельной таблице, наравне с остальными).</dd>
<dt><strong>Range Server</strong></dt>
<dd>&ndash; их задача стоит в собственно в хранении диапазонов строк из различных таблиц. Каждый сервер может хранить несколько несмежных диапазонов строк, если диапазон превышает по объему определенный лимит (по-умолчанию &#8212; 200 MB), то он разбивается на пополам и одна половина обычно перемещяется на другой сервер. Если же на одном из серверов подходит к концу дисковое пространство, то под руководством мастер-сервера часть диапазонов с него перераспределяется на менее загруженные Range серверы.</dd>
</dl>
</li>
<li>Еще одним компонентом системы является Hyperspace, этот сервер предоставляет указатель на основную таблицу с метаданными, а также пространство имен. Помимо этого этот сервис выступает в роли lock-механизма для клиентов системы.</li>
</ul>
<p>В качестве основы для этой системы может использоваться как входящая в состав <a href="/tag/hadoop" target="_blank">Hadoop</a> файловая система <a href="/tag/hdfs" target="_blank">HDFS</a>, так и <a href="/tag/kfs" target="_blank">KosmosFS</a>, о которой я недавно <a href="/net/scalability/fajjly-v-kosmose/" target="_blank">рассказывал</a>. Это позволяет Hypertable выступать в роли конкурента для <a href="/tag/hbase" target="_blank">HBase</a> в рамках проекта <a href="/tag/hadoop" target="_blank">Hadoop</a>.</p>
<p>HBase и Hypertable выполняют достаточно похожие функции и преследуют практически одни и те же цели, но есть некоторые ньюансы. Одним из глобальных различий в этих системах является языки программирования, с использованием которого они реализованы. HBase написана на <a href="/tag/java" target="_blank">Java</a>, в то время как разработчики Hypertable предпочли <a href="/tag/c" target="_blank">C++</a>. Это повлекло за собой массу различий в инкапсулированной реализации различных операций.</p>
<p>Для доступа к данным каждая из систем использует язык HQL, только в одном случае аббревиатура расшифровывается как HBase Query Language, а в другом &#8212; Hypertable Query Language (как эгоистично <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />  ). По сути и то и другое является сильно упрощенным диалектом <a href="/tag/sql" target="_blank">SQL</a>, что позволяет сократить знакомство с синтаксисом HQL до пары минут при достаточном знании классического SQL. Хотелось бы отметить, что вся простота в сравнении с классическим SQL и реляционными СУБД вполне обоснована: обе системы хранения данных предназначены для использования в совокупности с <a href="/tag/mapreduce" target="_blank">MapReduce</a> программами, что делает их просто хранилищем данных, а не средством их обработки.</p>
<p>После небольшого лирического отступления в виде сравнения с HBase хотелось бы все же вернуться к теме нашего разговора, а именно к организации хранения данных в Hypertable. Данные хранятся в виде пар ключ:значение, причем храняться все версии строк с указанием времени, когда они были созданы. Таким образом легко проследить за процессом изменения данных во времени, а также узнать какие именно операции проводились над ними в прошлом. Стандартный механизм работы с версиями данных может быть переопределен на хранения лишь фиксированного количества версий строки, позволяя использовать удаление устаревших записей для освобождения дополнительного дискового пространства.</p>
<p>Для более эффективной работы с обновлением случайных ячеек таблиц используется кэширование. Поступающие данные собираются в оперативной памяти и при достижении определенного лимита сжимаются и записываются на диск.</p>
<p>Для более эффективной работы с распределенной файловой системой используется механизм под названием <em>Access Groups</em>. Суть заключается в объединении колонок таблиц в группы, в которых они чаще всего используется вместе. Такие группы данных по возможности храняться вместе на физических носителях. Если запрос включает в себя только данные из колонок одной группы доступа, то с дисков считывается только эти колонки, в противном случае приходиться работать со всей строкой целиком. Такой подход позволяет существенно оптимизировать работу операций ввода/вывода.</p>
<p>Проект еще находится в стадии разработки и до стабильного релиза ему еще далеко, но тем не менее он уже вполне может себя показать в качестве конкурента как для других систем подобного класса, так и для более стандартных реляционных баз данных. Основными недостающими моментами в этой системе в данной системе является отсутствие некоторого порой необходимого функционала в HQL, а такжы некоторые проблемы с отказоустойчивостью, вызванные единственностью в рамках системы Master и Hyperspace серверов.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/hypertable/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Файлы в космосе</title>
		<link>http://www.insight-it.ru/masshtabiruemost/fajjly-v-kosmose/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/fajjly-v-kosmose/#comments</comments>
		<pubDate>Sun, 30 Mar 2008 20:06:51 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[C++]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[KFS]]></category>
		<category><![CDATA[Kosmos Distributed File System]]></category>
		<category><![CDATA[кластер]]></category>
		<category><![CDATA[файловая система]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/scalability/fajjly-v-kosmose/</guid>
		<description><![CDATA[&#8230;или Kosmos Distributed File System Сегодня речь пойдет об еще одной распределенной файловой системе &#8212; KosmosFS. У русских людей название этого проекта определенно вызывает ассоциации с космосом, но изначально все же свою лепту в него внес изначальный разработчик &#8212; Kosmix. По большому счету KFS мало чем выделяется из множества своих конкурентов, по своей структуре она [...]]]></description>
			<content:encoded><![CDATA[<h3 align="right">&#8230;или Kosmos Distributed File System</h3>
<p><img style="float: right; margin: 15px;" src="/wp-content/uploads/KFS.jpg" alt="Kosmos Distributed File System" title="KosmosFS Logo" /><br />
Сегодня речь пойдет об еще одной распределенной файловой системе &#8212; <a href="http://kosmosfs.sourceforge.net/" target="_blank" rel="nofollow">KosmosFS</a>. У русских людей название этого проекта определенно вызывает ассоциации с космосом, но изначально все же свою лепту в него внес изначальный разработчик &#8212; <a href="http://www.kosmix.com/" target="_blank" rel="nofollow">Kosmix</a>.<br />
<span id="more-60"></span><br />
По большому счету <a href="/tag/kfs" target="_blank">KFS</a> мало чем выделяется из множества своих конкурентов, по своей структуре она состоит из сервера метаданных и серверов блоков, доступ к системе производится средствами клиентской библиотеки, предоставляющей соответствующий API. Список возможностей файловой системы также вполне стандартен:</p>
<ul>
<li><em>Инкрементальная масштабируемость.</em> При добавлении дополнительных узлов в кластер, система сама адаптируется для вовлечения их в полноценную работу.</li>
<li><em>Стабильный доступ.</em> Реплицируемость данных (по-умолчанию в трех экземплярах) позволяет гарантировать доступность данных вне зависимости от сбоев в работе отдельных узлов.</li>
<li><em>Балансировка блоков данных.</em> Периодически сервер метаданных перераспределяет данные с целью более оптимального использования дискового пространства.</li>
<li><em>Целостность данных.</em> Для обеспечения целостности данных вычисляются и сравниваются контрольные суммы блоков данных.</li>
<li><em>Кэширование.</em> Для увеличения производительности используется кэширования на уровне клиентской библиотеки.</li>
<li><em>Прозрачная работа с недоступными узлами.</em> Клиентская библиотека прозрачно для приложения переключается на альтернативный сервер с данными, если обнаруживает что один из них недоступен.</li>
<li><em>Поддержка языков программирования:</em> <a href="/tag/c" target="_blank">C++</a>, <a href="/tag/java" target="_blank">Java</a>, <a href="/tag/python" target="_blank">Python</a>.</li>
<li><em>Скрипты.</em> С системой предоставляется набор скриптов для развертывания, запуска и остановки узлов.</li>
</ul>
<p>Но написать этот пост меня подтолкнул вовсе не этот список. В комментариях к <a href="http://www.insight-it.ru/net/scalability/hadoop/#comments" target="_blank">одной из предыдущих моих записей</a> читатели подняли тему о целесообразности использования <a href="/tag/java" target="_blank">Java</a> для реализации <a href="/tag/hdfs" target="_blank">HDFS</a> в частности и <a href="/tag/hadoop" target="_blank">Hadoop</a> в целом. В качестве альтернативы был предложен <a href="/tag/c" target="_blank">C++</a> (только на словах конечно же), аргументируя это тем, что такая реализация была бы эффективнее. <a href="/tag/kfs" target="_blank">KFS</a> же как раз и является той самой альтернативой <a href="/tag/hdfs" target="_blank">HDFS</a>, написанной на <a href="/tag/c" target="_blank">C++</a>. <a href="/tag/kfs" target="_blank">KFS</a> тесно интегрируется с <a href="/tag/hadoop" target="_blank">Hadoop</a> с помощью его интерфейсов для файловой системы. Это позволяет Hadoop-приложениям незаметно работать с <a href="/tag/kfs" target="_blank">KFS</a> точно так же, как если бы на ее месте была бы <a href="/tag/hdfs" target="_blank">HDFS</a>. Код для интеграции с Hadoop был выпущен в виде патча к Hadoop-JIRA-1963, а начиная с Hadoop версии 0.15 этот код входит в стандартный дистрибутив, ровно как и детальная инструкция по интеграции.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/fajjly-v-kosmose/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Hadoop для разработчика</title>
		<link>http://www.insight-it.ru/masshtabiruemost/hadoop-dlya-razrabotchika/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/hadoop-dlya-razrabotchika/#comments</comments>
		<pubDate>Mon, 25 Feb 2008 21:15:51 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[gentoo linux]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[HBase]]></category>
		<category><![CDATA[HDFS]]></category>
		<category><![CDATA[MapReduce]]></category>
		<category><![CDATA[ПО]]></category>
		<category><![CDATA[развертывание]]></category>
		<category><![CDATA[разработка]]></category>
		<category><![CDATA[установка]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/scalability/hadoop-dlya-razrabotchika/</guid>
		<description><![CDATA[Для разработки приложений, работающих с использованием Hadoop, или же алгоритмов для MapReduce framework&#8217;а совсем не нужен полномасштабный кластер. На самом же деле для запуска всей системы, описанной мной в одном из предыдущих постов, вполне достаточно одного компьютера и буквально минут 15 свободного времени, как потратить их для решения этой задачи я Вам и поведаю. Рассказывать [...]]]></description>
			<content:encoded><![CDATA[<p>Для разработки приложений, работающих с использованием Hadoop, или же алгоритмов для MapReduce framework&#8217;а совсем не нужен полномасштабный кластер. На самом же деле для запуска всей системы, описанной мной в <a href="/net/scalability/hadoop/" target="_blank">одном из предыдущих постов</a>, вполне достаточно одного компьютера и буквально минут 15 свободного времени, как потратить их для решения этой задачи я Вам и поведаю.<br />
<span id="more-49"></span><br />
Рассказывать я буду на примере своего <a href="/tag/gentoo-linux" target="_blank">Gentoo Linux</a>, но большая часть этого повествования будет справедлива и для других unix-like операционных систем.</p>
<h3>Подготовка</h3>
<p>Перед тем, как приступить собственно говоря к установке <a href="http://hadoop.apache.org/core/" target="_blank" rel="nofollow">Hadoop</a>, необходимо выполнить два элементарных действия, необходимых для правильного функционирования системы:</p>
<ul>
<li>открыть доступ одному из пользователей по <strong>ssh</strong> к этому же компьютеру без пароля, можно например создать отдельного пользователя для этого [hadoop]:
<pre lang="bash">
useradd -m -n hadoop
</pre>
<p>Далее действия выполняем от его имени:</p>
<pre lang="bash">
su hadoop
</pre>
<p>Генерируем RSA-ключ для обеспечения аутентификации в условиях отсутствия возможности использовать пароль:</p>
<pre>
hadoop@localhost ~ $ ssh-keygen -t rsa -P ""
Generating public/private rsa key pair.
Enter file in which to save the key (/home/hadoop/.ssh/id_rsa):
Your identification has been saved in /home/hadoop/.ssh/id_rsa.
Your public key has been saved in /home/hadoop/.ssh/id_rsa.pub.
The key fingerprint is:
7b:5c:cf:79:6b:93:d6:d6:8d:41:e3:a6:9d:04:f9:85 hadoop@localhost
</pre>
<p>И добавляем его в список авторизованных ключей:</p>
<pre lang="bash">
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
</pre>
<p>Этого должно быть более чем достаточно, проверить работоспособность соединения можно просто написав:</p>
<pre lang="bash">
ssh localhost
</pre>
<p>Не забываем предварительно инициализировать <strong>sshd</strong>:</p>
<pre lang="bash">
/etc/init.d/sshd start
</pre>
</li>
<li>Помимо этого необходимо убедиться в наличии установленной JVM версии 1.5.0 или выше, а также узнать директорию, где она располагается, вариантов сделать это множество, я нашел ее просто заглянув в самое логичное место &#8212; <strong>/usr/lib</strong>, но при желании никто не может Вам помешать воспользоваться услугами, например, <strong>slocate</strong>. Найденную директорию с JVM лучше запомнить или записать куда-нибудь, для меня она оказалась:
<pre lang="bash">
/usr/lib/jvm/sun-jdk-1.6
</pre>
</li>
</ul>
<h3>Установка</h3>
<p>Установка начинается с получения копии исходного кода системы, способов для этого существует несколько. Я перепробовал практически все, самую адекватную версию мне удалось получить из SVN. Для ее получения необходимо выполнить следующую команду:</p>
<pre lang="bash">
svn checkout http://svn.apache.org/repos/asf/hadoop/core/branches/branch-0.16 ~
</pre>
<p><strong>branch-0.16</strong> &#8212; последняя доступная версия на данный момент, для определения ее номера достаточно заглянуть <a href="http://svn.apache.org/repos/asf/hadoop/core/branches/" target="_blank" rel="nofollow">по тому же адресу</a> браузером. Предполагается, что Hadoop будет располагаться прямо в <strong>/home/hadoop</strong>, но запросто можно использовать и другую директорию.</p>
<p>Сразу же стоит скомпилировать различные дополнительные компоненты системы, особенно это актуально из-за <a href="/tag/hbase" target="_blank">HBase</a>, но и помимо него соберется много чего интересного, например plug-in для отличной IDE под названием <strong><a href="http://www.eclipse.org" target="_blank" rel="nofollow">Eclipse</a></strong> или <a href="http://hadoop.apache.org/core/docs/r0.16.0/hod.html" target="_blank" rel="nofollow">Hadoop On Demand</a>. Задача также элементарна:</p>
<pre lang="bash">
cd ~
ant clean jar compile-contrib
</pre>
<h3>Настройка</h3>
<p>Конфигурационные файлы можно редактировать в произвольном порядке, самое главное ничего не забыть <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<ul>
<li><strong>conf/hadoop-env.sh</strong>
<pre>
# The java implementation to use.  Required.
export JAVA_HOME=/usr/lib/jvm/sun-jdk-1.6
</pre>
<p>Единственная обязательная переменная окружения &#8212; <strong>JAVA_HOME</strong>, здесь как раз пригодится заранее найденный путь до JVM, все остальное &#8212; по желанию.
</li>
<li><strong>conf/hadoop-site.xml</strong>
<pre lang="xml"><?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
<property>
  <name>hadoop.tmp.dir</name>
  <value>/home/hadoop/data/${user.name}</value>
  <description>A base for other temporary directories.</description>
</property>
<property>
  <name>fs.default.name</name>
  <value>hdfs://localhost:54310</value>
  <description>The name of the default file system.  A URI whose
  scheme and authority determine the FileSystem implementation.  The
  uri's scheme determines the config property (fs.SCHEME.impl) naming
  the FileSystem implementation class.  The uri's authority is used to
  determine the host, port, etc. for a filesystem.</description>
</property>
<property>
  <name>mapred.job.tracker</name>
  <value>localhost:54311</value>
  <description>The host and port that the MapReduce job tracker runs
  at.  If "local", then jobs are run in-process as a single map
  and reduce task.
  </description>
</property>
<property>
  <name>dfs.replication</name>
  <value>1</value>
  <description>Default block replication.
  The actual number of replications can be specified when the file is created.
  The default is used if replication is not specified in create time.
  </description>
</property>

</configuration>
</pre>
<p>Этот конфигурации файл является одним из ключевых, таким образом он выглядит для конфигурации, состоящей из одного компьютера (позаимствован из <a href="http://www.michael-noll.com/wiki/Running_Hadoop_On_Ubuntu_Linux_%28Single-Node_Cluster%29" target="_blank" rel="nofollow">англоязычного мануала</a> на ту же тему).
</li>
<li><strong>src/contrib/hbase/conf/hbase-site.xml</strong>
<pre lang="xml">
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
     <name>hbase.master</name>
     <value>localhost:60000</value>
     <description>The host and port that the HBase master runs at</description>
   </property>
<property>
     <name>hbase.rootdir</name>
     <value>/hbase</value>
     <description>location of HBase instance in dfs</description>
   </property>
</configuration>
</pre>
<p>Как не сложно заметить, этот файл необходим для функционирования <strong>HBase</strong>, по-моему все просто и очевидно, &lt;description&gt; говорят сами за себя.
</li>
</ul>
<h3>Запуск</h3>
<p>Начать стоит с ознакомления с кратким описанием доступных команд Hadoop, сделать это можно просто набрав <strong>~/bin/hadoop</strong>:</p>
<pre>
Usage: hadoop [--config confdir] COMMAND
where COMMAND is one of:
  namenode -format     format the DFS filesystem
  secondarynamenode    run the DFS secondary namenode
  namenode             run the DFS namenode
  datanode             run a DFS datanode
  dfsadmin             run a DFS admin client
  fsck                 run a DFS filesystem checking utility
  fs                   run a generic filesystem user client
  balancer             run a cluster balancing utility
  jobtracker           run the MapReduce job Tracker node
  pipes                run a Pipes job
  tasktracker          run a MapReduce task Tracker node
  job                  manipulate MapReduce jobs
  version              print the version
  jar <jar>            run a jar file
  distcp <srcurl> <desturl> copy file or directories recursively
  daemonlog            get/set the log level for each daemon
 or
  CLASSNAME            run the class named CLASSNAME
Most commands print help when invoked w/o parameters.
</pre>
<p>Первым делом необходимо отформатировать <em>Namenode</em>:</p>
<pre lang="bash">
~/bin/hadoop namenode -format
</pre>
<p>И дело останется лишь за малым, запустить на выполнение пару bash-скриптов, которые без вашего дальнейшего участия <em>инициализируют</em> всю систему, включая HBase:</p>
<pre>
~/bin/hadoop/start-all.sh &#038;&#038; ~/src/contrib/hbase/bin/start-hbase.sh
</pre>
<p>Как только они закончат все необходимые действия, у Вас появится возможность удостовериться, что все в порядке. Самым простым способом является запуск клиента <em>Hbase Shell</em>:</p>
<pre lang="bash">
~/bin/src/contrib/hbase/bin/hbase shell
</pre>
<p>Если в ответ Вы получили соответствующее приглашение клиента, значит все было сделано верно!</p>
<p>Вот собственно говоря и все, псевдо-кластер функционирует, доступ к HBase имеется, можно приступать к разработке <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p><strong>P.S.:</strong> Остановка системы производится по тому же принципу скриптами <strong>stop-all.sh</strong> и <strong>stop-hbase.sh</strong>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/hadoop-dlya-razrabotchika/feed/</wfw:commentRss>
		<slash:comments>21</slash:comments>
		</item>
		<item>
		<title>Hadoop</title>
		<link>http://www.insight-it.ru/masshtabiruemost/hadoop/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/hadoop/#comments</comments>
		<pubDate>Fri, 22 Feb 2008 19:41:32 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[HBase]]></category>
		<category><![CDATA[HDFS]]></category>
		<category><![CDATA[Java]]></category>
		<category><![CDATA[MapReduce]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[информационные технологии]]></category>
		<category><![CDATA[кластер]]></category>
		<category><![CDATA[распределенные вычисления]]></category>
		<category><![CDATA[технология]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/scalability/hadoop/</guid>
		<description><![CDATA[Hadoop представляет собой платформу для построения приложений, способных обрабатывать огромные объемы данных. Система основывается на распределенном подходе к вычислениям и хранению информации, основными ее особенностями являются: Масштабируемость: с помощью Hadoop возможно надежное хранение и обработка огромных объемов данных, которые могут измеряться петабайтами; Экономичность: информация и вычисления распределяются по кластеру, построенному на самом обыкновенном оборудовании. Такой [...]]]></description>
			<content:encoded><![CDATA[<p><img src="/wp-content/uploads/hadoop-logo.jpg" title="Hadoop" alt="Hadoop Logo" style="float:right; margin: 7px 0 0 10px;"/><br />
<a href="http://hadoop.apache.org/core/" rel="nofollow" target="_blank">Hadoop</a> представляет собой платформу для построения приложений, способных обрабатывать огромные объемы данных. Система основывается на распределенном подходе к вычислениям и хранению информации, основными ее особенностями являются:</p>
<ul>
<li><strong>Масштабируемость:</strong> с помощью <a href="/tag/hadoop" target="_blank">Hadoop</a> возможно надежное хранение и обработка огромных объемов данных, которые могут измеряться петабайтами;</li>
<li><strong>Экономичность:</strong> информация и вычисления распределяются по <a href="/tag/klaster" target="_blank">кластеру</a>, построенному на самом обыкновенном оборудовании. Такой кластер может состоять из тысяч узлов;</li>
<li><strong>Эффективность:</strong> распределение данных позволяет выполнять их обработку параллельно на множестве компьютеров, что существенно ускоряет этот процесс;</li>
<li><strong>Надежность:</strong> при хранении данных возможно предоставление избыточности, благодаря хранению нескольких копий. Такой подход позволяет гарантировать отсутствие потерь информации в случае сбоев в работе системы;</li>
<li><strong>Кроссплатформенность:</strong> так как основным языком программирования, используемым в этой системе является <a href="/tag/java">Java</a>, развернуть ее можно на базе любой операционной системы, имеющей <acronym title="Java Virtual Machine">JVM</acronym>.</li>
</ul>
<p><span id="more-47"></span></p>
<h3>HDFS</h3>
<p>В основе всей системы лежит распределенная файловая система под незамысловатым названием <strong>Hadoop Distributed File System</strong>. Представляет она собой вполне стандартную распределенную файловую систему, но все же она обладает рядом особенностей:</p>
<ul>
<li>Устойчивость к сбоям, разработчики рассматривали сбои в оборудовании скорее как норму, чем как исключение;</li>
<li>Приспособленность к развертке на самом обыкновенном ненадежном оборудовании;</li>
<li>Предоставление высокоскоростного потокового доступа ко всем данным;</li>
<li>Настроена для работы с большими файлами и наборами файлов;</li>
<li>Простая модель работы с данными: <em>один раз записали &#8212; много раз прочли</em>;</li>
<li>Следование принципу: <em>переместить вычисления проще, чем переместить данные</em>;</li>
</ul>
<h4>Архитектура HDFS</h4>
<p>Проще всего ее демонстрирует схема, <a  href="http://hadoop.apache.org/core/docs/current/images/hdfsarchitecture.gif" target="_blank" rel="nofollow">позаимствованная</a> с официального сайта проекта и переведенная мной на руский:<br />
<img src="/wp-content/uploads/hdfsarchitecture.jpg" title="Архитектура HDFS" alt="Архитектура HDFS" /></p>
<p>Действующие лица:</p>
<dl>
<dt><strong>Namenode</strong></dt>
<dd>Этот компонент системы осуществляет всю работу с метаданными. Он должен быть запущен только на одном компьютере в кластере. Именно он управляет размещением информации и доступом ко всем данным, расположенным на ресурсах кластера. Сами данные проходят с остальных машин кластера к клиенту мимо него.</dd>
<dt><strong>Datanode</strong></dt>
<dd>На всех остальных компьютерах системы работает именно этот компонент. Он располагает сами блоки данных в локальной файловой системе для последующей передачи или обработки их по запросу клиента. Группы узлов данных принято называть Rack, они используются, например, в схемах репликации данных.</dd>
<dt><strong>Клиент</strong></dt>
<dd>Просто приложение или пользователь, работающий с файловой системой. В его роли может выступать практически что угодно.</dd>
</dl>
<p>Пространство имен <a href="/tag/hdfs" target="_blank">HDFS</a> имеет классическую иерархическую структуру: пользователи и приложения имеют возможность создавать директории и файлы. Файлы хранятся в виде блоков данных произвольной (но одинаковой, за исключением последнего; по-умолчанию 64  mb) длины, размещенных на <strong>Datanode</strong>&#8216;ах. Для обеспечения отказоустойчивости блоки хранятся в нескольких экземплярах на разных узлах, имеется возможность настройки количества копий и алгоритма их распределения по системе. Удаление файлов происходит не сразу, а через какое-то время после соответствующего запроса, так как после получения запроса файл перемещается в директорию <b>/trash</b> и хранится там определенный период времени на случай если пользователь или приложение передумают о своем решении. В этом случае информацию можно будет восстановить, в противном случае &#8212; физически удалить.</p>
<p>Для обнаружения возникновения каких-либо неисправностей, <strong>Datanode</strong> периодически отправляют <strong>Namenode</strong>&#8216;у сигналы о своей работоспособности. При прекращении получения таких сигналов от одного из узлов <strong>Namenode</strong> помечает его как <em>&#171;мертвый&#187;</em>, и прекращает какой-либо с ним взаимодействие до возвращения его работоспособности. Данные, хранившиеся на <em>&#171;умершем&#187;</em> узле реплицируются дополнительный раз из оставшихся <em>&#171;в живых&#187;</em> копий и система продолжает свое функционирование как ни в чем не бывало.</p>
<p>Все коммуникации между компонентами файловой системы проходят по специальным протоколам, основывающимся на стандартном <strong>TCP/IP</strong>. Клиенты работают с <strong>Namenode</strong> с помощью так называемого <strong>ClientProtocol</strong>, а передача данных происходит по <strong>DatanodeProtocol</strong>, оба они <em>обернуты</em> в <strong>Remote Procedure Call (RPC)</strong>.</p>
<p>Система предоставляет несколько интерфейсов, среди которых командная оболочка <strong>DFSShell</strong>, набор ПО для администрирования <strong>DFSAdmin</strong>, а также простой, но эффективный веб-интерфейс. Помимо этого существуют несколько API для языков программирования: Java API, C pipeline, WebDAV и так далее.</p>
<h3>MapReduce</h3>
<p>Помимо файловой системы, <a href="/tag/hadoop" target="_blank">Hadoop</a> включает в себя framework для проведения масштабных вычислений, обрабатывающих огромные объемы данных. Каждое такое вычисление называется Job (задание) и состоит оно, как видно из названия, из двух этапов:</p>
<dl>
<dt><strong>Map</strong></dt>
<dd>Целью этого этапа является представление произвольных данных (на практике чаще всего просто пары ключ-значение) в виде промежуточных пар ключ-значение. Результаты сортируются и групируются по ключу и передаются на следующий этап.</dd>
<dt><strong>Reduce</strong></dt>
<dd>Полученные после <strong>map</strong> значения используются для финального вычисления требуемых данных. Практические любые данные могут быть получены таким образом, все зависит от требований и функционала приложения.</dd>
</dl>
<p>Задания выполняются, подобно файловой системе, на всех машинах в кластере (чаще всего одних и тех же). Одна из них выполняет роль управления работой остальных &#8212; <strong>JobTracker</strong>, остальные же ее бесприкословно слушаются &#8212; <strong>TaskTracker</strong>. В задачи <strong>JobTracker</strong>&#8216;а входит составление расписания выполняемых работ, наблюдение за ходом выполнения, и перераспределение в случае возникновения сбоев.</p>
<p>В общем случае каждое приложение, работающее с этим framework&#8217;ом, предоставляет методы для осуществления этапов <strong>map</strong> и <strong>reduce</strong>, а также указывает расположения входных и выходных данных. После получения этих данных <strong>JobTracker</strong> распределяет задание между остальными машинами и предоставляет клиенту полную информацию о ходе работ.</p>
<p>Помимо основных вычислений могут выполняться вспомогательные процессы, такие как составление отчетов о ходе работы, кэширование, сортировка и так далее.</p>
<h3>HBase</h3>
<p><img src="/wp-content/uploads/hbase-logo.gif" alt="HBase Logo" title="HBase" style="float:right; margin: 24px 4px 4px 4px;" /><br />
В рамках <a href="/tag/hadoop" target="_blank">Hadoop</a> доступна еще и система хранения данных, которую правда сложно назвать <a href="/tag/subd" target="_blank">СУБД</a> в традиционном смысле этого слова. Чаще проводят аналогии с проприетарной системой этого же плана от <a href="/tag/google">Google</a> &#8212; <a href="/tag/bigtable" target="_blank">BigTable</a>.</p>
<p><a href="http://hadoop.apache.org/hbase" target="_blank" rel="nofollow">HBase</a> представляет собой распределенную систему хранения больших объемов данных.  Подобно реляционным СУБД данные хранятся в виде таблиц, состоящих из строк и столбцов. И даже для доступа к ним предоставляется язык запросов <strong>HQL</strong> (как ни странно &#8212; <strong>Hadoop Query Language</strong>), отдаленно напоминающий более распространенный <a href="/tag/sql" target="_blank">SQL</a>. Помимо этого предоставляется итерирующмй интерфейс для сканирования наборов строк.</p>
<p>Одной из основных особенностей хранения данных в <strong>HBase</strong> является возможность наличия нескольких значений, соответствующих одной комбинации таблица-строка-столбец, для их различения используется информация о времени добавления записи. На концептуальном уровне таблицы обычно представляют как набор строк, но физически же они хранятся по столбцам, достаточно важный факт, который стоит учитывать при разработки схемы хранения данных. Пустые ячейки не отображаются каким-либо образом физически в хранимых данных, они просто отсутствуют. Существуют конечно и другие нюансы, но я постарался упомянуть лишь основные.</p>
<p><strong>HQL</strong> очень прост по своей сути, если Вы уже знаете <a href="/tag/sql" target="_blank">SQL</a>, то для изучения его Вам понадобится лишь просмотреть по диагонали коротенький вывод команды <b>help;</b>, занимающий всего пару экранов в консоли. Все те же <strong>SELECT</strong>, <strong>INSERT</strong>, <strong>UPDATE</strong>, <strong>DROP</strong> и так далее, лишь со слегка измененным синтаксисом.</p>
<p>Помимо обычно командной оболочки <strong>HBase Shell</strong>, для работы с <strong>HBase</strong> также предоставлено несколько API для различных языков программирования: <a href="http://hadoop.apache.org/hbase/docs/current/api/index.html" target="_blank" rel="nofollow">Java</a>, <a href="http://wiki.apache.org/hadoop/Hbase/Jython" target="_blank" rel="nofollow">Jython</a>, <a href="http://wiki.apache.org/hadoop/Hbase/HbaseRest" target="_blank" rel="nofollow">REST</a> и <a href="http://wiki.apache.org/hadoop/Hbase/ThriftApi" target="_blank" rel="nofollow">Thrift</a>.</p>
<h3>Заключение</h3>
<p><a href="/tag/hadoop" target="_blank">Hadoop</a> является отличным решением для построения высоконагруженных приложений, которое уже активно используется <a href="http://wiki.apache.org/hadoop/PoweredBy" target="_blank" rel="nofollow">множеством интернет-проектов</a>. В последующих постах на эту тему я постараюсь описать процесс развертывания этой системы и написания приложений, работающих по принципу <a href="/tag/mapreduce">MapReduce</a>. Не пропустить момент их публикации Вам может помочь подписка на <a href="/feed" target="_blank">RSS-ленту</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/hadoop/feed/</wfw:commentRss>
		<slash:comments>13</slash:comments>
		</item>
	</channel>
</rss>

