<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Insight IT &#187; MySQL</title>
	<atom:link href="http://www.insight-it.ru/tag/mysql/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.insight-it.ru</link>
	<description>Информационные технологии</description>
	<lastBuildDate>Tue, 31 Jan 2012 09:34:08 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Архитектура Dropbox</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-dropbox/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-dropbox/#comments</comments>
		<pubDate>Fri, 18 Mar 2011 15:57:55 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[ctypes]]></category>
		<category><![CDATA[Dropbox]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[py2app]]></category>
		<category><![CDATA[py2exe]]></category>
		<category><![CDATA[PyObjC]]></category>
		<category><![CDATA[PyWin32]]></category>
		<category><![CDATA[Twisted]]></category>
		<category><![CDATA[wxPython]]></category>
		<category><![CDATA[Архитектура Dropbox]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=1017</guid>
		<description><![CDATA[Совсем недавно я написал практически совсем не технический пост про Dropbox, а тут совершенно случайно наткнулся-таки на техническое выступление их сотрудника на PyCon 2011, которая прошла меньше недели назад. Как не трудно догадаться, залогом успеха Dropbox с технической точки зрения оказался Python. Как же Python оказался в сердце бизнес-модели Dropbox? Dropbox &#8212; это самый простой [...]]]></description>
			<content:encoded><![CDATA[<p><img class="alignnone size-full wp-image-1018" style="float: left; margin: 2em 1em;" title="Dropbox Logo" src="http://www.insight-it.ru/wp-content/uploads/2011/03/logo.png" alt="Dropbox" width="231" height="60" />Совсем недавно я написал практически совсем не технический пост <a href="/masshtabiruemost/dropbox/" target="_blank">про Dropbox</a>, а тут совершенно случайно наткнулся-таки на техническое выступление их сотрудника на PyCon 2011, которая прошла меньше недели назад. Как не трудно догадаться, залогом успеха Dropbox с технической точки зрения оказался <a href="/tag/python/" target="_blank">Python</a>. Как же Python оказался в сердце бизнес-модели Dropbox? <span id="more-1017"></span> <strong><a href="http://db.tt/4TDAr1L" target="_blank"></a></strong></p>
<h2><strong><a href="http://db.tt/4TDAr1L" target="_blank">Dropbox</a> &#8212; это самый простой способ&#8230;</strong></h2>
<ul>
<li>Хранить файлы в безопасном месте</li>
<li>Делиться файлами с другими людьми</li>
<li>Постоянно иметь к ним доступ вне зависимости от своего месторасположения</li>
</ul>
<h2><strong>Взрывной рост</strong></h2>
<ul>
<li>1 миллион файлов сохраняются в Dropbox каждые 15 минут (по презентации это больше, чем твитов в Twitter за тот же период времени, но это <a href="http://www.insight-it.ru/masshtabiruemost/arkhitektura-twitter-dva-goda-spustya/" target="_blank">несколько преувеличено</a>)</li>
<li>Одно из самых скачиваемых приложений, уступает лишь Skype</li>
<li>Важная часть жизни многих пользователей: &#171;не могу жить без этого&#187;</li>
<li>Рост обеспечен &#171;сарафанным радио&#187;, практически без рекламы</li>
</ul>
<h2>Команда в начале проекта</h2>
<ul>
<li>Все хорошие друзья</li>
<li>Самые умные, голодные и страстные, которых они знали <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </li>
<li>Для каждого это была первая реальная работа, очень ограниченный опыт в данной индустрии</li>
<li>Эти качества хорошо сочетаются с итеративной методологией разработки на Python</li>
</ul>
<h2>Ранние достижения</h2>
<ul>
<li>Reverse engineering приложения Finder для Mac OSX 10.4/5 для отображения иконок статуса синхронизации (&#171;в процессе&#187;, &#171;все готово&#187;)</li>
<li>Сложная инфраструктура HTTP нотификаций для избежания регулярного опроса серверов на каждом клиенте, основанная на <a href="/tag/twisted/">Twisted</a></li>
<li> Общая кодовая база, работающая на всех основных операционных системах: Windows, Mac OS, Linux (на основе PyObjC, wxPython, ctypes, py2exe, py2app, PyWin32)</li>
<li>Горизонтально масштабируемое хранилище для информации о файлах на основе <a href="/tag/mysql/" target="_blank">MySQL</a></li>
<li>Собственная инфраструктура для аналитики в реальном времени</li>
<li>Собственный механизм выделения памяти для Python, позволивший сократить её потребление на 90%</li>
</ul>
<h2>Сферы применения Python</h2>
<p>По сути он используется во всех частях проекта:</p>
<ul>
<li>логика backend синхронизации;</li>
<li>клиенты для основных ОС (Windows, Mac, Linux);</li>
<li>контроллер основного сайта;</li>
<li>обработка API запросов;</li>
<li>аналитика.</li>
</ul>
<p>Исключения из-за ограничений по доступной оперативной памяти:</p>
<ul>
<li>Android (мог бы быть Jython)</li>
<li>iPhone (мог бы быть Cpython)</li>
</ul>
<h2>Почему именно Python?</h2>
<ul>
<li><strong>Легок в изучении и понимании:</strong>
<ul>
<li>новые люди легко втягиваются в процесс;</li>
<li>позволяет людям переключаться с проекта на проект.</li>
</ul>
</li>
<li><strong>Легок в написании:</strong> важно для быстрой реализации функционала и выпуска новых версий.</li>
<li><strong>Легок в изменении:</strong>
<ul>
<li>нет необходимости в перекомпиляции;</li>
<li>высокая скорость итерации;</li>
<li>динамическая типизация:
<ul>
<li>рефакторинг очень прост;</li>
<li>уменьшение прямых зависимостей модулей;</li>
<li>динамические инструменты.</li>
</ul>
</li>
</ul>
</li>
<li><strong>Позволяет обеспечивать качество</strong> путем создания более-менее работающей версии продукта и доведения её до качественного уровня путем быстрых итераций.</li>
</ul>
<h2>Не без трудностей</h2>
<blockquote><p>Аргх!!! Python потребляет слишком много оперативной памяти и о-о-очень медленный!</p></blockquote>
<p>На серверной стороне можно вообще не заморачиваться и купить больше оборудования &#8212; всегда помогает. Но для клиентской части такой подход не прокатит, если только Вы не собираетесь купить новые компьютеры и телефоны всем своим клиентам.</p>
<p>Как с этим бороться?</p>
<ul>
<li>Убедитесь, что все длинные внутренние циклы выполняются в C (может сэкономить до 44% процессорного времени)</li>
<li>С оптимизацией потребления вычислительных ресурсов все просто:
<ul>
<li>есть много готовых решений для профайлинга;</li>
<li>проблемный код чаще всего не раскидан по всей кодовой базе.</li>
</ul>
</li>
<li>С оптимизацией потребляемой памяти все сложнее:
<ul>
<li>нет готовых решений для профайлинга память (одновременно в Python и C);</li>
<li>много потенциальных причин для повышенного потребления памяти:
<ul>
<li>утечки в Python и C;</li>
<li>фрагментация памяти;</li>
<li>неэффективное её использование.</li>
</ul>
</li>
<li>Как исправить? Однозначного решения нет &#8212; чаще всего приходится перерывать всю кодовую базу в поисках неоптимальных мест и источников утечек.</li>
<li>Почему память фрагментируется?
<ul>
<li>Большинство объектов расположены в heap памяти (большой последовательный кусок, выделенный приложению);</li>
<li>Много маленьких объектов вперемешку с большими;</li>
<li>Много временных объектов вперемешку с постоянными;</li>
<li>В CPython нет сборщика мусора, позволяющего собрать объекты компактно в одной части heap&#8217;а.</li>
</ul>
</li>
<li>Решением проблемы с фрагментацией стал собственный аллокатор памяти (механизм её выделения под определенные типы объектов):
<ul>
<li>В Dropbox обнаружили, что большая часть heap-памяти захламляется контейнерами с метаданными файлов, которые синхронизируется;</li>
<li>Было решено вынести их куда-нибудь еще;</li>
<li>CPython позволяет управлять процессом выделения памяти для типов данных расширений;</li>
<li>Делается это с помощью простых структур на C;</li>
<li>&#171;Not Rocket Science, just C code&#187;;</li>
<li>Выделяются области памяти по 4Мб, состоящие из заголовка и буфферов фиксированной длины.</li>
<li>Что насчет внутренней фрагментации?
<ul>
<li>по идее же даже в одном буффере останутся данные, весь блок нельзя будет освободить&#8230;</li>
<li>потенциально этот факт может привести к еще большему расходу оперативной памяти;</li>
<li>но это оказывается не так, если учесть, что все объекты являются временными, то есть живут не долго!</li>
<li>в результате Dropbox редко использует более 100Мб памяти для больших синхронизаций (раньше эта цифра могла достигать 1.5Гб)</li>
</ul>
</li>
<li>Но писать C расширение для каждой структуры данных, которую может понадобиться вынести в отдельный аллокатор &#8212; дело неблагодарное: в результате эта история закончилась изменением type_new() в Objects/typeobject.c для того, чтобы можно было указывать <strong>__use_region_allocator__ = True</strong> для тех классов, которым требуется такой механизм выделения памяти.</li>
</ul>
</li>
</ul>
</li>
</ul>
<h2>Подводим итоги</h2>
<ul>
<li>Python стал ключом к технической реализации обоих сторон Dropbox: серверной и клиентской.</li>
<li>Залогом успеха является максимальная простота с пользовательской точки зрения: &#171;положил файл в папку и он становится доступен отовсюду&#187;</li>
<li>Dropbox не брали на себя реализацию стороннего функционала, вроде собственно создания хранилища файлов &#8212; используется <a href="http://aws.amazon.com/s3/" target="_blank">Amazon S3</a>, что позволило им запуститься очень быстро и стремительно.</li>
<li><em>Лучше решать одну задачу, но качественно, чем много, но так себе!</em></li>
</ul>
<h2>Пользуясь случаем</h2>
<p>Если в процессе прочтения этой статьи у Вас появилось ощущение, что Вам в жизни очень бы пригодилось знание Python для быстрого создания прототипов своих проектов или, может быть, работы в стремительно развивающемся интернет-проекте вроде <a href="http://db.tt/4TDAr1L" target="_blank">Dropbox</a>, могу порекомендовать Вам записаться на <a href="/ustali-ot-figurnykh-skobochek-i-tochek-s-zapyatojj/" target="_blank">мои курсы по Python</a>. Как раз скоро начнется следующий поток <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<h2>Источники информации</h2>
<ul>
<li><a href="http://pycon.blip.tv/file/4878722/" target="_blank">Видео</a></li>
<li><a href="https://www.dropbox.com/s/mwxsyxtu9qieboo/pycon%20talk%20minus%20video.pptx" target="_blank">Презентация</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-dropbox/feed/</wfw:commentRss>
		<slash:comments>16</slash:comments>
		</item>
		<item>
		<title>Архитектура Twitter. Два года спустя.</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-twitter-dva-goda-spustya/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-twitter-dva-goda-spustya/#comments</comments>
		<pubDate>Sat, 05 Mar 2011 17:47:27 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Apache]]></category>
		<category><![CDATA[Cassandra]]></category>
		<category><![CDATA[featured]]></category>
		<category><![CDATA[Flock]]></category>
		<category><![CDATA[FlockDB]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[HBase]]></category>
		<category><![CDATA[Kestrel]]></category>
		<category><![CDATA[Memcached]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[Pig]]></category>
		<category><![CDATA[Ruby]]></category>
		<category><![CDATA[Ruby on Rails]]></category>
		<category><![CDATA[Scala]]></category>
		<category><![CDATA[Scribe]]></category>
		<category><![CDATA[Twitter]]></category>
		<category><![CDATA[Unicorn]]></category>
		<category><![CDATA[архитектура Twitter]]></category>
		<category><![CDATA[интернет-проекты]]></category>
		<category><![CDATA[социальная сеть]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=942</guid>
		<description><![CDATA[В далеком 2008м я уже публиковал статью про архитектуру Twitter, но время летит стремительно и она уже абсолютно устарела. За это время аудитория Twitter росла просто фантастическими темпами и многое поменялось и с технической точки зрения. Интересно что новенького у одного из самых популярных социальных интернет-проектов? Статистика 3 год, 2 месяца и 1 день потребовалось [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.insight-it.ru/wp-content/uploads/2011/03/twitter.png"><img class="aligncenter size-full wp-image-959" title="Twitter" src="http://www.insight-it.ru/wp-content/uploads/2011/03/twitter.png" alt="Twitter" width="430" height="126" /></a></p>
<p>В далеком 2008м я уже публиковал статью про <a href="/net/scalability/arkhitektura-twitter/" target="_blank">архитектуру Twitter</a>, но время летит стремительно и она уже абсолютно устарела. За это время аудитория Twitter росла просто фантастическими темпами и многое поменялось и с технической точки зрения. Интересно что новенького у одного из самых популярных социальных интернет-проектов?<span id="more-942"></span></p>
<h2>Статистика</h2>
<ul>
<li>3 год, 2 месяца и 1 день потребовалось Twitter, чтобы набрать 1 миллиард твитов</li>
<li>На сегодняшний день, чтобы отправить миллиард твитов пользователям нужна всего одна неделя</li>
<li>752% рост аудитории за 2008 год</li>
<li>1358% рост аудитории за 2009 год (без учета API, по данным comScore)</li>
<li>175 миллионов зарегистрированных пользователей на сентябрь 2010 года</li>
<li>460 тысяч регистраций пользователей в день</li>
<li>9й сайт в мире по популярности (по данным Alexa, год назад был на 12 месте)</li>
<li>50 миллионов твитов в день год назад, 140 миллионов твитов в день месяц назад, 177 миллионов твитов в день на 11 марта 2011г.</li>
<li>Рекорд по количеству твитов за секунду 6939, установлен через минуту после того, как Новый Год 2011 наступил в Японии</li>
<li>600 миллионов поисков в день</li>
<li>Лишь 25% трафика приходится на веб сайт, остальное идет через API</li>
<li>Росто числа мобильных пользователей за последний год 182%</li>
<li><strong>6 миллиардов</strong> запросов к API в день, около 70 тысяч в секунду</li>
<li>8, 29, 130, 350, 400 &#8212; это количество сотрудников Twitter на январь 2008, январь 2009, январь 2010, январь и март 2011, соответственно</li>
</ul>
<p>Самая свежая <a href="http://blog.twitter.com/2011/03/numbers.html" target="_blank">статистика про Twitter</a>.</p>
<h2>Платформа</h2>
<ul>
<li><a href="/tag/apache/" target="_blank">Apache</a> + mod_proxy</li>
<li><a href="/tag/unicorn/" target="_blank">Unicorn</a></li>
<li><a href="/tag/ruby/" target="_blank">Ruby</a> + <a href="/tag/ror/" target="_blank">Ruby on Rails</a></li>
<li><a href="/tag/scala/" target="_blank">Scala</a></li>
<li><a href="/tag/flock/" target="_blank">Flock</a></li>
<li><a href="/tag/memcached/" target="_blank">memcached</a></li>
<li><a href="/tag/kestrel/" target="_blank">Kestrel</a></li>
<li><a href="/tag/mysql/" target="_blank">MySQL</a></li>
<li><a href="/tag/cassandra/" target="_blank">Cassandra</a></li>
<li><a href="/tag/scribe/" target="_blank">Scribe</a></li>
<li><a href="/tag/hadoop/" target="_blank">Hadoop</a>, <a href="/tag/hbase/" target="_blank">HBase</a> и <a href="/tag/pig/" target="_blank">Pig</a></li>
</ul>
<p>Сравните с аналогичным разделом предыдущей статьи о Twitter &#8212; увидите много новых лиц, подробнее ниже.</p>
<h2>Оборудование</h2>
<ul>
<li>Сервера расположены в NTT America</li>
<li>Никаких облаков и виртуализации, существующие решения страдают слишком высокими задержками</li>
<li>Более тысячи серверов</li>
<li>Планируется переезд в собственный датацентр</li>
</ul>
<h2>Что такое твит?</h2>
<ul>
<li>Сообщение длиной до 140 символов + метаданные</li>
<li>Типичные запросы:
<ul>
<li>по идентификатору</li>
<li>по автору</li>
<li>по @упоминаниям пользователей</li>
</ul>
</li>
</ul>
<h2>Архитектура</h2>
<h3><a href="http://www.insight-it.ru/wp-content/uploads/2011/03/twitter-request-flow.jpeg"><img class="aligncenter size-medium wp-image-953" title="Процесс обработки запроса в Twitter" src="http://www.insight-it.ru/wp-content/uploads/2011/03/twitter-request-flow-293x300.jpg" alt="Процесс обработки запроса в Twitter" width="293" height="300" /></a></h3>
<h3>Unicorn</h3>
<p>Сервер приложений для Rails:</p>
<ul>
<li>Развертывание новых версий кода <strong>без простоя</strong></li>
<li>На 30% меньше расход вычислительных ресурсов и оперативной памяти, по сравнению с другими решениями</li>
<li>Перешли с mod_proxy_balancer на mod_proxy_pass</li>
</ul>
<h3>Rails</h3>
<p>Используется в основном для генерации страниц, работа за сценой реализована на чистом Ruby или Scala.</p>
<p>Столкнулись со следующими проблемами:</p>
<ul>
<li>Проблемы с кэшированием, особенно по части инвалидации</li>
<li>ActiveRecord генерирует не самые удачные SQL-запросы, что замедляло время отклика</li>
<li>Высокие задержки в очереди и при репликации</li>
</ul>
<h3>memcached</h3>
<ul>
<li>memcached не идеален. Twitter начал сталкиваться с Segmentation Fault в нем очень рано.</li>
<li>Большинство стратегий кэширования основываются на длинных TTL (боллее минуты).</li>
<li>Вытеснение данных делает его непригодным для важных конфигурационных данных (например флагов &#171;темного режима&#187;, о котором пойдет речь ниже).</li>
<li>Разбивается на несколько пулов для улучшения производительности и снижения риска вытеснения.</li>
<li>Оптимизированная библиотека для доступа к memcached из Ruby на основе libmemcached + FNV hash, вместо чистого Ruby и md5.</li>
<li>Twitter является одним их наиболее активных проектов, участвующих в разработке libmemcached.</li>
</ul>
<h3>MySQL</h3>
<ul>
<li>Разбиение больших объемов данных является тяжелой задачей.</li>
<li>Задержки в репликации и вытеснение данных из кэша является причиной нарушения целостности данных с точки зрения конечного пользователя.</li>
<li>Блокировки создают борьбу за ресурсы для популярных данных.</li>
<li>Репликация однопоточна и происходит недостаточно быстро.</li>
<li>Данные социальных сетей плохо подходят для реляционных СУБД:
<ul>
<li>NxN отношения, социальный граф и обход деревьев &#8212; не самые подходящие задачи для таких баз данных</li>
<li>Проблемы с дисковой подсистемой (выбор файловой системы, noatime, алгоритм планирования)</li>
<li>ACID практически не требуется</li>
<li>Для очередей также практически непригодны</li>
</ul>
</li>
<li>Twitter сталкивался с большими проблемами касательно таблиц пользователей и их статусов</li>
<li>Читать данные с мастера при Master/Slave репликации = медленная смерть</li>
</ul>
<h3>FlockDB</h3>
<p>Масштабируемое хранилище для данных социального графа:</p>
<ul>
<li>Разбиение данных через Gizzard</li>
<li>Множество серверов MySQL в качестве низлежащей системы хранения</li>
<li>В Twitter содержит 13 миллиардов ребер графа и обеспечивает 20 тысяч операций записи и 100 тысяч операций чтения в секунду</li>
<li>Грани хранятся и индексируются в обоих направлениях</li>
<li>Поддерживает распределенный подсчет количества строк</li>
<li><a href="https://github.com/twitter/flockdb" target="_blank">Open source!</a></li>
</ul>
<p>Среднее время на выполнение операций:</p>
<ul>
<li>Подсчет количества строк: 1мс</li>
<li>Временные запросы: 2мс</li>
<li>Запись: 1мс для журнала, 16мс для надежной записи</li>
<li>Обход дерева: 100 граней/мс</li>
</ul>
<p>Подробнее про эволюцию систем хранения данных в Twitter <a href="http://www.slideshare.net/nkallen/q-con-3770885" target="_blank">в презентации Nick Kallen</a>.</p>
<h3>Cassandra</h3>
<p>Распределенная система хранения данных, ориентированная на работу в реальном времени:</p>
<ul>
<li>Изначально разработана в <a href="/tag/facebook/" target="_blank">Facebook</a></li>
<li>Очень высокая производительность на  запись</li>
<li>Из слабых сторон: высокая задержка при случайном доступе</li>
<li>Децентрализованная, способна переносить сбои оборудования</li>
<li>Гибкая схема данных</li>
<li><span style="color: #000000;"><del>Планируется полный переход на нее по следующему алгоритму: </del></span>
<ul>
<li><span style="color: #000000;"><del>Все твиты пишутся и в Cassandra и в MySQL</del></span></li>
<li><span style="color: #000000;"><del>Динамически часть операций чтения переводится на Cassandra</del></span></li>
<li><span style="color: #000000;"><del>Анализируется реакция системы, что сломалось</del></span></li>
<li><span style="color: #000000;"><del>Полностью отключаем чтение из Cassandra, чиним неисправности</del></span></li>
<li><span style="color: #000000;"><del>Начинаем сначала</del></span></li>
</ul>
</li>
<li><strong><a href="http://engineering.twitter.com/2010/07/cassandra-at-twitter-today.html" target="_blank">Обновление:</a> </strong>стратегия по поводу использования Cassandra изменилась, попытки использовать её в роли основного хранилища для твитов прекратились, но она продолжает использоваться для аналитики и географической информации.</li>
</ul>
<p>Подробнее почему Twitter пришел к решению использовать Cassandra можно прочитать <a href="http://www.slideshare.net/ryansking/scaling-twitter-with-cassandra" target="_blank">в отдельной презентации</a>.</p>
<p>Помимо всего прочего Cassandra <span style="color: #000000;"><del>планируется использовать</del></span> используется для аналитики в реальном времени.</p>
<h3>Scribe</h3>
<p>Пользователи Twitter генерируют огромное количество данных, около 15-25 Гб  в минуту, более 12 Тб в день, и эта цифра удваивается несколько раз в год.</p>
<p>Изначально для сбора логов использовали syslog-ng, но он очень быстро перестал справляться с нагрузкой.</p>
<p>Решение нашлось очень просто: <a href="/tag/facebook/" target="_blank">Facebook</a> столкнулся с аналогичной проблемой и разработал проект Scribe, который был опубликован в opensource.</p>
<p>По сути это фреймворк для сбора и агрегации логов, основанный на <a href="/tag/thrift/" target="_blank">Thrift</a>. Вы пишете текст для логов и указываете категорию, остальное он берет на себя.</p>
<p>Работает локально, надежен даже в случае потери сетевого соединения, каждый узел знает только на какой сервер передавать логи, что позволяет создавать масштабируемую иерархию для сбора логов.</p>
<p>Поддерживаются различные системы для записи в данным,  в том числе обычные файлы и HDFS (о ней ниже).</p>
<p>Этот продукт полностью решил проблему Twitter со сбором логов, используется около 30 различных категорий. В процессе использования была создана и опубликована масса доработок. Активно сотрудничают с командой Facebook в развитии проекта.</p>
<h3>Hadoop</h3>
<p>Как Вы обычно сохраняете 12Тб новых данных, поступающих каждый день?</p>
<p>Если считать, что средняя скорость записи современного жесткого диска составляет 80Мбайт в секунду, запись 12Тб данных заняла бы почти 48 часов.</p>
<p>На одном даже очень большом сервере данную задачу не решить, логичным решением задачи стало использование кластера для хранения и анализа таких объемов данных.</p>
<p>Использование кластерной файловой системы добавляет сложности, но позволяет меньше заботиться о деталях.</p>
<p>Hadoop Distributed File System (HDFS) предоставляет возможность автоматической репликации и помогает справляться со сбоями оборудования.</p>
<p>MapReduce framework позволяет обрабатывать огромные объемы данных, анализируя пары ключ-значение.</p>
<p>Типичные вычислительные задачи, которые решаются с помощью Hadoop в Twitter:</p>
<ul>
<li>Вычисление связей дружбы в социальном графе (grep и awk не справились бы, self join в MySQL на таблицах с миллиардами строк &#8212; тоже)</li>
<li>Подсчет статистики (количество пользователей и твитов, например подсчет количества твитов занимает 5 минут при 12 миллиардах записей)</li>
<li>Подсчет PageRank между пользователями для вычисления репутации.</li>
</ul>
<p>В твиттер используется бесплатный дистрибутив от Cloudera, версия Hadoop 0.20.1, данные храняться <a href="https://github.com/kevinweil/hadoop-lzo" target="_blank">в сжатом по алгоритму LZO виде</a>, библиотеки для работы с данными опубликованы под названием <a href="https://github.com/kevinweil/elephant-bird" target="_blank">elephant-bird</a>.</p>
<h3>Pig</h3>
<p>Для того чтобы анализировать данные с помощью MapReduce обычно необходимо разрабатывать код на Java, что далеко не все умеют делать, да и трудоемко это.</p>
<p>Pig представляет собой высокоуровневый язык, позволяющий трансформировать огромные наборы данных шаг за шагом.</p>
<p>Немного напоминает SQL, но намного проще. Это позволяет писать в 20 раз меньше кода, чем при анализе данных с помощью обычных MapReduce работ.  Большая часть работы по анализу данных в Twitter осуществляется с помощью Pig.</p>
<h3>Данные</h3>
<p>Полу-структурированные данные:</p>
<ul>
<li>логи Apache, RoR, MySQL, A/B тестирования, процесса регистрации</li>
<li>поисковые запросы</li>
</ul>
<p>Структурированные данные:</p>
<ul>
<li>Твиты</li>
<li>Пользователи</li>
<li>Блок-листы</li>
<li>Номера телефонов</li>
<li>Любимые твиты</li>
<li>Сохраненные поиски</li>
<li>Ретвиты</li>
<li>Авторизации</li>
<li>Подписки</li>
<li>Сторонние клиенты</li>
<li>География</li>
</ul>
<p>Запутанные данные:</p>
<ul>
<li>Социальный граф</li>
</ul>
<p><strong>Что же они делают с этим всем?</strong></p>
<ul>
<li>Подсчет математического ожидания, минимума, максимума и дисперсии следующих показателей:
<ul>
<li>Количество запросов за сутки</li>
<li>Средняя задержка, 95% задержка</li>
<li>Распределение кодов HTTP-ответов (по часам)</li>
<li>Количество поисков осуществляется каждый день</li>
<li>Количество уникальных запросов и пользователей</li>
<li>Географическое распределение запросов и пользователей</li>
</ul>
</li>
<li>Подсчет вероятности, ковариации, влияния:
<ul>
<li>Как отличается использование через мобильные устройства?</li>
<li>Как влияет использование клиентов сторонних разработчиков?</li>
<li>Когортный анализ</li>
<li>Проблемы с сайтом (киты и роботы, подробнее ниже)</li>
<li>Какие функциональные возможности цепляют пользователей?</li>
<li>Какие функциональные возможности чаще используются популярными пользователями?</li>
<li>Корректировка и предложение поисковых запросов</li>
<li>A/B тестирование</li>
</ul>
</li>
<li>Предсказания, анализ графов, естественные языки:
<ul>
<li>Анализ пользователей по их твитам, твитов, на которые они подписаны, твитам их фоловеров</li>
<li>Какая структура графа ведет к успешным популярным сетям</li>
<li>Пользовательская репутация</li>
<li>Анализ эмоциональной окраски</li>
<li>Какие особенности заставляют людей ретвитнуть твит?</li>
<li>Что влияет на глубину дерева ретвитов ?</li>
<li>Долгосрочное обнаружение дубликатов</li>
<li>Машинное обучение</li>
<li>Обнаружения языка</li>
</ul>
</li>
</ul>
<p>Подробнее про обработку данных <a href="http://www.slideshare.net/kevinweil/nosql-at-twitter-nosql-eu-2010" target="_blank">в презентации Kevin Weil</a>.</p>
<h3>HBase</h3>
<p>Twitter начинают строить настоящие сервисы на основе Hadoop, например поиск людей:</p>
<ul>
<li>HBase используется как изменяемая прослойка над HDFS</li>
<li>Данные экспортируются из HBase c помощью периодической MapReduce работы:
<ul>
<li>На этапе Map использются также данные из FlockDB и нескольких внутренних сервисов</li>
<li>Собственная схема разбиения данных</li>
<li>Данные подтягиваются через высокопроизводительный, горизонтально масштабируемый сервис на Scala (<a href="http://www.slideshare.net/al3x/building-distributed-systems-in-scala" target="_blank">подробнее о построении распределенных сервисов на Scala</a>)</li>
</ul>
</li>
</ul>
<p>На основе HBase разрабатываются и другие продукты внутри Twitter.</p>
<p>Основными её достоинствами являются гибкость и легкая интеграция с Hadoop и Pig.</p>
<p>По сравнению с Cassandra:</p>
<ul>
<li>&#171;Их происхождение объясняет их сильные и слабые стороны&#187;</li>
<li>HBase построен на основе системы по пакетной обработке данных, высокие задержки, работает далеко не в реальном времени</li>
<li>Cassandra построена с нуля для работы с низкими задержками</li>
<li>HBase легко использовать при анализе данных как источник или место сохранения результатов, Cassandra для этого подходит меньше, но они работают над этим</li>
<li>HBase на данный момент единственную точку отказа в виде мастер-узла</li>
<li>В твиттере HBase используется для аналитики, анализа и создания наборов данных, а Cassandra &#8212; для онлайн систем</li>
</ul>
<h3>Loony</h3>
<p>Централизованная система управления оборудованием.</p>
<p>Реализована с использованием:</p>
<ul>
<li><a href="/tag/python/" target="_blank">Python</a></li>
<li><a href="/tag/django/" target="_blank">Django</a></li>
<li><a href="/tag/mysql/" target="_blank">MySQL</a></li>
<li><a href="http://www.lag.net/paramiko/" target="_blank">Paraminko</a> (реализация протокола SSH на Python, разработана и опубликована в opensource в Twitter)</li>
</ul>
<p>Интегрирована с LDAP, анализирует входящую почту от датацентра и автоматически вносит изменения в базу.</p>
<h3>Murder</h3>
<p>Система развертывания кода и ПО, основанная на протоколе BitTorrent.</p>
<p>Благодаря своей P2P природе позволяет обновить более тысячи серверов за 30-60 секунд.</p>
<h3>Kestrel</h3>
<p>Распределенная очередь, работающая по протоколу memcache:</p>
<ul>
<li>set &#8212; поставить в очередь</li>
<li>get &#8212; взять из очереди</li>
</ul>
<p>Особенности:</p>
<ul>
<li>Отсутствие строгого порядка выполнения заданий</li>
<li>Отсутствие общего состояния между серверами</li>
<li>Разработана на <a href="/tag/scala/" target="_blank">Scala</a></li>
</ul>
<h3>Daemon&#8217;ы</h3>
<p>Каждый твит обрабатывается с помощью daemon&#8217;ов.</p>
<p>В unicorn обрабатываются только HTTP запросы, вся работа за сценой реализована в виде отдельных daemon&#8217;ов.</p>
<p>Раньше использовалось много разных демонов, по одному на каждую задачу (Rails), но перешли к меньшему их количеству, способному решать несколько задач одновременно.</p>
<h3>Как они справляются с такими темпами роста?</h3>
<p>Рецепт прост, но эффективен, подходит практически для любого интернет-проекта:</p>
<ul>
<li><em>обнаружить самое слабое место в системе;</em></li>
<li><em>принять меры по его устранению;</em></li>
<li><em>перейти к следующему самому слабому месту.</em></li>
</ul>
<p>На словах звучит и правда примитивно, но на практике нужно предпринять ряд мер, чтобы такой подход был бы реализуем:</p>
<ul>
<li>Автоматический сбор метрик (причем в агрегированном виде)</li>
<li>Построение графиков (RRD, Ganglia)</li>
<li>Сбор и анализ логов</li>
<li>Все данные должны получаться с минимальной задержкой, как можно более близко к реальному времени</li>
<li>Анализ:
<ul>
<li>Из данных необходимо получать <em>информацию</em></li>
<li>Следить за динамикой показателей: стало лучше или хуже?</li>
<li>Особенно при развертывании новых версий кода</li>
<li>Планирование использования ресурсов намного проще, чем решение экстренных ситуаций, когда они на исходу</li>
</ul>
</li>
</ul>
<p>Примерами агрегированных метрик в Twitter являются &#171;киты&#187; и &#171;роботы&#187;, вернее их количество в единицу времени.</p>
<p><strong>Что такое &#171;робот&#187;?</strong></p>
<p><strong><a href="http://www.insight-it.ru/wp-content/uploads/2011/03/twitter-Bot.png"><img class="aligncenter size-full wp-image-943" title="Twitter Робот" src="http://www.insight-it.ru/wp-content/uploads/2011/03/twitter-Bot.png" alt="Twitter Робот" width="400" height="273" /></a><br />
</strong></p>
<ul>
<li>Ошибка внутри Rails (HTTP 500)</li>
<li>Непойманное исключение</li>
<li>Проблема в коде или нулевой результат</li>
</ul>
<p><strong>Что такое &#171;кит&#187;?</strong></p>
<p><strong><a href="http://www.insight-it.ru/wp-content/uploads/2011/03/whale.png"><img class="aligncenter size-full wp-image-944" title="Twitter Кит" src="http://www.insight-it.ru/wp-content/uploads/2011/03/whale.png" alt="Twitter Кит" width="530" height="398" /></a><br />
</strong></p>
<ul>
<li>HTTP ошибка 502 или 503</li>
<li>В твиттер используется фиксированный таймаут в 5 секунд (лучше кому-то показать ошибку, чем захлебнуться в запросах)</li>
<li>Убитый слишком длинный запрос к базе данных (mkill)</li>
</ul>
<p>Значительное превышение нормального количества китов или роботов в минуту является поводом для беспокойством.</p>
<p>Реализован этот механизм простым bash-скриптом, который просматривает агрегированные логи за последние 60 секунд, подсчитывает количество китов/роботов и рассылает уведомления, если значение оказалось выше порогового значения. Подробнее про работу команды оперативного реагирования <a href="http://www.slideshare.net/netik/billions-of-hits-scaling-twitter" target="_blank">в презентации John Adams</a>.</p>
<h3>&#171;Темный режим&#187;</h3>
<p>Для экстренных ситуаций в Twitter предусмотрен так называемый &#171;темный режим&#187;, который представляет собой набор механизмов для отключения тяжелых по вычислительным ресурсам или вводу-выводу функциональных частей сайта. Что-то вроде стоп-крана для сайта.</p>
<p>Имеется около 60 выключателей, в том числе и полный режим &#171;только для чтения&#187;.</p>
<p>Все изменения в настройках этого режима фиксируются в логах и сообщаются руководству, чтобы никто не баловался.</p>
<h2>Подводим итоги</h2>
<ul>
<li>Не бросайте систему на самотек, начинайте собирать метрики и их визуализировать как можно раньше</li>
<li>Заранее планируйте рост требуемых ресурсов и свои действия в случае экстренных ситуаций</li>
<li>Кэшируйте по максимуму все, что возможно</li>
<li>Все инженерные решения не вечны, ни одно из решений не идеально, но многие будут нормально работать в течение какого-то периода времени</li>
<li>Заранее начинайте задумываться о плане масштабирования</li>
<li>Не полагайтесь полностью на memcached и базу данных &#8212; они могут Вас подвести в самый неподходящий момент</li>
<li>Все данные для запросов в реальном времени должны находиться в памяти, диски в основном для записи</li>
<li>Убивайте медленные запросы (mkill) прежде, чем они убьют всю систему</li>
<li>Некоторые задачи могут решаться путем предварительного подсчета и анализа, но далеко не все</li>
<li>Приближайте вычисления к данным по возможности</li>
<li>Используйте не mongrel, а unicorn для RoR</li>
</ul>
<p><strong>Спасибо за внимание, <a href="/feed/" target="_blank">жду Вас снова</a>! Буду рад, если Вы <a href="http://twitter.com/blinkov" target="_blank">подпишитесь на меня в Twitter</a>, с удовольствием пообщаюсь со всеми читателями <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </strong></p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-twitter-dva-goda-spustya/feed/</wfw:commentRss>
		<slash:comments>60</slash:comments>
		</item>
		<item>
		<title>Архитектура Mollom</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-mollom/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-mollom/#comments</comments>
		<pubDate>Tue, 15 Feb 2011 16:19:59 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Cassandra]]></category>
		<category><![CDATA[Drupal]]></category>
		<category><![CDATA[Glassfish]]></category>
		<category><![CDATA[Hudson]]></category>
		<category><![CDATA[Intel]]></category>
		<category><![CDATA[Java]]></category>
		<category><![CDATA[Mollom]]></category>
		<category><![CDATA[Munin]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[Pingdom]]></category>
		<category><![CDATA[saas]]></category>
		<category><![CDATA[SoftLayer]]></category>
		<category><![CDATA[Unfuddle]]></category>
		<category><![CDATA[Xeon]]></category>
		<category><![CDATA[Zendesk]]></category>
		<category><![CDATA[Архитектура Mollom]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=755</guid>
		<description><![CDATA[Mollom &#8212; это прибыльный SaaS сервис по фильтрации различных форм спама из контента, сгенерированного пользователями: комментариев, постов на форумах и блогах, опросов, контактных и регистрационных форм. Определение спама основано не только на контенте, но и репутации и прошлой активности разместившего его пользователя. Алгоритм машинного обучения Mollom выполняет роль цифрового модератора 24х7 для более 40 тысяч [...]]]></description>
			<content:encoded><![CDATA[<p><img style="float: right; margin: 1em 2em;" title="Mollom" src="http://www.insight-it.ru/wp-content/uploads/2011/02/5426183775_6b4d1eb673_m.jpg" alt="Mollom" width="240" height="66" /><a href="http://mollom.com/" target="_blank">Mollom</a> &#8212; это прибыльный SaaS сервис по фильтрации различных форм спама из контента, сгенерированного пользователями: комментариев, постов на форумах и блогах, опросов, контактных и регистрационных форм. Определение спама основано не только на контенте, но и репутации и прошлой активности разместившего его пользователя. Алгоритм машинного обучения Mollom выполняет роль цифрового модератора 24х7 для более 40 тысяч сайтов, в том числе и очень крупных компаний.</p>
<p>С того момента, как Mollom запустили систему анализа цифрового контента, они выявили более 373 миллионов спам сообщений, обнаружив в процессе что впечатляющие 90% всех прошедших через них сообщений оказались спамом. Весь этот поток спама в 100 сообщений в секунду обрабатывается всего двумя географически распределенными серверами. На каждом из них работает сервер Java-приложений и Cassandra. Так мало ресурсов требуется лишь из-за того, что они создали очень эффективную систему машинного обучения. Разве не круто? Так как же они это делают?<span id="more-755"></span><br />
<img src="http://www.insight-it.ru/wp-content/uploads/2011/02/mollom.jpeg" alt="" title="Mollom" width="628" height="250" class="alignnone size-full wp-image-1225" /></p>
<h2>Статистика</h2>
<ul>
<li>Обслуживаются 40000 активных веб-сайтов, многие их которых принадлежат крупным клиентам, таким как Adobe, Sony BMG, Warner Brothers, Fox News и The Economist. Много крупных брендов, с крупными сайтами, масса комментариев.</li>
<li>Обнаруживают пол-миллиона спам-сообщений ежедневно.</li>
<li>Обрабатывается около 100 запросов к API в секунду.</li>
<li>Проверка сообщения на спам занимает очень мало времени, обычно около 30-50 миллисекунд, 95% запросов укладывается в 250 миллисекунд, когда самые медленные обрабатываются пол секунды.</li>
<li>Эффективность определения спама составляет 99.95%. Это означает, что из 10000 спам-сообщений Mollom пропустит только 5.</li>
<li><a href="http://mollom.com/blog/netlog-using-mollom" target="_blank">Netlog</a>, европейская социальная сеть, имеет отдельный Mollom-сервер в своем датацентре. Netlog проверяют на спам около 4 миллионов сообщений каждый день на классификаторах, специально натренированных на их данных.</li>
</ul>
<h2>Платформа</h2>
<ul>
<li><a href="/tag/java/" target="_blank">Java</a> &#8212; исторически сложилось, что Mollom был с самого начала был разработан на Java.</li>
<li>Два сервера обслуживают основную часть клиентов:
<ul>
<li>Один сервер на восточном побережье США, другой &#8212; на западном</li>
<li>В случае сбоя один сервер может полностью подменить другой</li>
<li>Конфигурация обоих: Intel Xeon Quad core, 2.8GHz, 16GB RAM, 4 диска по 300 GB, RAID 10.</li>
</ul>
</li>
<li><a href="http://www.softlayer.com/" target="_blank">SoftLayer</a> &#8212; хостинг-провайдер.</li>
<li><a href="http://cassandra.apache.org/" target="_blank">Cassandra</a> &#8212; NoSQL база данных, выбранная из-за высокой производительности на запись и способности работать на серверах, располагающихся в разных датацентрах (была разработана в <a href="/masshtabiruemost/arkhitektura-facebook/" target="_blank">Facebook</a>, но там практически не используется).</li>
<li><a href="http://www.mysql.com/" target="_blank">MySQL</a> &#8212; Java Persistence API используется для обычных наборов данных, когда Cassandra используется для больших объемов данных.</li>
<li><a href="http://en.wikipedia.org/wiki/GlassFish" target="_blank">Glassfish</a> &#8212; open source сервер приложений для платформы Java EE. Они выбрали именно Glassfish за его возможности корпоративного уровня, такие как репликация и обработка сбоев.</li>
<li><a href="http://hudson-ci.org/" target="_blank">Hudson</a> &#8212; предоставляет непрерывное тестирование и развертывание кода серверной части на всех используемых машинах.</li>
<li><a href="http://munin-monitoring.org/" target="_blank">Munin</a> &#8212; измерение и построение графиков, касающихся здоровья серверов.</li>
<li><a href="http://www.pingdom.com/" target="_blank">Pingdom</a> &#8212; внешний мониторинг.</li>
<li><a href="http://www.zendesk.com/" target="_blank">Zendesk</a> &#8212; используется для оказания поддержки клиентам.</li>
<li><a href="http://drupal.org/" target="_blank">Drupal</a> &#8212; используется для основного сайта со специализированным модулем интернет-магазина.</li>
<li><a href="http://unfuddle.com/" target="_blank">Unfuddle</a> &#8212; хостинг Subversion для взаимодействия удаленной команды разработчиков.</li>
</ul>
<h2>Как это работает?</h2>
<p>Процесс выглядит следующим образом:</p>
<ul>
<li>Когда пользователь отправляет комментарий на сайт, происходит запрос к API Mollom.</li>
<li>Контент анализируется, если он оказывается спамом, то сайту сообщается, что необходимо его заблокировать, если же алгоритм не уверен на 100% &#8212; сайту советуют показать CAPTCHA, которую сервис также предоставляет.</li>
<li>После того, как CAPTCHA будет успешно заполнена, контент принимается. В большинстве случаев пользователи не будут ее видеть и контент будет приниматься сразу же.</li>
</ul>
<p>Обнаружение спама является сложным балансом между отказом нормальному контенту и принятию спама.</p>
<h2>Бизнес-модель</h2>
<ul>
<li>Основным залогом популярности Mollom является бесплатная возможность попробовать сервис, ограничение составляет 100 нормальных (не спам) сообщений в день. Небольшие сайты могут никогда и не достичь этого ограничения.</li>
<li>Далее есть два тарифа: 1 евро в день и 3600 евро с возможностями вполне соответствующими этим суммам</li>
<li>Сайты, использующие бесплатный тариф, вовсе не зря тратят ресурсы системы, как кажется на первый взгляд, а являются жизненно-важным источником данных для тренировки системы. Без этих данных алгоритмы были бы существенно менее точны.</li>
</ul>
<h2>Архитектура</h2>
<ul>
<li>Разработчики Mollom уделяют максимум внимания времени отклика, эффективности кода и использования серверных ресурсов.</li>
<li>Физически каждый сервер может справиться со всеми запросами, два сервера нужны для избежания перерывов в работе системы. Когда оба сервера в строю &#8212; работа распределяется между ними, когда один падает &#8212; второй перехватывает его запросы.</li>
<li>Mollom прошел через несколько этапов развития:
<ol>
<li>Изначально маленькая команда из двух человек работала вечерами над основными алгоритмами, классификаторами и реальными бизнес-задачами, которые они пытались решить. Для построения инфраструктуры серверной части они использовали свои реализации базовых механизмов по управлению ресурсами, соединениями и потоками. В итоге они обнаружили, что тратят слишком много времени на эти вещи. После этого они переключились на Glassfish, что позволило им намного меньше беспокоится об управлении памятью, REST-запросах, парсинге XML и поддержании пула соединений с базой данных.</li>
<li>В прошлом основной проблемой была пропускная способность дисковой подсистемы. Они должны хранить информацию о репутации всех IP-адресов и URL по всему Интернету, что привело к массивному набору данных с большим количеством случайных обращений.</li>
<li>Поначалу они использовали MySQL на недорогой виртуальной машине, что в итоге не смогло масштабироваться.</li>
<li>Они перенесли данные на твердотельные жесткие диски (SSD) и стали все хранить в файлах. Этот шаг решил проблемы с записью, но возникли новые проблемы:
<ol>
<li>Это правда дорого.</li>
<li>Очень чувствительно к типу используемой файловой системы</li>
<li>Запись стала происходить быстрой, но итерация по большим наборам данным (что они делали довольно часто для очистки данных и обучения классификаторов) по-прежнему была очень медленным процессом.</li>
</ol>
</li>
<li>В итоге они отказались от твердотельных накопителей и стали использовать Cassandra.</li>
</ol>
</li>
<li>Cassandra сейчас используется для обработки интенсивного потока запросов на запись и в роли кэша:
<ul>
<li>Работает на RAID10, что хорошо подходит для высоких смешанных нагрузок на запись/чтение.</li>
<li>Cassandra оптимизирована для записи, а в Mollom запись как раз происходит намного чаще, чем чтение.</li>
<li>Разработана для распределенной работы как внутри датацентра, так и между датацентрами.</li>
<li>Обратной стороной медали является отсутствие стандартного NoSQL интерфейса, что усложняет реализацию приложений.</li>
<li>Механизм кэширования строк в Cassandra позволяет им не использовать отдельную систему для кэширования, что существенно упростило код приложения.</li>
<li>Cassandra имеет функцию удаления устаревшей информации после определенного периода времени. В Европе существуют строгие законы о приватности личных данных, согласно которым они должны храниться не более определенного срока (штаб-квартира Mollom находится в  Бельгии). В этом плане эта функция очень удобна. Эта функция опять же избавляет от необходимости реализовывать данный функционал вручную.</li>
</ul>
</li>
<li>Типичный путь одного комментария внутри системы:
<ul>
<li>Балансировка нагрузки между серверами лежит на клиентской библиотеке, в роли типичного клиента может выступать сайт на Drupal, осуществляющий запрос к API через XML-RPC или REST.</li>
<li>Запросы обрабатываются сервером приложений Glassfish и проходят стандартный процесс обработки с помощью сервлетов и специфичных классов.</li>
<li>Платящие клиенты обслуживаются в первую очередь, что приводит к тому, что клиенты на бесплатном тарифе могут ожидать результата несколько дольше.</li>
<li>Запрос анализируется и оценка вероятности спама возвращается пользователю. Помимо этого отдельная часть кода Mollom отвечает за генерацию, выдачу и проверку CAPTCHA.</li>
<li>Классификаторы полностью располагаются в оперативной памяти. Небольшой кусок контента разбивается на тысячи и тысячи крошечных частей, которые могут быть идентифицированы как спам. Такие классификаторы хранят в памяти до нескольких миллионов признаков, характерных для спама. Анализ должен выполняться очень быстро, так что никаких других вариантов кроме расположения всех требуемых данных в оперативной памяти просто не было.</li>
<li>В Cassandra хранятся очки репутации, частоты, URL и IP-адреса.</li>
<li>Струтуры данных в памяти не реплицируются напрямую. Они записываются в Cassandra, которая и передает их на второй сервер. Промежуток времени, когда данные не консистентны, очень невелик, так что это не сказывается негативно на алгоритмах.</li>
</ul>
</li>
<li>Балансировка нагрузки с помощью клиента:
<ul>
<li>Mollom использует такой подход к балансировке, так как стартап не может себе позволить дорогой железный балансировщий нагрузки. Если учесть, что им нужна балансировка между датацентрами, решение от любого из вендоров было бы комплексным и дорогим.</li>
<li>У каждого клиента есть индивидуальный список серверов, которыми он может воспользоваться. Этот список изменяется через API.</li>
<li>Каждый клиент может использовать разный список, платящим клиентам могут предоставлять отдельные сервера для уменьшения задержек.</li>
<li>Если сервер упал &#8212; клиент пытается подключиться к следующему серверу в списке.</li>
<li>С другой стороны такой подход усложняет разработку неофициальных клиентов: авторам проекта приходится тесно работать с разработчиками сторонних клиентов для обеспечения правильной реализации в них балансировки нагрузки.</li>
</ul>
</li>
<li>Машинное обучение:
<ul>
<li>Mollom &#8212; это набор самообучающихся систем. Отдельные CAPTCHA-решения, не учитывают ни пользовательское поведение, ни источник контента, заставляя каждого пользователя вводить проверочный код при каждом сообщении. В случае с Mollom это происходит только когда система анализа контента не уверена в конкретном решении.</li>
<li>Средняя длина сообщения &#8212; 500 символов, обычно оно разбивается на 3000 характеристик. Принадлежность контента к спаму определяется путем оценки репутации IP адреса или Open ID, пользовательского идентификатора, эмоциональной окраски, языка, профанации, проверки на наличие специфичных слов и фраз, также учитывается качество написания текста и многие другие факторы. Все эти данные основываются на классификаторах. Некоторые из них статистические по природе, так что обучение происходит автоматически. Другие же основываются на правилах для того, чтобы быть уверенными, что они никогда не могут быть настроены неверно. Комбинация результатов всех тестов после нормализации и образует финальный рейтинг принадлежности к спаму каждого конкретного сообщения.</li>
<li>Классификаторы и внутренние метрики обучаются с каждым новым сообщением и обновляются в реальном времени.</li>
</ul>
</li>
<li>Glassfish берет на себя планировку нагрузки, учитывая многоядерность системы:
<ul>
<li>Ключ к дизайну системы в многопроцессорном окружении заключается в максимальном параллелизации работы при минимальном простое из-за блокировок.</li>
<li>Они используют 16 thread&#8217;ов на сервер.</li>
<li>Большинство запросов обрабатываются сессионными объектами (Java Bean), не имеющими состояний. Они хорошо подходят для управления параллельными запросами.</li>
<li>Они держат пул из нескольких cессионных объектов, но определение их количества делегируется Glassfish. В пиковую нагрузку это число увеличивается для более эффективной обработки запросов, порой оно достигает 32.</li>
<li>Все классификаторы реализованы как раз как такие объекты, повторно использующиеся различными thread&#8217;ами.</li>
<li>У каждого объекта есть свое клиентское соединение с Cassandra, чтобы гарантировать отсутствие блокировок.</li>
<li>Когда пользователь не отвечает на CAPTCHA сессия очищается и Mollom узнает что это скорее всего был спам.</li>
<li>На каждом сервере запущено по одной копии каждого классификатора.</li>
<li>В момент очистки сессии происходит небольшая блокировка, когда происходит обновление классификаторов.</li>
<li>Обновленные классификаторы записываются в Cassandra каждые пол часа.</li>
</ul>
</li>
<li>Интеграция приложений:
<ul>
<li>Mollom использует открытый API, который может быть интегрирован в любую систему.</li>
<li>Библиотеки: Java, PHP, Ruby и другие.</li>
<li>Готовые модули: Drupal, Joomla, WordPress и прочие системы управления контентом.</li>
<li>Решения от сторонних разработчиков, основанные на примерах кода от  Mollom.</li>
</ul>
</li>
<li>Для мониторинга здоровья серверов они используют Munin:
<ul>
<li>Каков размер heap памяти после сбора мусора?</li>
<li>Каково количество доступных соединений?</li>
<li>Каково количество thread&#8217;ов в пуле?</li>
<li>Оценка времени блокировок в каждом thread&#8217;е.</li>
</ul>
</li>
<li>Если взглянуть в целом на архитектуру Mollom, можно увидеть, что они стараются построить систему, способную прозрачно работать в нескольких датацентрах, чтобы позволить горизонтально расширить систему, когда они перерастут текущую двухсерверную конфигурацию:
<ul>
<li>Балансировка нагрузки на клиенте позволяет выбирать оптимальный сервер и справляться со сбоями одного из них.</li>
<li>Кластеризация Glassfish облегчает добавление/удаление новых машин и позволяет перехватывать запросы, когда один из серверов выходит из строя.</li>
<li>Cassandra используется для управления данными между серверами в нескольких датацентрах.</li>
</ul>
</li>
<li>Инсталляция Mollom в Netlog обладает некоторыми интересными характеристиками. Она обрабатывает больше сообщений, чем основные сервера Mollom, но распределение спама в ней совершенно другое, так как люди в ней общаются в рамках социальной сети. Внутри Netlog лишь 10% сообщений является спамом, когда в суровом мире информационных порталов распределение обратно. Интересным следствием является тот факт, что обработка нормальных сообщений требует меньше вычислительных ресурсов, так что на аналогичном оборудовании удается обрабатывать больший поток сообщений.</li>
<li>Изначально они думали о виртуализированных серверах, в частности об Amazon EC2, но в итоге обнаружилось, что наиболее узким местом являются операции ввода-вывода &#8212; низкая производительность дисковой подсистемы в виртуальных машинах создавали реальные проблемы, так что они решили воспользоваться вертикальным масштабированием и переехали на более дорогие физические машины с большим объемом дискового пространства:
<ul>
<li>На удивление они не упираются в вычислительные ресурсы: лишь два ядра из 8 занимаются вычислениями, когда остальные же работают над операциями ввода-вывода.</li>
<li>Трафик Mollom практически постоянен, так что физические сервера более эффективны с финансовой точки зрения. Они рассматривают Amazon лишь как запасной вариант для обработки непредвиденных пиков нагрузки.</li>
</ul>
</li>
<li>Процесс разработки:
<ul>
<li>Команда распределена: трое в Бельгии, остальные в Техасе, Бостоне и Германии.</li>
<li>Scrum используется в процессе разработки и они довольны этой методологией. Scrum-собрание проходит через Skype в два часа дня по Бельгии.</li>
<li>Разработчики работают локально и отправляют код на Unfuddle.</li>
<li>Hudson используется для непрерывного интеграционного тестирования. Hudson позволил облегчить миграцию, так как перед развертыванием все тесты должны быть пройдены. Они не теряли лишнего времени на проблемах, обнаруженных уже в развернутом приложении.</li>
<li>Они активно используют автоматическое тестирование: юнит-тесты, системные тесты, тесты Drupal.</li>
<li>Развертывание по-прежнему делается вручную для минимизации риска простоя (что правда спорный момент).</li>
<li>Для обнаружения утечек памяти они используют анализ дампов оперативной памяти. Анализ дампа сервера с 16Гб памяти &#8212; дело непростое, практически невозможное на обычном компьютере, так что они арендуют большую виртуальную машину на Amazon для проведения анализа. Весь процесс занимает всего около 2 часов. Они сравнивают два дампа: через 10 и 20 часов после запуска сервера. Если обнаруживаются значительные отличия, то скорее всего дело в утечке памяти.</li>
</ul>
</li>
</ul>
<h2>Пути развития</h2>
<ul>
<li>Mollom API основано на XML-RPC, REST-интерфейс находится на стадии тестирования для облегчения интеграции других сервисов.</li>
<li>Они мигрировали на Cassandra, чтобы облегчить процесс горизонтального масштабирования, когда нагрузка достигнет соответствующего уровня.</li>
<li>Скоро будут выпущены корпоративные возможности, которые позволят работать с сотнями сайтов как с единым целым. Появится возможность легко модерировать несколько сайтов одновременно по эмоциональной окраске сообщений, рейтингу спама или удалить все сообщения с определенного IP-адреса.</li>
<li>Они думали над участием в бизнесе потоковых данных вроде Twitter, но они сильно ограничены европейскими более строгими требованиями по приватности.</li>
<li>Планируются эксперименты по использованию Glassfish для балансировки нагрузки в рамках каждого датацентра.</li>
<li>Если нагрузка увеличится десятикратно им придется добавить больше серверов в Cassandra. Дисковый ввод-вывод является узким местом. Дополнительные сервера приложения понадобятся только если нагрузка вырастет более, чем на порядок.</li>
</ul>
<h2>Подводим итоги</h2>
<ul>
<li><strong>Mollom очень серьезно относится к разработке высокопроизводительной системы.</strong> Они гордятся тем, что Mollom очень эффективно использует вычислительные и финансовые ресурсы. Множество запросов может обрабатываться одним сервером с низкой задержкой, что очень радует как клиентов, так и владельцев проекта, так как издержки очень низки. Этот вопрос был выбран приоритетным с самого начала и они выбрали подходящие технологии для реализации своих целей. Это позволило им вкладывать средства в маркетинг, построить базу клиентов и создавать новые продукты на основе Mollom.</li>
<li><strong>Машинное обучение требует много исходных данных для успешного обнаружение спама.</strong> Для сбора этих данных предлагает бесплатные услуги. Крупные клиенты обеспечивают доход и получают выгоду от данных, полученных от более мелких клиентов. Эта модель очень хорошо себя проявила в машинном обучении, за которым как известно будущее.</li>
<li><strong>Старайтесь избавиться от проблем, не связанных напрямую с продуктом.</strong> Большие системы требуют серьезных усилий на разработку инфраструктуры. Можно убить все время на построение инфраструктуры, вместо создания по-настоящему ценного продукта (классификаторов, системы репутации, клиентских библиотек). Mollom постоянно пытались максимально избавляться от лишних проблем, именно по-этому они выбрали Cassandra и Glassfish.</li>
<li><strong>Будьте осторожны с клиентским кодом.</strong> Выполнение кода на клиентской части привлекательно тем, что он тратит чужие ресурсы, а не серверные. Проблемы начинаются когда сторонние библиотеки разрабатываются некачественно, что заставляет систему в целом работать плохо. Плотно работайте с разработчиками клиентских библиотек для повышения качества их продукции.</li>
<li><strong>Отдавайте приоритет платящим клиентам.</strong> Платящие клиенты получают более высокое качество услуг, обрабатываются вне очереди, получают меньше задержек и получают доступ к запасному серверу когда основной дал сбой. Этого вполне достаточно, чтобы подтолкнуть клиентов платить.</li>
<li><strong>Уменьшайте объем кода, позволяя используемым сторонним продуктам брать на себя грязную работу</strong>. Поначалу код Mollom был существенно большим по объему, чем сейчас. Использование Cassandra и Glassfish позволило убрать массу кода, связанного с кэшированием, кластеризацией, репликацией и обработкой сбоев. Упрощайте систему со временем.</li>
<li><strong>Минимизируйте блокировки.</strong> Mollom потратили много времени на устранение блокировок внутри Glassfish, так как это начинало становиться узким местом. Минимизируйте простой от блокировок для достижения полного параллелизма.</li>
</ul>
<h2>Источники информации и дополнительные материалы</h2>
<ul>
<li><a href="http://highscalability.com/blog/2011/2/8/mollom-architecture-killing-over-373-million-spams-at-100-re.html" target="_blank">Mollom Architecture &#8212; Killing Over 373 Million Spams At 100 Request Per Second</a> (основной источник информации)</li>
<li><a href="http://mollom.com/files/mollom-technical-whitepaper.pdf" target="_blank">Mollom Technical Whitepaper</a></li>
<li><a href="http://blogs.sun.com/glassfishpodcast/entry/episode_072_mollom_com_s" target="_blank">Episode #072 &#8212; Mollom.com&#8217;s GlassFish backend with Dries and Johan</a></li>
<li><a href="http://buytaert.net/mollom-gets-a-new-backend" target="_blank">Mollom gets a new backend</a></li>
<li><a href="http://blogs.lodgon.com/johan/" target="_blank">Fighting spam with Mollom on Glassfish</a></li>
<li><a href="http://mollom.com/api">Mollom API</a></li>
</ul>
<p><strong><em>Если Вам понравилась данная статья, можете ознакомиться с другими <a href="/highload">материалами по архитектуре высоконагруженных систем</a> и <a href="/feed">подписаться на RSS</a>.</em></strong></p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-mollom/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>Архитектура Вконтакте</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-vkontakte/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-vkontakte/#comments</comments>
		<pubDate>Thu, 28 Oct 2010 17:12:52 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Apache]]></category>
		<category><![CDATA[C++]]></category>
		<category><![CDATA[Debian]]></category>
		<category><![CDATA[featured]]></category>
		<category><![CDATA[ffmpeg]]></category>
		<category><![CDATA[HAProxy]]></category>
		<category><![CDATA[highload]]></category>
		<category><![CDATA[Linux]]></category>
		<category><![CDATA[Memcached]]></category>
		<category><![CDATA[mod_php]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[nginx]]></category>
		<category><![CDATA[node.js]]></category>
		<category><![CDATA[openssl]]></category>
		<category><![CDATA[PHP]]></category>
		<category><![CDATA[XCache]]></category>
		<category><![CDATA[xfs]]></category>
		<category><![CDATA[Архитектура Вконтакте]]></category>
		<category><![CDATA[Вконтакте]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=641</guid>
		<description><![CDATA[Самая популярная социальная сеть в рунете пролила немного света на то, как же она работает. Представители проекта в лице Павла Дурова и Олега Илларионова на конференции HighLoad++ ответили на шквал вопросов по совершенно разным аспектам работы Вконтакте, в том числе и техническим. Спешу поделиться своим взглядом на архитектуру проекта по результатам данного выступления. Платформа Debian [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.insight-it.ru/wp-content/uploads/2010/10/vkontakte-512x512.png"><img class="alignleft size-medium wp-image-655" style="float: left; margin: 0 8px; border: 0!important;" title="Логотип Вконтакте" src="http://www.insight-it.ru/wp-content/uploads/2010/10/vkontakte-512x512-150x150.png" alt="Логотип Вконтакте" width="125" height="125" /></a><br />
Самая популярная социальная сеть в рунете пролила немного света на то, как же она работает. Представители проекта в лице Павла Дурова и Олега Илларионова на конференции <a href="http://www.insight-it.ru/life/highload-2010/" target="_blank">HighLoad++</a> ответили на шквал вопросов по совершенно разным аспектам работы <a href="http://www.vkontakte.ru" target="_blank">Вконтакте</a>, в том числе и техническим. Спешу поделиться своим взглядом на архитектуру проекта по результатам данного выступления.<span id="more-641"></span></p>
<h2>Платформа</h2>
<ul>
<li><a href="/tag/debian" target="_blank">Debian</a> <a href="/tag/linux" target="_blank">Linux</a> &#8212; основная операционная система</li>
<li><a href="/tag/nginx" target="_blank">nginx</a> &#8212; балансировка нагрузки</li>
<li><a href="/tag/php" target="_blank">PHP</a> + <a href="/tag/xcache" target="_blank">XCache</a></li>
<li><a href="/tag/apache" target="_blank">Apache</a> + <a href="/tag/mod_php" target="_blank">mod_php</a></li>
<li><a href="/tag/memcached" target="_blank">memcached</a></li>
<li><a href="/tag/mysql" target="_blank">MySQL</a></li>
<li>Собственная СУБД на <a href="/tag/c" target="_blank">C</a>, созданная &#171;лучшими умами&#187; России</li>
<li><a href="/tag/node-js" target="_blank">node.js</a> &#8212; прослойка для реализации XMPP, живет за <a href="/tag/haproxy" target="_blank">HAProxy</a></li>
<li>Изображения отдаются просто с файловой системы <a href="/tag/xfs">xfs</a></li>
<li><a href="/tag/ffmpeg">ffmpeg</a> &#8212; конвертирование видео</li>
</ul>
<h2>Статистика</h2>
<ul>
<li>95 миллионов учетных записей</li>
<li>40 миллионов активных пользователей во всем мире (сопоставимо с аудиторией интернета в России)</li>
<li>11 миллиардов запросов в день</li>
<li>200 миллионов личных сообщений в день</li>
<li>Видеопоток достигает 160Гбит/с</li>
<li>Более 10 тысяч серверов, из которых только 32 &#8212; фронтенды на <a href="/tag/nginx" target="_blank">nginx</a> (количество серверов с <a href="/tag/apache" target="_blank">Apache </a>неизвестно)</li>
<li>30-40 разработчиков, 2 дизайнера, 5 системных администраторов, много людей в датацентрах</li>
<li>Каждый день выходит из строя около 10 жестких дисков</li>
</ul>
<h2>Архитектура</h2>
<h3>Общие принципы</h3>
<ul>
<li>Cервера многофункциональны и используются одновременно в нескольких ролях:
<ul>
<li>Перебрасывание полуавтоматическое</li>
<li>Требуется перезапускать daemon&#8217;ы</li>
</ul>
</li>
<li>Генерация страниц с новостями (микроблоги) происходит очень похожим образом с <a href="/tag/facebook" target="_blank">Facebook</a> (см. <a href="/masshtabiruemost/arkhitektura-facebook/" target="_blank">Архитектура  Facebook</a>), основное отличие &#8212; использование собственной СУБД вместо MySQL</li>
<li>При балансировке нагрузки используются:
<ul>
<li>Взвешенный round robin внутри системы</li>
<li>Разные сервера для разных типов запросов</li>
<li>Балансировка на уровне ДНС на 32 IP-адреса</li>
</ul>
</li>
<li>Большая часть внутреннего софта написано самостоятельно, в том числе:
<ul>
<li>Собственная СУБД (см. ниже)</li>
<li>Мониторинг с уведомлением по СМС (Павел сам помогал верстать интерфейс <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />  )</li>
<li>Автоматическая система тестирования кода</li>
<li>Анализаторы статистики и логов</li>
</ul>
</li>
<li>Мощные сервера:
<ul>
<li>8-ядерные процессоры Intel (по два на сервер, видимо)</li>
<li>64Гб оперативной памяти</li>
<li>8 жестких дисков (соответственно скорее всего корпуса 2-3U)</li>
<li>RAID не используется</li>
<li>Не брендированные, собирает компания ТехноОкта</li>
</ul>
</li>
<li>Вычислительные мощности серверов используются менее, чем на 20%</li>
<li>Сейчас проект расположен в 4 датацентрах в Санкт-Петербурге и Москве, причем:
<ul>
<li>Вся основная база данных располагается в одном датацентре в Санкт-Петербурге</li>
<li>В Московских датацентрах только аудио и видео</li>
<li>В планах сделать репликацию базы данных в другой датацентр в ленинградской области</li>
</ul>
</li>
<li><a href="/tag/cdn">CDN</a> на данный момент не используется, но в планах есть</li>
<li>Резервное копирование данных происходит ежедневно и инкрементально</li>
</ul>
<h3>Волшебная база данных на <a href="/tag/c" target="_blank">C</a></h3>
<p>Этому продукту, пожалуй, уделялось максимум внимания аудитории, но при этом почти никаких подробностей о том, что он собственно говоря собой представляет, так и не было обнародовано. Известно, что:</p>
<ul>
<li>Разработана &#171;лучшими умами&#187; России, победителями олимпиад и конкурсов топкодер; озвучили даже имена этих &#171;героев&#187; Вконтакте (писал на слух и возможно не всех успел, так что извиняйте):
<ul>
<li>Андрей Лопатин</li>
<li>Николай Дуров</li>
<li>Арсений Смирнов</li>
<li>Алексей Левин</li>
</ul>
</li>
<li>Используется в огромном количестве сервисов:
<ul>
<li>Личные сообщения</li>
<li>Сообщения на стенах</li>
<li>Статусы</li>
<li>Поиск</li>
<li>Приватность</li>
<li>Списки друзей</li>
</ul>
</li>
<li>Нереляционная модель данных</li>
<li>Большинство операций осуществляется в оперативной памяти</li>
<li>Интерфейс доступа представляет собой расширенный протокол <a href="/tag/memcached" target="_blank">memcached</a>, специальным образом составленные ключи возвращают результаты сложных запросов (чаще всего специфичных для конкретного сервиса)</li>
<li>Хотели бы сделать из данной системы универсальную СУБД и опубликовать под GPL, но пока не получается из-за высокой степени интеграции с остальными сервисами</li>
<li>Кластеризация осуществляется легко</li>
<li>Есть репликация</li>
<li>Если честно, я так и не понял зачем им <a href="/tag/mysql" target="_blank">MySQL </a>с такой штукой &#8212; возможно просто как legacy живет со старых времен</li>
</ul>
<h3>Аудио и видео</h3>
<p>Эти подпроекты являются побочными для социальной сети, на них особо не фокусируются. В основном это связанно с тем, что они редко коррелируют с основной целью использования социальной сети &#8212; <em>общением</em>, а также создают большое количество проблем: видеотраффик &#8212; основная статья расходов проекта, плюс всем известные проблемы с нелегальным контентом и претензиями правообладателей. Медиа-файлы банятся по хэшу при удалении по просьбе правообладателей, но это неэффективно и планируется усовершенствовать этот механизм.</p>
<p>1000-1500 серверов используется для перекодирования видео, на них же оно и хранится.</p>
<h3>XMPP</h3>
<p>Как известно, некоторое время назад появилась возможность общаться на Вконтакте через протокол Jabber (он же XMPP). Протокол совершенно открытый и существует масса opensource реализаций.</p>
<p>По ряду причин, среди которых проблемы с интеграцией с остальными сервисами, было решено за месяц создать собственный сервер, представляющий собой прослойку между внутренними сервисами Вконтакте и реализацией XMPP протокола. Основные особенности этого сервиса:</p>
<ul>
<li>Реализован на <a href="/tag/node-js">node.js</a> (выбор обусловлен тем, что JavaScript знают практически все разработчики проекта, а также хороший набор инструментов для реализации задачи)</li>
<li>Работа с большими контакт-листами &#8212; у многих пользователей количество друзей на вконтакте измеряется сотнями и тысячами</li>
<li>Высокая активность смены статусов &#8212; люди появляются и исчезают из онлайна чаще, чем в других аналогичных ситуациях</li>
<li>Аватарки передаются в base64</li>
<li>Тесная интеграция с внутренней системой обмена личными сообщениями Вконтакте</li>
<li>60-80 тысяч человек онлайн, в пике &#8212; 150 тысяч</li>
<li><a href="/tag/haproxy" target="_blank">HAProxy</a> обрабатывает входящие соединения и используется для балансировки нагрузки и развертывания новых версий</li>
<li>Данные хранятся в <a href="/tag/mysql" target="_blank">MySQL</a> (думали о MongoDB, но передумали)</li>
<li>Сервис работает на 5 серверах разной конфигурации, на каждом из них работает код на<a href="/tag/node-js" target="_blank"> node.js</a> (по 4 процесса на сервер), а на трех самых мощных &#8212; еще и <a href="/tag/mysql" target="_blank">MySQL</a></li>
<li>В <a href="/tag/node-js" target="_blank">node.js</a> большие проблемы с использованием <a href="/tag/openssl" target="_blank">OpenSSL</a>, а также течет память</li>
<li>Группы друзей в XMPP не связаны с группами друзей на сайте &#8212; сделано по просьбе пользователей, которые не хотели чтобы их друзья из-за плеча видели в какой группе они находятся</li>
</ul>
<h3>Интеграция со внешними ресурсами</h3>
<p>Во Вконтакте считают данное направление очень перспективным и осуществляют массу связанной с этим работы. Основные предпринятые шаги:</p>
<ul>
<li>Максимальная кроссбраузерность для виджетов на основе библиотек easyXDM и fastXDM</li>
<li>Кросс-постинг статусов в <a href="/tag/twitter">Twitter</a>, реализованный с помощью очередей запросов</li>
<li>Кнопка &#171;поделиться с друзьями&#187;, поддерживающая openGraph теги и автоматически подбирающая подходящую иллюстрацию (путем сравнивание содержимых тега &lt;title&gt; и атрибутов alt у изображений, чуть ли не побуквенно)</li>
<li>Возможность загрузки видео через сторонние видео-хостинги (YouTube, RuTube, Vimeo, и.т.д.), открыты к интеграции с другими</li>
</ul>
<h2>Интересные факты не по теме</h2>
<ul>
<li>Процесс разработки близок к Agile, с недельными итерациями</li>
<li>Ядро операционной системы модифицированно (на предмет работы с памятью), есть своя пакетная база для <a href="/tag/debian">Debian</a></li>
<li>Фотографии загружаются на два жестких диска одного сервера одновременно, после чего создается резервная копия на другом сервере</li>
<li>Есть много доработок над <a href="/tag/memcached" target="_blank">memcached</a>, в.т.ч. для более стабильного и длительного размещения объектов в памяти; есть даже persistent версия</li>
<li>Фотографии не удаляются для минимизации фрагментации</li>
<li>Решения о развитии проекта принимают Павел Дуров и Андрей Рогозов, ответственность за сервисы &#8212; на них и на реализовавшем его разработчике</li>
<li>Павел Дуров откладывал деньги на хостинг с 1 курса <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </li>
</ul>
<h2>Подводим итоги</h2>
<p>В целом Вконтакте развивается в сторону увеличения скорости распространения информацию внутри сети. Приоритеты поменялись в этом направлении достаточно недавно, этим обусловлено, напимер, перенос выхода почтового сервиса Вконтакте, о котором очень активно говорили когда появилась возможность забивать себе текстовые URL вроде vkontakte.ru/ivan.blinkov. Сейчас этот подпроект имеет низкий приоритет и ждет своего часа, когда они смогут предложить что-то более удобное и быстрое, чем Gmail.</p>
<p>Завеса тайны насчет технической реализации Вконтакте была немного развеяна, но много моментов все же остались секретом. Возможно в будущем появится более детальная информация о собственной СУБД Вконтакте, которая как оказалось является ключом к решению всех самых сложных моментов в масштабируемости системы.</p>
<p>Как я уже упоминал этот пост написан почти на память, на основе небольшого конспекта &#171;круглого стола Вконтакте&#187;, так что хочется сразу извиниться за возможные неточности и недопонимания. Я лишь структурировал хаотичную кучу ответов на вопросы. Буду рад уточнениям и дополнениям.</p>
<p>Если хотите быть в курсе новых веяний в сфере масштабируемости высоконагруженных интернет-проектов &#8212; по традиции рекомендую <a href="/feed" target="_blank">подписаться на RSS</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-vkontakte/feed/</wfw:commentRss>
		<slash:comments>105</slash:comments>
		</item>
		<item>
		<title>Архитектура Facebook</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-facebook/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-facebook/#comments</comments>
		<pubDate>Wed, 20 Oct 2010 09:02:27 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[CDN]]></category>
		<category><![CDATA[Facebook]]></category>
		<category><![CDATA[featured]]></category>
		<category><![CDATA[HipHop]]></category>
		<category><![CDATA[Linux]]></category>
		<category><![CDATA[Memcached]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[ODS]]></category>
		<category><![CDATA[PHP]]></category>
		<category><![CDATA[Scribe]]></category>
		<category><![CDATA[Thrift]]></category>
		<category><![CDATA[Архитектура Facebook]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=579</guid>
		<description><![CDATA[На сегодняшний день Facebook является пожалуй самым обсуждаемым интернет-проектом во всем мире. Не смотря на довольно низкий уровень проникновения Facebook в России, темпы захвата аудитории этим проектом мягко говоря поражают. Как же им удается управляться с таким огромным социальным графом и удовлетворять потребности в общении невероятно большого количества людей по всему миру? Платформа Linux &#8212; [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.insight-it.ru/wp-content/uploads/2010/10/facebook_logo.jpg"><img class="alignleft size-full wp-image-584" style="border: 0!important; float: left; margin: 0 8px;" title="Facebook Logo" src="http://www.insight-it.ru/wp-content/uploads/2010/10/facebook_logo.jpg" alt="Facebook Logo" width="200" height="75" /></a>На сегодняшний день <a href="http://www.facebook.com" target="_blank">Facebook</a> является пожалуй самым обсуждаемым интернет-проектом во всем мире. Не смотря на довольно низкий уровень проникновения Facebook в России, темпы захвата аудитории этим проектом мягко говоря поражают. Как же им удается управляться с таким огромным социальным графом и удовлетворять потребности в общении невероятно большого количества людей по всему миру?</p>
<p><span id="more-579"></span></p>
<h2>Платформа</h2>
<ul>
<li><a href="/tag/linux" target="_blank">Linux</a> &#8212; операционная система</li>
<li><a href="/tag/php" target="_blank">PHP</a> с <a href="/tag/hiphop" target="_blank">HipHop</a> &#8212; код на PHP компилируется в C++</li>
<li><a href="/tag/memcached" target="_blank">memcached</a> &#8212; агрессивное кэширование объектов</li>
<li><a href="/tag/mysql" target="_blank">MySQL</a> &#8212; используется как хранилище пар ключ-значение, никаких join&#8217;ов</li>
<li><a href="/tag/thrift" target="_blank">Thrift</a> &#8212; интерфейс взаимодействия между сервисами, написанными на разных языках программирования</li>
<li><a href="/tag/scribe" target="_blank">Scribe</a> &#8212; универсальная система сбора и агрегации данных с рабочих серверов</li>
</ul>
<h2>Статистика</h2>
<ul>
<li>Более 500 миллионов активных пользователей (месячная аудитория)</li>
<li>Более миллиарда социальных связей</li>
<li>Более 200 миллиардов просмотров страниц в месяц</li>
<li>Более 4 триллионов действий попадает в новостные ленты каждый день</li>
<li>Более 150 миллионов обращений к кэшу в секунду; 2 триллиона объектов в кэше</li>
<li>Более 8 миллиардов минут провели пользователи на Facebook&#8217;е ежедневно</li>
<li>Более 3 миллиардов фотографий загружается каждый месяц, до 1.2 миллиона фотографий в секунду</li>
<li>20 миллиардов фотографий в 4 разрешениях = 80 миллиардов фотографий, их бы хватило чтобы покрыть поверхность земли в 10 слоев; это больше, чем на всех других фото-ресурсах в месте взятых</li>
<li>О более чем 5 миллиардах единиц контента рассказывается друзьям еженедельно</li>
<li>Более миллиарда сообщений в чате каждый день</li>
<li>Более ста миллионов поисковых запросов в день</li>
<li>Более 250 приложений и 80 тысяч сторонних ресурсов на платформе Facebook Connect</li>
<li>Более 400 тысяч разработчиков сторонних приложений</li>
<li>Менее 500 разработчиков и системных администраторов в штате</li>
<li>Более миллиона активных пользователей на одного инженера</li>
<li>Десятки тысяч серверов, десятки гигабит трафика</li>
</ul>
<h2>Архитектура</h2>
<h3>Общие принципы</h3>
<ul>
<li>Балансировщик нагрузки выбирает веб-сервер для обработки запроса</li>
<li>PHP-код в веб-сервере подготавливает HTML, пользуясь данными из различных источников:
<ul>
<li>MySQL</li>
<li>memcached</li>
<li>Специализированные сервисы</li>
</ul>
</li>
<li>Если взглянуть с другой стороны, то получим трехуровневую архитектуру:
<ul>
<li>Вер-приложение</li>
<li>Распределенный индекс</li>
<li>Постоянное хранилище</li>
</ul>
</li>
<li>Использование открытых технологий там, где это возможно</li>
<li>Поиск возможностей оптимизации используемых продуктов</li>
<li>Философия Unix:
<ul>
<li>Старайтесь делать каждый компонент системы простым и производительным</li>
<li>Комбинируйте компоненты для решения задач</li>
<li>Концентрируйте внимание на хорошо обозначенных точках взаимодействия</li>
</ul>
</li>
<li>Все усилия направлены на масштабируемость</li>
<li>Попытки минимизации количества точек отказа</li>
<li>Простота, простота, простота!</li>
</ul>
<h3>PHP</h3>
<p><strong>Почему PHP?</strong></p>
<ul>
<li>Во многом &#171;так исторически сложилось&#187;</li>
<li>Хорошо подходит для веб-разработки</li>
<li>Легок в изучении: небольшой набор выражений и языковых конструкций</li>
<li>Легок в написании: нестрогая типизация и универсальный &#171;массив&#187;</li>
<li>Легок в чтении: синтаксис похож на C++ и Java</li>
<li>Прост в дебаггинге: нет необходимости в перекомпиляции</li>
<li>Большой ассортимент библиотек, актуальных для веб-проектов</li>
<li>Подходит для процесса разработки с короткими итерациями</li>
<li>Активное сообщество разработчиков по всему миру</li>
<li>Динамическая типизация, интерпретируемый язык для скриптов</li>
</ul>
<p><strong>Как оказалось на самом деле?</strong></p>
<ul>
<li>Высокий расход оперативной памяти и вычислительных ресурсов</li>
<li>Сложно работать, когда объем исходного кода очень велик: слабая типизация и ограниченные возможности для статичного анализа и оптимизации кода</li>
<li>Не особо оптимизирован для использования в крупных проектах</li>
<li>Линейный рост издержек при подключении файлов с исходным кодом</li>
<li>Механизм разработки расширений не очень удобен</li>
</ul>
<p><strong>Доработки:</strong></p>
<ul>
<li>Оптимизация байт-кода</li>
<li>Улучшения в APC (ленивая загрузка, оптимизация блокировок, &#171;подогрев&#187; кэша)</li>
<li>Свои расширения (клиент memcache, формат сериализации, логи, статистика, мониторинг, механизм асинхронной обработки событий)</li>
<li><strong><a href="http://github.com/facebook/hiphop-php" target="_blank">HipHop</a></strong> &#8212; трансформатор исходных кодов:
<ul>
<li>Разработчики пишут на PHP, который конвертируется в оптимизированный C++</li>
<li>Статический анализ, определение типов данных, генерация кода, и.т.д.</li>
<li>Облегчает разработку расширений</li>
<li>Существенно сокращает расходы оперативной памяти и вычислительных ресурсов</li>
<li>У команды из трех программистов ушло полтора года на разработку, переписаны большая часть интерпретатора и многие расширения языка</li>
<li>Опубликован под opensource лицензией в начале года, нет необходимости проходить этот же путь с нуля</li>
</ul>
</li>
</ul>
<h3>MySQL</h3>
<p><strong>Как используется MySQL?</strong></p>
<ul>
<li>Используется как хранилище пар ключ-значение</li>
<li>Большое количество логических узлов распределено между физическими машинами</li>
<li>Балансировка нагрузке на уровне физических серверов</li>
<li>Репликация для распределения операций чтения <strong>не</strong> используется</li>
<li>Большинство запросов касаются самой свежей информации: оптимизация таблиц для доступа к новым данным, архивация старых записей</li>
<li>В целом быстро и надежно</li>
</ul>
<p><strong>Как оказалось на самом деле?</strong></p>
<ul>
<li>Логическая миграция данных <em>очень</em> сложна</li>
<li>Создавать большое количество логических баз данных и перераспределять их между физическими узлами, балансируя таким образом нагрузку, намного удобнее</li>
<li>Никаких join&#8217;ов на рабочих серверах баз данных</li>
<li>Намного проще наращивать вычислительные мощности на веб-серверах, чем на серверах баз данных</li>
<li>Схемы, основанные на структуре данных, делают программистов счастливыми и создают большую головную боль администраторам</li>
<li>Никогда не храните не-статичные данные в централизованное базе данных</li>
</ul>
<p><strong>Доработки:</strong></p>
<ul>
<li>Практически никаких модификаций исходного кода MySQL</li>
<li>Своя схема партиционирования с глобально-уникальными идентификаторами</li>
<li>Своя схема архивирования, основанная на частоте доступа к данным относительно каждого пользователя</li>
<li>Расширенный движок запросов для репликации между датацентрами и поддержания консистенции кеша</li>
<li>Библиотеки для доступа к данным на основе графа:
<ul>
<li>Объекты (вершины графа) с ограниченными типами данных (целое число, строка ограниченно длины, текст)</li>
<li>Реплицированные связи (ребра графа)</li>
<li>Аналоги распределенных внешних ключей (foreign keys)</li>
<li>Большинство данных распределено случайно</li>
</ul>
</li>
</ul>
<h3>Memcache</h3>
<p><strong>Как используется memcached?</strong></p>
<ul>
<li>Высокопроизводительная распределенная хэш-таблица</li>
<li>Содержит &#171;горячие&#187; данные из MySQL</li>
<li>Снижает нагрузку на уровень баз данных</li>
<li>Основная форма кэширования</li>
<li>Используется более 25TB памяти на нескольких тысячах серверов</li>
<li>Среднее время отклика менее 250 микро-секунд</li>
<li>Кэшируются сериализованные структуры данных PHP</li>
<li>Отсутствие автоматического механизма проверки консистенции данных между memcached и MySQL &#8212; приходится делать это на уровне программного кода</li>
<li>Множество multi-get запросов для получения данных на другом конце ребер графа</li>
<li>Ограниченная модель данных, неэффективен для маленьких объектов</li>
</ul>
<p><strong>Доработки:</strong></p>
<ul>
<li>Порт на 64-битную архитектуру</li>
<li>Более эффективная сериализация</li>
<li>Многопоточность</li>
<li>Улучшенный протокол</li>
<li>Компрессия</li>
<li>Проксирование запросов</li>
<li>Доступ к memcache через UDP:
<ul>
<li>уменьшает расход памяти благодаря отсутствию тысяч буферов TCP соединений</li>
<li>управление ходом исполнения приложение (оптимизация для multi-get)</li>
</ul>
</li>
<li>Статистика о работе потоков по запросу &#8212; уменьшает блокировки</li>
<li>Ряд изменений в ядре Linux для оптимизации работы memcache:
<ul>
<li>распределение управления сетевыми прерывания по всем ядрам</li>
<li>оппортунистический опрос сетевых интерфейсов</li>
</ul>
</li>
<li> После вышеперечисленных модификаций memcached способен выполнять до 250 тысяч операций в секунду, по сравнению со стандартными 30-40 тысячами без данных изменений</li>
</ul>
<h3>Thrift</h3>
<p><strong>Что это?</strong></p>
<ul>
<li>Легкий механизм построения приложений с использованием нескольких языков программирования</li>
<li>Высокая цель: предоставить механизм прозрачного взаимодействия между языками программирования.</li>
<li>Предоставляет язык описания интерфейсов, статический генератор кода</li>
<li>Поддерживаемые языки: <a href="/tag/c++" target="_blank">C++</a>, <a href="/tag/php" target="_blank">PHP</a>, <a href="/tag/python" target="_blank">Python</a>, <a href="/tag/java" target="_blank">Java</a>, <a href="/tag/ruby" target="_blank">Ruby</a>, <a href="/tag/erlang" target="_blank">Erlang</a>, <a href="/tag/perl" target="_blank">Perl</a>, <a href="/tag/haskell" target="_blank">Haskell</a> и многие другие</li>
<li>Транспорты: простой интерфейс для ввода-вывода (сокеты, файлы, буферы в памяти)</li>
<li>Протоколы: стандарты сериализации (бинарный, JSON)</li>
<li>Серверы: неблокирующие, асинхронные, как однопоточные, так и многопоточные</li>
</ul>
<p><strong>Почему именно Thrift?</strong></p>
<ul>
<li>Альтернативные технологии: SOAP, CORBA, COM, Pillar, Protocol Buffers &#8212; но у всех есть свои существенные недостатки, что вынудило Facebook создать свою технологию</li>
<li>Он быстрый, очень быстрый</li>
<li>Меньше рабочего времени тратится каждым разработчиком на сетевые интерфейсы и протоколы</li>
<li>Разделение труда: работа над высокопроизводительными серверами ведется отдельно от работы над приложениями</li>
<li>Общий инструментарий, знакомый всем разработчикам</li>
</ul>
<h3>Scribe</h3>
<p><strong>Что это?</strong></p>
<ul>
<li>Масштабированный распределенный механизм ведения логов</li>
<li>Перемещает данные с серверов в центральный репозиторий</li>
<li>Широкая сфера применения:
<ul>
<li>Логи поисковых запросов</li>
<li>Публикации в новостных лентах</li>
<li>Данные по A/B тестированиям</li>
</ul>
</li>
<li>Более надежен, чем традиционные системы логгирования, но недостаточно надежен для транзакций баз данных</li>
<li>Простая модель данных</li>
<li>Построен на основе Thrift</li>
</ul>
<h3>Хранение фотографий</h3>
<p><strong>Сначала сделали это просто:</strong></p>
<ul>
<li>Загрузка на сервер: приложение принимает изображение, создает миниатюры в нужных разрешениях, сохраняет в NFS</li>
<li>Загрузка с сервера: изображения отдаются из NFS через HTTP</li>
<li>NFS построена на коммерческих продуктах</li>
<li>Это было необходимо, чтобы сначала проверить, что продукт востребован пользователями и они правда будут активно загружать фотографии</li>
<li>На самом деле оказалось, что:
<ul>
<li> Файловые системы непригодны для работы с большим количеством небольших файлов</li>
<li>Метаданные не помещаются в оперативную память, что приводит к дополнительным обращениям к дисковой подсистеме</li>
<li>Ограничивающим фактором является ввод-вывод, а не плотность хранения</li>
</ul>
</li>
</ul>
<p><strong>Потом начали оптимизировать:</strong></p>
<ul>
<li>Кэширование более часто используемых миниатюр изображений в памяти на оригинальных серверах для масштабируемости, надежности и производительности</li>
<li>Распределение их по <a href="/tag/cdn">CDN</a> для уменьшения сетевых задержек</li>
<li>Возможно сделать еще лучше:
<ul>
<li>Хранение изображений в больших бинарных файлах (blob)</li>
<li>Сервис, отвечающий за фотографии имеет информацию о том, в каком файле и с каким отступом от начала расположена каждая фотография (по ее идентификатору)</li>
<li>Этот сервис в Facebook называется Haystack и он оказался в 10 раз эффективнее &#171;простого&#187; подхода и в 3 раза эффективнее &#171;оптимизированного&#187;</li>
</ul>
</li>
</ul>
<h3>Другие сервисы</h3>
<ul>
<li><strong>SMC</strong>: консоль управления сервисами &#8212; централизованная конфигурация, определение на какой физической машине работает логический сервис</li>
<li><strong>ODS</strong>:  инструмент для визуализации изменений любых статистических данных, имеющихся в системе; удобен для мониторинга и оповещений</li>
<li><strong>Gatekeeper:</strong> разделение развертывания и запуска, A/B тестирования, таргетированный запуск, постепенный запуск</li>
<li>И еще около 50 других сервисов&#8230;</li>
</ul>
<h2>Как это работает все вместе?</h2>
<h3>Новые альбомы друзей</h3>
<p style="text-align: center;"><a style="width: 100%; text-align: center;" href="http://www.insight-it.ru/wp-content/uploads/2010/10/fb.png"><img class="size-medium wp-image-583 aligncenter" style="border: 0pt none  ! important;" title="Facebook" src="http://www.insight-it.ru/wp-content/uploads/2010/10/fb-300x190.png" alt="Facebook Screenshot" width="300" height="190" /></a></p>
<ol>
<li>Получаем профиль по идентификатору пользователя (скорее всего из кэша, но потенциально возможно обращение к базе данных)</li>
<li>Получаем список друзей (опять же на основе идентификатора пользователя из кэша или из базы данных в случае промаха)</li>
<li>Параллельно запрашиваем идентификаторы последних 10 альбомов для каждого из друзей (multi-get, каждый промах мимо кэша индивидуально вытаскивается из MySQL)</li>
<li>Параллельно получаем данные о всех альбомах (на основе идентификаторов альбомов из предыдущего шага)</li>
<li>Все данные получены, выполняем логику отрисовки конкретной страницы на PHP</li>
<li>Отправляем HTML в браузер, пользователь счастлив <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </li>
</ol>
<h3>Новостная лента</h3>
<p style="text-align: center;"><a href="http://www.insight-it.ru/wp-content/uploads/2010/10/fb2.png"><img class="size-medium wp-image-588 aligncenter" style="border: 0pt none  ! important;" title="News Feed" src="http://www.insight-it.ru/wp-content/uploads/2010/10/fb2-300x199.png" alt="News Feed Screenshot" width="300" height="199" /></a></p>
<p style="text-align: center;"><a href="http://www.insight-it.ru/wp-content/uploads/2010/10/fb3.png"><img class="size-medium wp-image-589 aligncenter" style="border: 0pt none  ! important;" title="News Feed" src="http://www.insight-it.ru/wp-content/uploads/2010/10/fb3-300x180.png" alt="News Feed Scheme" width="300" height="180" /></a></p>
<h3>Поиск</h3>
<p style="text-align: center;"><a href="http://www.insight-it.ru/wp-content/uploads/2010/10/fb4.png"><img class="size-medium wp-image-590 aligncenter" style="border: 0pt none  ! important;" title="Search" src="http://www.insight-it.ru/wp-content/uploads/2010/10/fb4-300x199.png" alt="Search Screenshot" width="300" height="199" /></a></p>
<p style="text-align: center;"><a href="http://www.insight-it.ru/wp-content/uploads/2010/10/fb5.png"><img class="size-medium wp-image-591 aligncenter" style="border: 0pt none  ! important;" title="Search" src="http://www.insight-it.ru/wp-content/uploads/2010/10/fb5-300x184.png" alt="Search Scheme" width="300" height="184" /></a></p>
<h2>Подводим итоги</h2>
<p>LAMP не идеален</p>
<ul>
<li>PHP+MySQL+Memcache решает большинство задач, но не может решить совсем все:
<ul>
<li>PHP не может хранить состояния</li>
<li>PHP не самый производительный язык</li>
<li>Все данные находятся удаленно</li>
</ul>
</li>
<li>Facebook разрабатывает собственные внутренние сервисы, чтобы:
<ul>
<li>Располагать исполняемый код ближе к данным</li>
<li>Скомпилированное окружение более эффективно</li>
<li>Некоторая функциональность присутствует только в других языках программирования</li>
</ul>
</li>
<li>Философия сервисов:
<ul>
<li>Создание сервисов только при необходимости (минимизация издержек по развертке, поддержке и ведению отдельной кодовой базы; потенциальная дополнительная точка сбоя)</li>
<li>Создание общего набора инструментов для создания сервисов (Thrift, Scribe, ODS, средства мониторинга и уведомлений)</li>
<li><em>Использование правильных языка программирования, библиотек и инструментов для решения задачи</em></li>
</ul>
</li>
<li>Возвращение инноваций общественности &#8212; важный аспект разработки в Facebook:
<ul>
<li>Опубликованные свои проекты:
<ul>
<li>Thrift</li>
<li>Scribe</li>
<li>Tornado</li>
<li>Cassandra</li>
<li>Varnish</li>
<li>Hive</li>
<li>xhprof</li>
</ul>
</li>
<li>Доработки популярных решений:
<ul>
<li>PHP</li>
<li>MySQL</li>
<li>memcached</li>
</ul>
</li>
<li>Информация о взаимодействии Facebook с opensource-сообществом, этих и других проектах расположена на <a href="http://developers.facebook.com/opensource/">странице, посвященной opensource</a>.</li>
</ul>
</li>
<li>Ключевые моменты культуры разработки в Facebook:
<ul>
<li><strong>Двигайся быстро</strong> и не бойся ломать некоторые вещи</li>
<li><strong>Большое влияние</strong> маленьких команд</li>
<li><strong>Будь откровенным</strong> и инновационным</li>
</ul>
</li>
</ul>
<h2>Источники информации</h2>
<p>Данная статья не является переводом готовой статьи, в качестве источников информации послужили записи выступлений сотрудников Facebook на конференциях:</p>
<ul>
<li><a href="http://www.infoq.com/presentations/Facebook-Software-Stack" target="_blank">Facebook Architecture: Science and the Social Graph</a></li>
<li><a href="http://www.infoq.com/presentations/Facebook-Moving-Fast-at-Scale" target="_blank">Facebook: Moving Fast at Scale</a></li>
<li><a href="http://www.infoq.com/presentations/Scale-at-Facebook" target="_blank">Scale at Facebook</a></li>
</ul>
<p>Очень рекомендую посмотреть материалы в оригинале, так как естественно я осветил в статье далеко не все, да и неточности какие-либо неисключены. Помимо этого возможно многим будет интересно мероприятие <a href="http://styleru.timepad.ru/event/3571" target="_blank">&#171;Facebook: how we scaled to 500 000 000 users &#171;</a>, где Robert Johnson выступает 22 октября в Москве. Еще он числится в списке докладчиков <a href="http://www.highload.ru" target="_blank">Highload++</a> с аналогичным выступлением. Дополнительную информацию можно почерпнуть в <a href="http://facebook.com/eblog">блоге инженеров Facebook</a>.</p>
<p><strong>UPD:</strong> Обновил некоторые моменты после посещения вышеупомянутого выступления Роберта.</p>
<p>И по традиции напоминаю, что так как я пишу довольно редко &#8212; читать мой блог намного удобнее по <a href="/feed" target="_blank">RSS</a>. Спасибо за внимание <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-facebook/feed/</wfw:commentRss>
		<slash:comments>36</slash:comments>
		</item>
		<item>
		<title>Архитектура LinkedIn</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-linkedin/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-linkedin/#comments</comments>
		<pubDate>Thu, 11 Sep 2008 01:00:05 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[ActiveMQ]]></category>
		<category><![CDATA[C++]]></category>
		<category><![CDATA[EHcache]]></category>
		<category><![CDATA[Java]]></category>
		<category><![CDATA[Jetty]]></category>
		<category><![CDATA[LinkedIn]]></category>
		<category><![CDATA[Lucene]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[Oracle]]></category>
		<category><![CDATA[Solaris]]></category>
		<category><![CDATA[Spring]]></category>
		<category><![CDATA[Tomcat]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[архитектура LinkedIn]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=91</guid>
		<description><![CDATA[LinkedIn является крупнейшей в мире социальной сетью для профессионалов. Популярность этого проекта может быть далека, от более общетематических социальных сетей, таких как, скажем Facebook, но, тем не менее, нагрузка на серверную часть проекта создается пользователями серьезная. О том как этот проект с ней справляется и пойдет речь далее. Предисловие Сообщение о публикации двух презентаций c [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.linkedin.com" target="_blank" rel="nofollow">LinkedIn</a> является крупнейшей в мире социальной сетью для профессионалов. Популярность этого проекта может быть далека, от более общетематических социальных сетей, таких как, скажем Facebook, но, тем не менее, нагрузка на серверную часть проекта создается пользователями серьезная. О том как этот проект с ней справляется и пойдет речь далее.<br />
<span id="more-91"></span></p>
<h3>Предисловие</h3>
<p><em><br />
Сообщение о публикации двух презентаций c JavaOne 2008 о LinkedIn и их <a href="http://hurvitz.org/blog/2008/06/linkedin-architecture" target="_blank" rel="nofollow">обобщении</a> от Overn Hurvitz пронеслось по русскоязычным новостным ресурсам уже достаточно давно, но время черкнуть пару строк обо всем этом нашлось у меня только сейчас.</p>
<ul>
<li><a href="http://www.slideshare.net/linkedin/linkedins-communication-architecture" target="_blank" rel="nofollow">LinkedIn &#8212; A Professional Social Network Built with Java™ Technologies and Agile Practices</a></li>
<li><a href="http://www.slideshare.net/linkedin/linked-in-javaone-2008-tech-session-comm" target="_blank" rel="nofollow">LinkedIn Communication Architecture</a></li>
</ul>
<p></em></p>
<h3>Статистика</h3>
<ul>
<li>22 миллиона пользователей;</li>
<li>4+ миллиона уникальных посетителей в день;</li>
<li>40 миллионов просмотров страниц в день;</li>
<li>2 миллиона поисковых запросов в день;</li>
<li>ежедневно отправляются 250 тысяч приглашений;</li>
<li>1 миллион ответов в день;</li>
<li>2 миллиона электронных сообщений ежедневно.</li>
</ul>
<h3>Платформа</h3>
<ul>
<li><a href="/tag/solaris" target="_blank">Solaris</a> (как x86, так и SPARC)</li>
<li><a href="/tag/tomcat" target="_blank">Tomcat</a> и <a href="/tag/jetty" target="_blank">Jetty</a></li>
<li><a href="/tag/oracle" target="_blank">Oracle</a> и <a href="/tag/mysql" target="_blank">MySQL</a></li>
<li>Никакого ORM</li>
<li><a href="/tag/activemq" target="_blank">ActiveMQ</a> для JMS</li>
<li><a href="/tag/lucene" target="_blank">Lucene</a> в качестве основы для поиска</li>
<li><a href="/tag/spring" target="_blank">Spring</a> в роли &#171;клея&#187;</li>
</ul>
<h3>Серверная архитектура</h3>
<h4>2003-2005</h4>
<ul>
<li>одно монолитное веб-приложение;</li>
<li>одна общая база данных;</li>
<li>сетевой граф кэшируется в памяти в &#171;Облаке&#187;;</li>
<li>поиск пользователей реализован с помощью <a href="/tag/lucene" target="_blank">Lucene</a>, он работал на той же машине, что и &#171;Облако&#187;, так как поиск был отфильтрован в соответствии с сетью пользователя, таким образом было удобно совмещать эти две функции на одной машине;</li>
<li>веб-приложение напрямую обновляет базу данных, а она, в свою очередь, обновляет &#171;Облако&#187;.</li>
</ul>
<h4>2006</h4>
<ul>
<li>Добавлена репликация для уменьшения нагрузки на основную базу данных. Реплики предоставляют данные в режиме &#171;только для чтения&#187;, а репликация ведется в асинхронном режиме с помощью дополнительного компонента под названием Databus, с его появлением обновление данных стало выглядеть следующим образом:
<dl>
<dd>&ndash; сначала какие-либо изменения происходят в веб-приложении;</dd>
<dd>&ndash; веб-приложение обновляет основную базу данных;</dd>
<dd>&ndash; она, в свою очередь, отправляет обновления на Databus;</dd>
<dd>&ndash; далее уже Databus обновляет: реплики, Облако и поисковый индекс.</dd>
</dl>
</li>
<li>Поиск был вынесен на отдельный сервер.</li>
</ul>
<h4>2008</h4>
<ul>
<li>веб-приложение само по себе практически ничего не делает: бизнес логика распределена по отдельным сервисам;</li>
<li>веб-приложение все так же предоставляет пользователям графический интерфейс, но для его генерации она теперь вызывает сервисы;</li>
<li>каждый сервис имеет свою специфическую базу данных (т.е. вертикальное сегментирование);</li>
<li>такой подход позволяет другим приложениям (помимо основного) получать доступ к LinkedIn, такие приложения были созданы для работодателей, рекламных служб, и так далее.</li>
</ul>
<h3>Облако</h3>
<ul>
<li>&#171;Облаком&#187; в LinkedIn называют сервер, который кэширует весь граф социальной сети в памяти;</li>
<li>его размеры: 22 миллиона вершин и 120 миллионов ребер;</li>
<li>занимает 12GB оперативной памяти;</li>
<li>одновременно держится в памяти в 40 экземплярах;</li>
<li>построение Облака из данных, в дисковой системе, занимает 8 часов;</li>
<li>обновления происходят в режиме реального времени с помощью Databus;</li>
<li>во время остановки данные записываются на диск;</li>
<li>кэш реализован с помощью C++, а доступ предоставляется по JNI;</li>
<li>они выбрали именно C++ так как требовалось использовать минимум оперативной памяти, а также, задержки, связанные с Garbage Collection, были неприемлемыми.</li>
<li>размещение всех данных в памяти является ограничением, но, как удалось выяснить в LinkedIn, разбиение графов на части &#8212; не самая тривиальная задача.</li>
</ul>
<p>Облако кэширует целиком весь граф социальной сети LinkedIn, но на практике же пользователям требуется видеть его со своей точки зрения. Данная задача является вычислительно сложной, по-этому она выполняется лишь один раз при создании новой сессии, а затем система поддерживает результат в кэше. Такой подход требует 2 MB оперативной памяти на каждого активного пользователя. В течении сессии такой кэш обновляется только если сам пользователь сделал какие-либо изменения в нем, если же изменение вызвано другими пользователями &#8212; владелец сессии не заметит изменений.</p>
<p>Помимо этого используется кэширование профилей пользователей средствами <a href="/tag/ehcache" target="_blank">EHcache</a>. Одновременно в памяти хранится до 2 миллионов профилей (из 22 миллионов). Изначально планировалось использовать алгоритм <abbr title="Least Frequently Used">LFU</abbr>, но оказалось, что иногда <a href="/tag/ehcache" target="_blank">EHcache</a> зависал секунд на 30 во время перерасчета <abbr title="Least Frequently Used">LFU</abbr>, таким образом было принято решение о использовании вместо него алгоритма <abbr title="Least Recently Used">LRU</abbr>.</p>
<h3>Архитектура коммуникации</h3>
<p>Как известно, пользователи практически любой социальной сети генерируют огромное количество сообщений в единицу времени, причем каждый тип сообщений обычно требует индивидуального подхода, но в целом их можно разделить на две категории: постоянные и временные. В LinkedIn разработчики построили по отдельному сервису, для обработки каждой из этих категорий. Каждый из них определенно заслуживает отдельного внимания, так как общего в них мало.</p>
<h4>Сервис постоянных сообщений</h4>
<p>Этот коммуникационный сервис выполняет все операции, связанные с постоянными сообщениями: приватными сообщениями и электронной почтой. Перед ним ставится вполне тривиальный ряд задач: доставлять сообщения получателям и сохранять их на постоянной основе, но на самом деле этим все не ограничивается: должны также поддерживаться, скажем, доставка сообщений с задержкой, массовые рассылки, отмена отправки сообщения, возможность добавления в сообщения какого-либо интерактивного контента. Реализован он был примерно следующим образом:</p>
<ul>
<li>вся система работает асинхронно и активно использует JMS;</li>
<li>клиенты отправляют сообщения так же через JMS;</li>
<li>далее сообщения перенаправляются с помощью сервиса маршрутизации в соответствующий почтовый ящик или напрямую в обработку электронной почты;</li>
<li>доставка сообщений происходит как с помощью Pull (клиенты запрашивают свои сообщения), так и с использованием Push (т.е. отправки сообщений);</li>
<li>помимо этого используется <a href="/tag/spring" target="_blank">Spring</a> с их собственными закрытыми расширениями, использующими HTTP-RPC.</li>
</ul>
<h5>Приемы, способствующие масштабируемости</h5>
<ul>
<li><strong>Функциональное сегментирование:</strong> отправленные, полученные, архивные сообщения. <em>(т.е. вертикальное сегментирование)</em></li>
<li><strong>Классовое сегментирование:</strong> пользовательские, гостевые, корпоративные почтовые ящики.</li>
<li><strong>Сегментирование по диапазонам:</strong> по идентификаторам пользователей или по лексикографическим диапазонам самих сообщений. <em>(т.е. горизонтальное сегментирование)</em></li>
<li><strong>Асинхронное выполнение операций</strong>.</li>
</ul>
<h4>Сервис сетевых обновлений</h4>
<p>Этот сервис обеспечивает работу любых временных уведомлений, например, вызванных изменением статуса пользователей в контакт-листах. Такие сообщения должны с течением времени удаляться из-за быстрой потери актуальности, а также должна поддерживаться группировка и приоритезация сообщений. Функционирование этого сервиса оказалось не настолько очевидно, по сравнению с предыдущим, так что до итогового варианта было перепробовано масса менее удачных решений, но обо всем по порядку.</p>
<h5>Изначальная архитектура (до 2007 года)</h5>
<ul>
<li>используется много серверов, которые могут содержать обновления;</li>
<li>клиенты отправляют запросы на каждый сервис отдельно: вопросы, обновления профилей и т.д.</li>
<li>на сбор всех данных требовалось относительно много времени.</li>
</ul>
<p>В 2008 году вся эта система поэтапно эволюционировала собственно в сам сервис сетевых обновлений:</p>
<dl>
<dt><strong>Первая итерация</strong></dt>
<dd>
<ul>
<li>клиент отправляет единственный запрос сервису сетевых обновлений;</li>
<li>этот сервис в свою очередь параллельно отправляет всем остальным сервисам соответствующие запросы.</li>
<li>результаты аггрегируются и все вместе возвращаются клиенту;</li>
<li>весь процесс основывается на Pull.</li>
</ul>
</dd>
<dt><strong>Вторая итерация</strong></dt>
<dd>
<ul>
<li>стал использоваться метод Push: каждый раз, когда происходит какое-либо событие, они помещаются в пользовательский &#171;почтовый ящик&#187;, в момент запроса пользователя ему возвращается просто содержимое, уже ожидающее своего звездного часа в специально том самом &#171;ящике&#187;;</li>
<li>такой подход сильно ускоряет процесс чтения, так как на тот момент данные уже готовы;</li>
<li>с другой стороны, какая-то часть данных может так никогда и не понадобиться, что приводит к бесполезным передвижениям данных и лишнему используемому дисковому пространству;</li>
<li>небольшая часть обработки данных все же производится уже в момент запроса пользователя (например, объединение нескольких обновлений от определенного пользователя в одно);</li>
<li>обновления хранятся в <abbr title="Character Large OBject">CLOB</abbr>&#8216;ах: по одному <abbr title="Character Large OBject">CLOB</abbr>&#8216;у на каждый тип обновления для каждого пользователя (то есть в сумму около 15 <abbr title="Character Large OBject">CLOB</abbr>&#8216;ов на каждого пользователя);</li>
<li>сначала использовался размер <abbr title="Character Large OBject">CLOB</abbr>&#8216;ов равный 8 KB, что было явно больше требуемого и приводило к существенному количеству неиспользуемого дискового пространства.</li>
<li>вместо <abbr title="Character Large OBject">CLOB</abbr>&#8216;ов можно было бы использовать дополнительные таблици по одной на каждый тип обновлений, но в этом случае пришлось бы постоянно удалять из них устаревшие записи, что было бы чрезвычайно неэффективно. </li>
<li>в дополнение к этому использовался <abbr title="Java Management eXtensions">JMX</abbr> для мониторинга и изменения конфигурации в реальном времени, что оказалось очень удобным и полезным.</li>
</ul>
</dd>
<dt><strong>Третья итерация</strong></dt>
<dd>
<ul>
<li>Цель: повысить производительность путем сокращения количества обновлений <abbr title="Character Large OBject">CLOB</abbr>&#8216;ов, так как они требуют много вычислительных ресурсов.</li>
<li>Был добавлен буфер: колонки в таблицах типа <strong>varchar(4000)</strong>, в которых данные помещались изначально. При полном заполнении ячейки данные перемещаются в <abbr title="Character Large OBject">CLOB</abbr>; это позволило на порядок сократить количество их обновлений.</li>
<li>Уменьшен размер самих сообщений об обновлениях.</li>
</ul>
</dd>
</dl>
<h3>И напоследок пару советов от LinkedIn</h3>
<ul>
<li>нельзя бесконечно долго ограничиваться одной базой данных: используйте много баз данных как с вертикальным, так и с горизонтальным сегментированием данных;</li>
<li>забудьте о ссылочной целостности и кросс-серверных JOIN&#8217;ах;</li>
<li>забудьте о 100% целостности данных;</li>
<li>при большом масштабе издержки могут стать проблемой: оборудование, базы данных, лицензии, системы хранения данных, электроэнергия и так далее;</li>
<li>как только вы станете достаточно крупны и популярны, спаммеры и прочие злые люди не заставят себя долго ждать;</li>
<li>не забывайте про кэширование!!!</li>
<li>используйте асинхронные потоки данных;</li>
<li>аналитика и построение отчетов может стать непростой задачей, постарайтесь задуматься о них заранее в процессе планирования системы;</li>
<li>имейте всегда ввиду, что Ваша система может упасть в любой момент;</li>
<li>не стоит недооценивать траекторию своего роста.</li>
</ul>
<h3>P.S.</h3>
<p>Когда уже закончил переводить в голову пришла мысль, что если читателям будет интересно взглянуть на оригинальные презентации (хотябы ради иллюстрационного материала, который там вполне нагляден), то было бы проще сделать это прямо здесь, так что вот, для Вашего же удобства:</p>
<div style="width:425px;text-align:left;margin:20px 0;" id="__ss_416060"><a style="font:14px Helvetica,Arial,Sans-serif;display:block;margin:12px 0 3px 0;text-decoration:underline;" href="http://www.slideshare.net/linkedin/linkedins-communication-architecture?type=powerpoint" title="LinkedIn - A Professional Network built with Java Technologies and Agile Practices" rel="nofollow">LinkedIn &#8212; A Professional Network built with Java Technologies and Agile Practices</a><object style="margin:0px" width="425" height="355"><param name="movie" value="http://static.slideshare.net/swf/ssplayer2.swf?doc=linkedinbofjavaone2008-1210975769299886-8&#038;stripped_title=linkedins-communication-architecture" /><param name="allowFullScreen" value="true"/><param name="allowScriptAccess" value="always"/><embed src="http://static.slideshare.net/swf/ssplayer2.swf?doc=linkedinbofjavaone2008-1210975769299886-8&#038;stripped_title=linkedins-communication-architecture" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="425" height="355"></embed></object></div>
<div style="width:425px;text-align:left;margin:20px 0;" id="__ss_416059"><a style="font:14px Helvetica,Arial,Sans-serif;display:block;margin:12px 0 3px 0;text-decoration:underline;" href="http://www.slideshare.net/linkedin/linked-in-javaone-2008-tech-session-comm?type=powerpoint" title="LinkedIn Communication Architecture" rel="nofollow">LinkedIn Communication Architecture</a><object style="margin:0px" width="425" height="355"><param name="movie" value="http://static.slideshare.net/swf/ssplayer2.swf?doc=linkedinjavaone2008techsessioncomm-1211223608637383-9&#038;stripped_title=linked-in-javaone-2008-tech-session-comm" /><param name="allowFullScreen" value="true"/><param name="allowScriptAccess" value="always"/><embed src="http://static.slideshare.net/swf/ssplayer2.swf?doc=linkedinjavaone2008techsessioncomm-1211223608637383-9&#038;stripped_title=linked-in-javaone-2008-tech-session-comm" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="425" height="355"></embed></object></div>
<p><strong><em>Кстати если Вы еще не успели подписаться на <a href="/feed" target="_blank">RSS</a> &#8212; сейчас самое время!</em></strong></p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-linkedin/feed/</wfw:commentRss>
		<slash:comments>13</slash:comments>
		</item>
		<item>
		<title>Архитектура 37signals</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-37signals/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-37signals/#comments</comments>
		<pubDate>Thu, 05 Jun 2008 15:49:48 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Amazon S3]]></category>
		<category><![CDATA[Memcached]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[RoR]]></category>
		<category><![CDATA[Ruby on Rails]]></category>
		<category><![CDATA[Xen]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[архитектура 37signals]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=82</guid>
		<description><![CDATA[37signals больше всего известны благодаря выпуску в свет Ruby on Rails грамотному его использованию для запуска их очень популярных продуктов: Basecamp, Highrise, Backpack и Campfire. RoR как обычно пытаются винить во всех проблемах с производительностью, но 37signals казалось бы справляется с большой нагрузкой, используя вполне разумное количество вычислительных ресурсов. Источники информации Этот текст является переводом [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.37signals.com" target="_blank" rel="nofollow">37signals</a> больше всего известны благодаря выпуску в свет <a href="/tag/ruby-on-rails" target="_blank">Ruby on Rails</a> грамотному его использованию для запуска их очень популярных продуктов: Basecamp, Highrise, Backpack и Campfire. RoR как обычно пытаются винить во всех проблемах с производительностью, но 37signals казалось бы справляется с большой нагрузкой, используя вполне разумное количество вычислительных ресурсов.<br />
<span id="more-82"></span></p>
<h3>Источники информации</h3>
<p><em>Этот текст является переводом <a href="http://highscalability.com/37signals-architecture" target="_blank" rel="nofollow">статьи</a>, автор &#8212; <a href="http://highscalability.com/user/todd-hoff" target="_blank" rel="nofollow">Todd Hoff</a>. Извиняюсь за не сильно оригинальный контент (да и, как выяснилось, практически не технической направленности), но на написание своих полноценных текстов у меня последнее время все никак не хватает то креатива, то времени <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_sad.gif' alt=':(' class='wp-smiley' />  .</em></p>
<ul>
<li><a href="http://www.37signals.com/svn/posts/749-ask-37signals-numbers" target="_blank" rel="nofollow">Спросите 37signals: цифры?</a></li>
<li><a href="http://www.37signals.com/svn/posts/753-ask-37signals-how-do-you-process-credit-cards" target="_blank" rel="nofollow">Спросите 37signals: как вы работаете с кредитными картами?</a></li>
<li><a href="http://www.37signals.com/svn/posts/759-behind-the-scenes-at-37signals-support" target="_blank" rel="nofollow">За сценой 37signals: поддержка.</a></li>
<li><a href="http://www.37signals.com/svn/posts/772-ask-37signals-why-did-you-restart-highrise" target="_blank" rel="nofollow">Спросите 37signals: почему вы перезапустили Highrise?</a></li>
</ul>
<h3>Платформа</h3>
<ul>
<li><a href="/tag/ruby-on-rails" target="_blank" rel="nofollow">Ruby on Rails</a></li>
<li><a href="/tag/memcached" target="_blank" rel="nofollow">Memcached</a></li>
<li><a href="/tag/xen" target="_blank" rel="nofollow">Xen</a></li>
<li><a href="/tag/mysql" target="_blank" rel="nofollow">MySQL</a></li>
<li><a href="/tag/amazon-s3" target="_blank" rel="nofollow">Amazon S3</a> для хранения изображений</li>
</ul>
<h3>Статистика</h3>
<ul>
<li>30 серверов: от простых однопроцессорных файловых серверов до восьмипроцессорных серверов приложений, в сумме около 100 процессоров и 200 GB оперативной памяти.</li>
<li>В планах диагональное масштабирование: уменьшение количества серверов до 16, но более производительных &#8212; в сумме 92 процессоров и 230 GB RAM.</li>
<li>Виртуализация средствами <a href="/tag/xen" target="_blank">Xen</a> для более гибкого управления системой.</li>
<li>Basecamp (управление проектами)
<dl>
<dd>2000000 пользователей с учетными записями</dd>
<dd>13200000 задач</dd>
<dd>9200000 сообщений</dd>
<dd>12200000 комментариев</dd>
<dd>5500000 записей о распределении времени</dd>
</dl>
</li>
<li>Backpack (управление информацией для личного использования и малого бизнеса)
<dl>
<dd>Около миллиона страниц</dd>
<dd>6800000 задач</dd>
<dd>1500000 записей</dd>
<dd>829000 фотографий</dd>
<dd>370000 файлов</dd>
</dl>
</li>
<li>Общая статистика проектов (на ноябрь 2007 г.)
<dl>
<dd>5.9 TB загруженных пользователями данных</dd>
<dd>888 GB загружено (upload)</dd>
<dd>2 TB скачано (download)</dd>
</dl>
</li>
</ul>
<h3>Архитектура</h3>
<ul>
<li>Кэширование средствами <a href="/tag/memcached" target="_blank">memcached</a> уже используется, но они ищут способы более активно его применять. Позволяет достичь впечатляющих результатов в плане производительности.</li>
<li>Методы для составления URL используются вместо ручного их составления.</li>
<li>Используются стандартные ActiveRecord запросы,  но при необходимости они используют и ручную настройку.</li>
<li>Иногда они дорабатывают Rails, если сталкиваются с проблемами с производительностью.</li>
<li>Amazon S3 используется для хранения данных, загруженных пользователями. Разработчики очень довольны результатами.</li>
</ul>
<h3>Работа с кредитными картами</h3>
<ul>
<li><em>Ежемесячное выписывание счетов.</em> Это позволяет компаниям, занимающимся кредитными картами, чувствовать себя более комфортно, так как им не придется столкнуться с огромным количеством работы, если ваша фирма вдруг выйдет из бизнеса. Пользователям такой подход также по душе, так как издержки в итоге оказываются относительно невелики, а также не требуется подписание контракта, имеется возможность пользоваться сервисами необходимый промежуток времени и оплачивать именно ту сумму, которую потратили.</li>
<li><em>Получение учетной записи продавца услуг.</em> Кто-то определенно должен обрабатывать операции с кредитными картами. Они используют Chase Bank. Воспользуйтесь услугами кого-нибудь, кому вы доверяете, а когда масштаб ваших сделок станет существенным &#8212; будет возможность получить более выгодные условия контракта.</li>
<li>Они используют authorize.net в роли шлюза для процессинга операций с кредитными картами.</li>
<li>Ежемесячным выписыванием счетов занимается специально написанная для этого проекта система. Она запускается каждую ночь, отправляет счета нужным людям и записывает результаты выполненных операций.</li>
<li>В случае успеха счет-фактура высылается по электронной почте.</li>
<li>В случае каких-либо сбоев &#8212; пользователю отправляется объяснение причин.</li>
<li>Если три раза с помощью кредитной карты не удается оплатить счет &#8212; учетная запись замораживается до тех пор, пока не будет предоставлен платежеспособный номер кредитной карты.</li>
<li>Обработка ошибок является критичным моментом, так как проблемы с оплатой возникают достаточно часто.</li>
<li>Все продукты конвертируются для использования централизованным биллинговым сервисом.</li>
<li>Необходимо быть совместимыми с <a href="http://en.wikipedia.org/wiki/PCI_DSS" rel="nofollow" target="_blank">PCI DSS (Payment Card Industry Data Security Standard)</a>.</li>
<li>Пользуйтесь услугами шлюзов, это позволит не хранить номера кредитных карт на своем сайте, что сильно упрощает жизнь в плане безопасности. Некоторые из них предоставляют и биллинговые услуги, что позволяет также не заниматься этим самостоятельно.</li>
</ul>
<h3>Поддержка пользователей</h3>
<ul>
<li>Campfire используется для работы с клиентами. По сути эта система представляет собой групповой веб-чат с расширенными возможностями в виде опциональной защиты паролем, личных сообщений, обмена файлами, предпросмотра изображений, а также коллективного принятия решений.</li>
<li>Поднимаемые вопросы используются для поиска ошибок в коде, а обновление данных в SVN отображается прямо в процессе общения. Bugtracking система обходится стороной, что казалось бы должно лишь усложнять испровление неполадок, например из-за отсутствия возможности проследить связь между конкретным изменением в коде и вызвавшей его неполадкой.</li>
<li>Зато служба поддержки может решать проблемы клиентов с помощью общения в чате в реальном времени, с возможностью обмена изображениями и снимками экранов, демонстрирующими неисправность.</li>
<li>Разработчики также всегда доступны с помощью Campfire для помощи в решении проблем клиентов.</li>
</ul>
<h3>Подводим итоги</h3>
<ul>
<li>Возьмите пример с <a href="/tag/amazon" rel="nofollow" target="_blank">Amazon</a> и постройте все внутрение функции в виде сервисов с самого начала. Это позволит более легко использовать их в разных продуктах и прозрачно обновлять предоставляемые возможности.</li>
<li>Не храните номера кредитных карт внутри своей базы данных &#8212; это существенно снижает риски, связанные с безопасностью.</li>
<li>Разработчики и пользователи должны иметь возможность легко общаться друг с другом публично. Пользователи получают сервис намного более высокого качества, если общаются напрямую с разработчиками, которые решают все проблемы прямо в рамках нормального хода процесса разработки. Это позволяет избежать нескольких излишних промежуточных этапов при обработке заявок о неиспраности. Помимо этого разработчикам предоставляется возможность узнать пользовательское мнение об их продукте, что делает дальнейшее развитие проекта более эффективным. Потенциальные клиенты могут убедиться в отзывчивости компании, просто посмотрев на такое общение, что подталкивает их к более охотной регистрации.</li>
<li>Развивайте свой продукт добавлением новых функций, которые нужны конкретным клиентам, а не тех, которые когда-нибудь может быть кому-нибудь понадобятся.</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-37signals/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>Архитектура Twitter</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-twitter/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-twitter/#comments</comments>
		<pubDate>Sat, 10 May 2008 09:36:30 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[AWStats]]></category>
		<category><![CDATA[Erlang]]></category>
		<category><![CDATA[Google Analytics]]></category>
		<category><![CDATA[Memcached]]></category>
		<category><![CDATA[mongrel]]></category>
		<category><![CDATA[Munin]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[Nagios]]></category>
		<category><![CDATA[Ruby on Rails]]></category>
		<category><![CDATA[Solaris]]></category>
		<category><![CDATA[Starling]]></category>
		<category><![CDATA[Twitter]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[архитектура Twitter]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=75</guid>
		<description><![CDATA[Twitter стартовал как побочный подпроект, но не смотря на это темпы его роста были впечатляющими: путь от 0 до миллионов просмотров страниц занял всего несколько коротких месяцев. Ранние решения о проектировании системы неплохо справлялись с небольшими нагрузками, но они быстро таяли под напором огромного количества пользователей, желающих разослать весточки всем своим друзьям с ответом на [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.twitter.com" target="_blank" rel="nofollow">Twitter</a> стартовал как побочный подпроект, но не смотря на это темпы его роста были впечатляющими: путь от 0 до миллионов просмотров страниц занял всего несколько коротких месяцев. Ранние решения о проектировании системы неплохо справлялись с небольшими нагрузками, но они быстро таяли под напором огромного количества пользователей, желающих разослать весточки всем своим друзьям с ответом на простой вопрос: а чем ты занимаешься?</p>
<p>Поначалу все винили <a href="/tag/ror" target="_blank">Ruby on Rails</a> во всех проблемах с масштабированием, но Blaine Cook, главный архитектор Twitter, встал на его защиту:</p>
<blockquote><p>
Основной для нас на самом деле является проблема горизонтального масштабирования, с этой точки зрения <a href="/tag/ror" target="_blank">Ruby on Rails</a> ничем не хуже других языков программирования или framework&#8217;ов: переход на &#171;более быстрый&#187; язык программирования дал бы нам 10-20% прирост производительности, в то время архитектурные преобразования, легко реализованные средствами <a href="/tag/ror" target="_blank">Ruby on Rails</a>, сделали Twitter быстрее на 10000%.
</p></blockquote>
<p>Даже если <a href="/tag/ror" target="_blank">Ruby on Rails</a> оказался невиновен, как же тогда Twitter научился с его помощью рости до все больших и больших высот?<br />
<span id="more-75"></span></p>
<h3>Источники информации</h3>
<p><em>Этот текст является продолжением <a href="/highload" target="_blank">серии переводов</a>, автор <a href="http://highscalability.com/scaling-twitter-making-twitter-10000-percent-faster" target="_blank" rel="nofollow">оригинала</a> &#8212; Todd Hoff. На этот раз написать что-либо своими силами у меня не сложилось, все мысли ушли на другой пост, который я скоро опубликую, а перевод этот получился несколько менее строгим, чем обычно, но я думаю ничего страшного.</em></p>
<ul>
<li><a href="http://video.google.com/videoplay?docid=-7846959339830379167" target="_blank" rel="nofollow">Scaling Twitter Video</a> от Blaine Cook.</li>
<li><a href="http://www.slideshare.net/Blaine/scaling-twitter" target="_blank" rel="nofollow">Scaling Twitter Slides</a></li>
<li><a href="http://talklikeaduck.denhaven2.com/articles/2007/06/22/good-news" target="_blank" rel="nofollow">Good News</a> блог пост от Rick Denatale</li>
<li><a href="http://pragmati.st/2007/5/20/scaling-twitter" target="_blank" rel="nofollow">Scaling Twitter</a> блог пост от Patrick Joyce</li>
<li><a href="http://readwritetalk.com/2007/09/05/biz-stone-co-founder-twitter/" target="_blank" rel="nofollow">Twitter API Traffic is 10x Twitter’s Site</a></li>
<li><a href="http://www.slideshare.net/britt/a-small-talk-on-getting-big-113066" target="_blank" rel="nofollow">A Small Talk on Getting Big. Scaling a Rails App &#038; all that Jazz</a></li>
</ul>
<h3>Платформа</h3>
<ul>
<li><a href="/tag/ruby-on-rails" target="_blank">Ruby on Rails</a></li>
<li><a href="/tag/erlang" target="_blank">Erlang</a></li>
<li><a href="/tag/mysql" target="_blank">MySQL</a></li>
<li><a href="/tag/mongrel" target="_blank">Mongrel</a></li>
<li><a href="/tag/munin" target="_blank">Munin</a></li>
<li><a href="/tag/nagios" target="_blank">Nagios</a></li>
<li><a href="/tag/google-analytics" target="_blank">Google Analytics</a></li>
<li><a href="/tag/awstats" target="_blank">AWStats</a></li>
<li><a href="/tag/memcached" target="_blank">Memcached</a></li>
</ul>
<h3>Статистика</h3>
<ul>
<li>Более 350000 пользователей. Точная цифра, как обычно, держится в секрете.</li>
<li>Около 600 запросов в секунду.</li>
<li>В среднем система поддерживает 200-300 соединений в секунду. Максимум обычно достигается при значении 800.</li>
<li>MySQL обрабатывает примерно 2400 запросов в секунду.</li>
<li>180 экземпляров приложений на Rails, использующих Mongrel как веб-сервер.</li>
<li>1 MySQL сервер (одна большая машина с 8 ядрами) и 1 slave, используемый лишь для статистики и отчетов.</li>
<li>30+ процессов для выполнения произвольных работ.</li>
<li>8 Sun X4100</li>
<li>Обработка запроса обычно занимает у Rails 200 миллисекунд.</li>
<li>В среднем ответ на запрос к базе данных занимает 50-100 миллисекунд.</li>
<li>Более 16 GB выделено под <a href="/tag/memcached" target="_blank">memcached</a>.</li>
</ul>
<h3>Архитектура</h3>
<ul>
<li>Проект столкнулся с массой проблем, связанных с масштабируемостью. Маленькая птичка частенько давала сбои.</li>
<li>Изначально не было реализовано никаких форм мониторинга, графиков или статистики, это очень затрудняло обнаружение м решение возникающих проблем. Впоследствии были внедрены <a href="/tag/munin" target="_blank">Munin</a> и <a href="/tag/nagios" target="_blank">Nagios</a>. Разработчики столкнулись с некоторыми трудностями при использовании этих продуктов в <a href="/tag/solaris" target="_blank">Solaris</a>. Помимо этого был использован сервис Google Analytics, но от него обычно мало толку, особенно когда страницы даже не загружаются.</li>
<li>Активное использование кэширования средствами <a href="/tag/memcached" target="_blank">memcached</a>:
<dl>
<dd>- Например, если подсчет количества чего-либо выполняется медленно, намного эффективнее один раз запомнить результат в <a href="/tag/memcached" target="_blank">memcached</a>, чем каждый раз считать его заново.</dd>
<dd>- Получение информации о статусе своих друзей &#8212; непростая задача. Вместо использования запросов информация о статусе друзей обновляется в кэше. База данных совсем не используется. Такой подход позволяет получить предсказуемое время отклика (ограниченное сверху примерно 20 миллисекундами).</dd>
<dd>- Объекты ActiveRecord настолько велики, что кэширование их нецелесообразно. Критичные атрибуты хранятся в хэше, а остальная их часть подвергается &#171;ленивой загрузке&#187; в момент запроса на доступ.</dd>
<dd>- 90% запросов являются запросами к API. Таким образом кэширование страниц или их фрагментов становится бессмысленным, зато никто не мешает им кэшировать сами API запросы.</dd>
</dl>
</li>
<li>Внутренняя организация работы с сообщениями:
<dl>
<dd>- Сообщения очень активно используются: производители генерируют сообщения, они образуются в очереди, а затем распространяются по потребителем. Основная функция Twitter заключается в реализации своеобразного моста между различными форматами электронных сообщений (SMS, электронная почта, сервисы мгновенного обмена сообщениями и так далее).</dd>
<dd>- Чтобы инвалидировать в кэше информацию можно просто отправить внутреннее сообщение, зачем выполнять все действия синхронно?</dd>
<dd>- Изначально этот механизм основывался на DRb (distributed Ruby) &#8212; библиотека, позволяющая отправлять и принимать сообщения сообщения между удаленными Ruby-объектами по TCP/IP. Но она была несколько странноватой, да и являлось потенциально слабым местом с точки зрения стабильности.</dd>
<dd>- Со временем сервис перевели на Rinda, представляющую собой набор общих для всей системы очередей. Но и у нее были недостатки: все очереди были постоянными, а данные терялись при сбоях.</dd>
<dd>- Следующей попыткой был Erlang. Но однажды возникла проблема: каким образом сломавшийся сервер может продолжать работать, но при этом в очереди откуда-то возникли целых 20000 ожидающих пользователей? Разработчики не знали. На лицо явный недостаток документации&#8230;</dd>
<dd>- В конце концов решение было разработано своими силами: Twitter выпустил <a href="/tag/starling" target="_blank">Starling</a>, распределенный легковесный сервер очередей, написанный на Ruby и поддерживающий протокол memcache. Сейчас серверная часть Twitter управляется именно им.</dd>
<dd>- Распределенные очереди позволяют переживать сбои путем записи их на диск в критических ситуациях. Другие крупные интернет-проекты также часто пользуются таким подходом.</dd>
</dl>
</li>
<li>Работа с SMS осуществляется с помощью сторонних сервисов и предоставляемых ими шлюзов. Достаточно дорогое удовольствие.</li>
<li>Развертывание:
<dl>
<dd>- Просто запускаются дополнительные сервера с mongrel, более элегантного решения пока нет.</dd>
<dd>- Все внутренние ошибки выдаются пользователям, если обслуживающий их mongrel сервер на данный момент заменяется.</dd>
<dd>- Все сервера останавливаются одновременно. Отключение их по одному по определенным причинам не используется.</dd>
</dl>
</li>
<li>Неправильное использование сервиса:
<dl>
<dd>- Много времени сервис был не доступен, так как люди проходились специальными программами по сайту с целью добавить всех кто попадался под руку в друзья. 9000 друзей за 24 часа. Это просто-напросто останавливало работу сайта.</dd>
<dd>- Были разработаны средства для своевременного обнаружения таких ситуаций.</dd>
<dd>- Будте беспощадными, таких пользователей нужно просто удалять.</dd>
</dl>
</li>
<li>Сегментирование:
<dl>
<dd>- Пока оно только в планах, сейчас оно не используется.</dd>
<dd>- В будущем оно будет основываться на времени, а не на пользователях, так как запросы обычно очень локальны по времени.</dd>
<dd>- Сегментирование будет не так просто реализовать благодаря автоматическому запоминанию результатов выполнения функций для последующего повторного их использования. Никто не даст гарантии, что операции &#171;только для чтения&#187; на самом деле будут таковыми являться. Запись в slave, работающий в режиме  read-only, &#8212; не самая лучшая идея.</dd>
</dl>
</li>
<li>API Twitter генерирует в 10 раз больше трафика, чем сам сайт.
<dl>
<dd>- Их API &#8212; самая важная вещь из всех, что они разработали.</dd>
<dd>- Простота сервиса позволила разработчикам строить свои приложения поверх инфраструктуры Twitter, привнося все новые и новые идеи. Например, Twitterrific &#8212; красивый способ использовать Twitter в небольшой команде.</dd>
</dl>
</li>
<li>Мониторинг используется для остановки слишком больших процессов.</li>
</ul>
<h3>Подводим итоги</h3>
<ul>
<li>Общайтесь со своим сообществом. Не прячьтесь и не пытайтесь решить абсолютно все проблемы самостоятельно. Много отличных людей будут готовы помочь, достаточно лишь попросить.</li>
<li>Рассматривайте вашу стратегию масштабирования как бизнес-план. Соберите советы помощников для того чтобы облегчить для себя принятие решений.</li>
<li>Стройте свой проект сами. Twitter потратил много времени, пытаясь приспособить готовые решения других людей, которые казалось бы должны работать, но это оказалось не совсем так. Лучше построить какие-то вещи самостоятельно, чтобы иметь высокую степень контроля над ситуацией и иметь возможность привносить новые возможности как только они понадобились.</li>
<li>Ставьте перед своими пользователями разумные ограничения. На обычных пользователей это не повлияет, но когда кому-нибудь взбредет в голову попытаться сломать систему (а такой человек рано или поздно найдется) &#8212; они сыграют свою роль и спасут работоспособность системы.</li>
<li>Не делайте базу данных центральным узким местом системы, врядли Ваше приложение на самом деле требует гигантских операций по объединению данных из нескольких таблиц. Используйте кэширование, или проявите свою смекалку для поиска альтернативных способов достижения того же результата.</li>
<li>Предусмотрите возможность сегментирования с самого начала, тогда перед Вами всегда будут открыты пути для дальнейшего масштабирования.</li>
<li>Очень важно вовремя осознать, что сайт начинает работать медленно. Сразу стоит задуматься о системе отчетов для отслеживания потенциальных проблем.</li>
<li>Оптимизируйте базу данных:
<dl>
<dd>- Индексируйте все таблицы, Rails не будет делать это за Вас.</dd>
<dd>- Используйте &#171;explain&#187; для анализа выполнения запросов. Результаты могут не совпадать с Вашими ожиданиями.</dd>
<dd>- Денормализуйте данные. Один только этот совет порой может спасти ситуацию. Для примера, в Twitter хранят все ID друзей каждого пользователя вместе, это позволило избежать многих ресурсоемких запросов.</dd>
<dd>- Избегайте комплексного объединения данных из нескольких таблиц.</dd>
<dd>- Избегайте сканирования больших наборов данных.</dd>
</dl>
</li>
<li>Кэшируйте все, что только можно.</li>
<li>Тестируйте все максимально тщательно:
<dl>
<dd>- Когда Вы развертываете приложение, Вы должно быть уверены, что оно будет работать корректно.</dd>
<dd>- Они используют полный набор средств для тестирования. Таким образом, когда произошла неполадка в кэшировании, они узнали о ней еще до того как она на самом деле произошла.</dd>
</dl>
</li>
<li>Длительно функционирующие процессы стоит оформить в виде daemon&#8217;ов.</li>
<li>Используйте уведомления об исключительных ситуациях в совокупности с ведением логов, это необходимо для своевременного реагирования на них.</li>
<li>Не делайте глупостей!
<dl>
<dd>- Масштаб проект несколько меняет понятие &#171;глупость&#187;.</dd>
<dd>- Пытаться загрузить 3000 друзей в память одновременно может заставить сервер временно перестать функционировать, хотя когда друзей было всего 4 &#8212; этот механизм прекрасно работал.</dd>
</dl>
</li>
<li>Большая часть производительности зависит не от использованного языка программирования, а от продуманной структуры приложения.</li>
<li>Превратите свой сайт в открытый сервис с помощью создания API. Их API является ключом к успеху Twitter. Он позволяет пользователям создавать постоянно расширяющуюся экосистему вокруг Twitter, соревноваться с которой не так-то просто. Вы никогда не сможете сделать столько же работы, сколько смогут Ваши пользователи для Вас, Вам просто не хватит креативных идей. Так что не стесняйтесь, откройте свое приложение и сделайте интеграцию Вашего приложения с другими максимально простой и удобной!</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-twitter/feed/</wfw:commentRss>
		<slash:comments>25</slash:comments>
		</item>
		<item>
		<title>Архитектура LiveJournal</title>
		<link>http://www.insight-it.ru/unix-way/linux/arkhitektura-livejournal/</link>
		<comments>http://www.insight-it.ru/unix-way/linux/arkhitektura-livejournal/#comments</comments>
		<pubDate>Wed, 09 Apr 2008 21:24:04 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Linux]]></category>
		<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Apache]]></category>
		<category><![CDATA[Debian]]></category>
		<category><![CDATA[djabberd]]></category>
		<category><![CDATA[gearman]]></category>
		<category><![CDATA[Memcached]]></category>
		<category><![CDATA[MogileFS]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[opensource]]></category>
		<category><![CDATA[Perl]]></category>
		<category><![CDATA[Perlbal]]></category>
		<category><![CDATA[TheShwartz]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[архитектура LiveJournal]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/scalability/arkhitektura-livejournal/</guid>
		<description><![CDATA[LiveJournal был одним из первых сервисов, бесплатно предоставляющих всем желающим личный блог. Практически с самого начала своего существования в далеком 1999 году проект столкнулся с непрерывно растущим потоком желающих воспользоваться услугами сервиса. Как же проекту удалось справиться с предоставлением маленького кусочка интернета каждому желающему, обойдя при этом всех конкурентов? Источники информации Возможно Вы ожидали увидеть [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.livejournal.com" target="_blank" rel="nofollow">LiveJournal</a> был одним из первых сервисов, бесплатно предоставляющих всем желающим личный блог. Практически с самого начала своего существования в далеком 1999 году проект столкнулся с непрерывно растущим потоком желающих воспользоваться услугами сервиса. Как же проекту удалось справиться с предоставлением маленького кусочка интернета каждому желающему, обойдя при этом всех конкурентов?<br />
<span id="more-64"></span></p>
<h3>Источники информации</h3>
<p><em>Возможно Вы ожидали увидеть здесь очередной перевод статьи с английского, но тогда придется Вас разочаровать, на этот раз я решил попробовать свои силы в самостоятельном написании статьи на такую серьезную тему. Просьба особо сильно помидорами в меня не кидаться <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </em></p>
<p>Основным источником информации послужила <a target="_blank" rel="nofollow" href="http://video.google.com/videoplay?docid=-8953828243232338732">презентация Brad Fitzpatrick</a> в Токио.</p>
<h3>Платформа</h3>
<ul>
<li><a href="/tag/linux" target="_blank">Linux</a> (<a href="/tag/debian" target="_blank">Debian Sarge</a>)</li>
<li><a href="/tag/perl" target="_blank">Perl</a></li>
<li><a href="/tag/apache" target="_blank">Apache</a></li>
<li><a href="/tag/mysql" target="_blank">MySQL</a> 4.0/4.1 в основном с InnoDB</li>
<li><a href="/tag/perlbal" target="_blank">Perlbal</a>, веб-сервер и балансировщик нагрузки</li>
<li><a href="/tag/memcached" target="_blank">memcached</a> для распределенного кэширования</li>
<li><a href="/tag/mogilefs" target="_blank">MogileFS</a>, распределенная файловая система</li>
<li><a href="/tag/gearman" target="_blank">Gearman</a></li>
<li><a href="/tag/theshwartz" target="_blank">TheShwartz</a></li>
<li><a href="/tag/djabberd" target="_blank">djabberd</a></li>
</ul>
<div style="float: left; margin: 12px;">
<script type="text/javascript"><!--
google_ad_client = "pub-4223450581209002";
/* inline, 468x60, created 11/04/08 */
google_ad_slot = "6487924823";
google_ad_width = 468;
google_ad_height = 60;
//-->
</script><br />
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script>
</div>
<h3>Статистика</h3>
<ul>
<li>на данный момент 15320315 учетных записей; <em>(10.04.08)</em></li>
<li>из них активно используется 551589;</li>
<li>наиболее активно сервис используется в США и Российской федерации, а 2/3 пользователей &#8212; девушки и женщины;</li>
<li>более 15 миллионов новых записей в блогах за месяц;</li>
<li>более 50 миллионов просмотров страниц в день, при пиковой нагрузке &#8212; несколько тысяч в секунду <em>(сильно устаревшие цифры, 2004 год);</em></li>
<li>связь с внешним миром осуществляется через два BIG-IP (активный + в режиме ожидания) с автоматическим восстановлением работоспособности в случае сбоя в работе одного из них, защитой от DDoS, L7 набором правил, включая TCL;</li>
<li>более сотни серверов, насчет конфигурации известен только тот факт, что практически на каждом сервере установлены огромные объемы оперативной памяти (более 12 GB) для эффективного кэширования.</li>
</ul>
<h3>История</h3>
<ul>
<li>Все началось с одного обычного сервера. Он выполнял роль как веб-сервера так и базы данных. Единственный плюс такого подхода к организации работы оборудования &#8212; достаточно дешево. Само собой достаточно скоро этот сервер перестал справляться с нагрузкой.</li>
<li>Следующим шагом было разнесение веб-сервера и базы данных на разные серверы, всего их получилось два. По прежнему имелось два узла, сбой в которых означал недоступность сервиса. По прежнему вычислительная мощность такой системы оставалась более чем скромной.</li>
<li>Первым из тех двух серверов, как ни странно, перестал справляться с нагрузкой веб-сервер &#8212; докупили еще два. Веб-сервера три, внешний IP &#8212; один, теперь приходится как-то распределять нагрузку! А как добавить еще одну базу данных?</li>
<li>Новый сервер баз данных был подключен в роли slave к исходному, данные в нем обновлялись с помощью репликации, а обрабатывал он только операции чтения, оставив все операции записи первому серверу.</li>
<li>Есть предположения о том, к чему привело дальнейшее добавление новых серверов? Правильно &#8212; к полнейшему хаосу! Со временем стала возникать проблема масштабируемости баз данных. Операции чтения производились на каком-то одном сервере, но когда приходил запрос на запись данных, так или иначе данные приходилось производить обновление на каждом из slave серверов. В итоге выполнение синхронизации данных стало занимать подавляющее большинство процессорного времени slave серверов, что привело к отсутствию возможности продолжать масштабирование просто добавлением дополнительных серверов.</li>
<li>Пришло время задуматься над архитектурой системы и распределением операций записи. Основной целью стало избавиться от такой серьезной избыточности данных, так как это было практически пустой тратой времени копировать одни и те же данные на десяток машин, да еще и с RAID на каждой из них.</li>
<li>Наиболее эффективным подходом в такой ситуации является сегментирование базы данных. Все серверы баз данных разбиваются на небольшие кластеры. Каждый пользователь системы прозрачно привязывается к определенному кластеру, таким образом когда он обновляет свой блог или какие-либо еще данные, запись ведется в рамках только небольшой группы серверов, такой же принцип справедлив и для чтения.
<p>Применительно к LiveJournal эту схему лучше всего демонстрирует один из слайдов презентации, указанной в источниках информации:<br />
<a href="/wp-content/uploads/LJ-scheme.jpg" target="_blank"><img src="/wp-content/uploads/LJ-scheme-s.jpg" alt="Сегментирование базы данных в Livejournal" title="Механизм работы сегментированной базы данных в LiveJournal" /></a></p>
<p>При работе такой системы не используется auto_increment в <a href="/tag/mysql" target="_blank">MySQL</a>, а также используется составной primary key из номера пользователя и номера записи. Таким образом пространство имен объектов разбито на группы, соответствующие конкретному пользователю.</li>
<li>Дальнейшим развитием решения проблемы излишней избыточности данных может послужить отказ от кластеров, аналогичных по структуре исходному для хранения сегментов базы данных. Это может быть как вариант с общим на несколько серверов хранилищем данных, так и более низкоуровневая репликация данных средствами <abbr title="Distributed Replicated Block Device">DRBD</abbr> в совокупности с HeartBeat. Каждый из возможных вариантов кластеризации MySQL имеет массу положительных и отрицательных сторон, так что конкретного лидера среди них выделить достаточно сложно. Возможно именно это и подтолкнуло разработчиков построить собственное решение, комбинируя их с целью получения наилучшего эффекта.</li>
</ul>
<h3>Программное обеспечение</h3>
<p>В ситуации, когда не удавалось найти готового программного решения для какой-то конкретной задачи, они не боялись взяться за написание его самостоятельно, это стало одним из основных компонентов успеха проекта. Существенная часть программной платформы LiveJournal написана специально для этого проекта и выпущено под свободной лицензией с открытым исходным кодом, доступным в <a href="http://code.sixapart.com/" target="_blank" rel="nofollow">официальном SVN репозитории</a>.</p>
<h4>memcached</h4>
<p>Залогом быстрой загрузки любой страницы крупного интернет-проекта является кэширование. Но как всегда возникает вопрос: а на каком уровне обработки данных его стоит выполнять? Для динамических страниц недопустимо кэширование на уровне готовых страниц. Можно кэшировать на уровне mod_perl, но по сути это пустая трата оперативной памяти, так как создастся отдельный кэш для каждого потока <a href="/tag/apache" target="_blank">Apache</a>, и количество промахов мимо кэша будет огромно. Кэширование запросов MySQL или HEAP таблицы также не дали бы требуемого результата ввиду чрезвычайной распределенности базы данных.</p>
<p>Выходом из сложившейся ситуации стало написание собственной распределенной системы кэширования объектов, получившей название <a href="/tag/memcached" target="_blank">memcached</a>. Она позволяет:</p>
<ul>
<li>использовать для кэширования свободную оперативную память практически любого компьютера, задействованного в системе;</li>
<li>кэшировать объекты практически любого языка программирования в сериализованном виде: <a href="/tag/perl" target="_blank">Perl</a>, <a href="/tag/php" target="_blank">PHP</a>, <a href="/tag/java" target="_blank">Java</a>, <a href="/tag/c" target="_blank">C++</a> и так далее;</li>
<li>использовать для передачи кэшируемых данных простой протокол, не требующий избыточности данных;</li>
<li>избегать даже теоретической возможности полного сбоя работы кэшируещей системы в связи с полной равнозначностью серверов;</li>
<li>достигать превосходной производительности при формировании HTML-кода страниц;</li>
<li>в разы снизить нагрузку на базы данных в проекте любого масштаба.</li>
</ul>
<p>Этот продукт на практике оказался более чем эффективен, о чем свидетельствует его более чем успешное использование во многих крупнейших веб-проектах.</p>
<h4>Perlbal</h4>
<p>При решении вопроса, связанного с балансировкой нагрузки между веб-серверами, пришлось перепробовать далеко не один десяток готовых решений, но, к сожалению, ни один из них не смог удовлетворить все потребности проекта. Не растерявшись, разработчики написали свое решение этой задачи и назвали его <a href="/tag/perlbal" target="_blank">Perlbal</a>. Конкурентов у него множество, начиная от решений на уровне оборудования, например от Foundry, заканчивая proxy балансировщиками нагрузки встроенные в более популярные веб-сервера, но, тем не менее, продукт получился достаточно конкурентноспособным. Он удовлетворял всем требованиям, выдвигаемым разработчиками проекта:</p>
<ul>
<li>быстрый;</li>
<li>небольшой размер;</li>
<li>&#171;сообразительный&#187;;</li>
<li>обработка &#171;мертвых&#187; узлов;</li>
<li>может выступать как в роли reverse proxy, так и балансировщика нагрузки;</li>
<li>базовый функционал классического веб-сервера;</li>
<li>реализация внутреннего перенаправления данных;</li>
<li>поддержка некоторых менее существенных трюков, реализованных обычно в виде plug-in&#8217;ов.</li>
</ul>
<p><a href="/tag/perlbal" target="_blank">Perlbal</a> не так активно используется вне LiveJournal, по сравнению с <a href="/tag/memcached" target="_blank">memcached</a>, но для решения конкретной задачи он подошел как нельзя лучше.</p>
<h4>MogileFS</h4>
<p>Идея распределенных файловых систем далеко не нова, достаточно вспомнить лишь <a href="/tag/gfs" target="_blank">GFS</a> или любой ее opensource аналог. Сам факт создания такой системы был очень легок, изначальная версия была написана за одни выходные, но при доведении ее до требуемого уровня качества пришлось попотеть. Решение о ее создании было развитием идеи распределения операций записи. Общая принцип хранения файлов прост: каждый файл в ФС относится к определенному классу файлов, который определяет все правила работы с файлом, в основном механизм его реплицирования, об остальном заботится сама система.</p>
<p>Как и все файловые системы этого класса, <acronym title="oMgFileS">MogileFS</acronym> работает на уровне пользовательских приложений и использует достаточно тривиальные протокол передачи данных и общую архитектуру: клиенты, управляющие серверы, абстрактные базы данных, сервера для хранения самих данных &#8212; в этом плане ничего нового придумано не было. Доступ к файлам осуществляется с помощью HTTP-запросов PUT/GET либо через виртуальный NFS-раздел. Единственной особенностью можно назвать уклон в построение собой абстрактной прослойки между приложением и собственно кластером базы данных (в случае LiveJournal &#8212; сегмента), используемой в роли альтернативы более тривиальной master/slave схемы.</p>
<h4>Gearman</h4>
<p><acronym title="manaGer">Gearman</acronym> по сути прост до безобразия, но это не мешает ему быть чрезвычайно эффективным. Возможно Вы уже догадались в чем суть этого еще одного продукта, написанного специально для LJ, если уже навели курсор на акроним в начале этого абзаца, если же нет &#8212; поясню: он управляет общей работой системы средствами клиент-серверной архитектуры и высокопроизводительного бинарного протокола. С их помощью он способен удаленно вызывать практически любые процедуры на удаленных серверах с минимальными задержками во времени. Казалось бы ничего особенного он сам по себе не делает, но на самом деле он выполняет очень важную функцию: увеличивает степень параллельности выполнения операций, необходимых для полноценного функционирования проекта. Единственное <strong>но</strong> в работе этого механизма заключается в том, что он не предоставляет никаких гарантий успешности выполнения работ.</p>
<p>В рамках LiveJournal <acronym title="manaGer">Gearman</acronym> применяется в основном для:</p>
<ul>
<li>обработка изображений средствами Image::Magick вне perl-приложений;</li>
<li>создание pool&#8217;а DBI соединений (DBD::Gofer + Gearman);</li>
<li>уменьшением нагрузки, создаваемой отдельными компонентами системы;</li>
<li>улучшения субъективного впечатления пользователей о быстродействии сервиса, благодаря выполнению части работ параллельно в фоновом режиме;</li>
<li>выполнение блокирующего ресурсы кода отдельно от обработчиков различных событий.</li>
</ul>
<h4>TheShwartz</h4>
<p>В качестве альтернативы gearman&#8217;у для работ, для выполнения которых необходимы некоторые гарантии успешности, а также некоторая стабильность, была разработана эта библиотека. Общая схема работы осталась та же: клиент-серверная, но за стабильность приходится платить &#8212; производительность существенно ниже, возможно возникновение задержек.</p>
<p>Хоть эти два продукта и выполняют схожие функции, используются они обычно в совокупности друг с другом, просто-напросто обрабатывая разные типы работ.</p>
<p>Основными сферами применения TheShwartz в LJ являются:</p>
<ul>
<li>отправка электронной почты (SMTP клиент);</li>
<li>LJ Notifications: каждое событие может вызывать за собой цепочку из тысяч уведомлений по электронной почте, SMS, XMPP и так далее;</li>
<li>отправка RPC сообщений внешним сервисам;</li>
<li>внедрение Atom потоков;</li>
</ul>
<h4>djabberd</h4>
<p>Как всегда следуя принципу &#171;чем проще &#8212; тем лучше&#187;, разработки LJ написали этот крошечный daemon, лежащий в основе их Jabber/LJTalk. Он способен спокойно работать с более чем 300 тысячами соединений, используя очень скромное количество оперативной памяти для поддержания каждого соединения.</p>
<p>Основной причиной для написания собственного Jabber-сервера, стало недостаточная расширяемость и масштабируемость существующих решений. Была необходимость в реализации многих нестандартных функций, вроде индивидуальных обработчиков пользовательских изображений и личных данных, обычно в других решениях было доступно только изменение методов аутентификации.</p>
<h3>Подводим итоги</h3>
<ul>
<li>Если перед Вами появилась нетривиальная задача &#8212; не бойтесь написать программное обеспечение для ее решения самостоятельно! Пускай, возможно, это потребует некторых дополнительных усилий, но масса преимуществ, связанных с полным соответствием требованиям конкретного проекта, превосходит все издержки дополнительной разработки.</li>
<li>Невозможно масштабировать проект просто постоянно добавляя новые сервера, рано или поздно все же прийдется задуматься об его архитектуре;</li>
<li>Распределение нагрузок и параллельное операций порой заслуживают того, чтобы разработчики обратили на них внимание;</li>
<li>&#171;Мы ненавидим изобретать колесо! Но тем не менее, если колесо не существует или оно квадратное, то мы не боимся изобретать круглое колесо.&#187; (с)</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/unix-way/linux/arkhitektura-livejournal/feed/</wfw:commentRss>
		<slash:comments>32</slash:comments>
		</item>
		<item>
		<title>Архитектура Digg</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-digg/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-digg/#comments</comments>
		<pubDate>Tue, 01 Apr 2008 17:49:21 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[APC]]></category>
		<category><![CDATA[Digg]]></category>
		<category><![CDATA[LAMP]]></category>
		<category><![CDATA[Linux]]></category>
		<category><![CDATA[Lucene]]></category>
		<category><![CDATA[Memcached]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[PHP]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[архитектура Digg]]></category>
		<category><![CDATA[интернет]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/scalability/arkhitektura-digg/</guid>
		<description><![CDATA[Трафик, генерируемый более чем 1.2 миллионами пользователей Digg, знаменитых своей жаждой информации, способен загнать любой невинный сайт за рамки его вычислительных ресурсов и пропускной способности канала. Как же сам Digg справляется с такой нагрузкой? Источники информации Этот текст &#8212; перевод статьи, автор &#8212; Todd Hoff. Как Digg.com использует LAMP для масштабирования Масштабируемость и производительность PHP [...]]]></description>
			<content:encoded><![CDATA[<p>Трафик,  генерируемый более чем 1.2 миллионами пользователей <a href="http://www.digg.com" rel="nofollow" target="_blank">Digg</a>, знаменитых своей жаждой информации, способен загнать любой невинный сайт за рамки его вычислительных ресурсов и пропускной способности канала. Как же сам Digg справляется с такой нагрузкой?<br />
<span id="more-61"></span></p>
<h3>Источники информации</h3>
<p><em>Этот текст &#8212; перевод <a href="http://highscalability.com/digg-architecture" target="_blank" rel="nofollow">статьи</a>, автор &#8212; <a href="http://highscalability.com/user/todd-hoff" target="_blank" rel="nofollow">Todd Hoff</a>.</em></p>
<ul>
<li><a href="http://www.computerworld.com/action/article.do?command=viewArticleBasic&#038;articleId=9017778" target="_blank" rel="nofollow">Как Digg.com использует LAMP для масштабирования</a></li>
<li><a href="http://www.oreillynet.com/onlamp/blog/2006/04/digg_phps_scalability_and_perf.html" target="_blank" rel="nofollow">Масштабируемость и производительность PHP в Digg</a></li>
</ul>
<h3>Платформа</h3>
<ul>
<li><a href="/tag/mysql" target="_blank">MySQL</a></li>
<li><a href="/tag/linux" target="_blank">Linux</a></li>
<li><a href="/tag/php" target="_blank">PHP</a></li>
<li><a href="/tag/lucene" target="_blank">Lucene</a></li>
<li><a href="/tag/apc" target="_blank">APC PHP Accelerator</a></li>
<li><a href="/tag/memcached" target="_blank">Memcached</a></li>
</ul>
<h3>Статистика</h3>
<ul>
<li>Проект стартовал в конце 2004 года на одном сервере под управлением <a href="/tag/linux" target="_blank">Linux</a> с использованием <a href="/tag/apache" target="_blank">Apache 1.3</a>, <a href="/tag/php" target="_blank">PHP 4</a> и <a href="/tag/mysql" target="_blank">MySQL 4.0</a> (со стандартной системой хранения данных &#8212; MyISAM).</li>
<li>Более 1.2 миллиона пользователей.</li>
<li>Более 200 миллионов просмотров страниц в месяц.</li>
<li>100 серверов расположены в нескольких датацентрах, из них:
<dl>
<dd>&ndash; 20 серверов баз данных;</dd>
<dd>&ndash; 30 веб-серверов;</dd>
<dd>&ndash; несколько поисковых серверов, использующих Lucene;</dd>
<dd>&ndash; остальные используются для обеспечения избыточности.</dd>
</dl>
</li>
<li>30 GB данных.</li>
<li>Ни одна из проблем, с которыми пришлось столкнуться проекту не была связана с <a href="/tag/php" target="_blank">PHP</a>, в основном они касались базы данных.</li>
<li>Легковесная природа <a href="/tag/php" target="_blank">PHP</a> позволила переместить вычислительные работы из базы данных в приложение для улучшения производительности.</li>
</ul>
<h3>Что внутри?</h3>
<ul>
<li>Балансировщик нагрузки равномерно распределяет запросы между <a href="/tag/php" target="_blank">PHP</a> серверами.</li>
<li>MySQL используется по принципу master-slave:
<dl>
<dd>&nbsp; Сервера, обрабатывающие большое количество транзакций, используют движок InnoDB.</dd>
<dd>&nbsp; Сервера, выполняющие аналитическую обработку данных в реальном времени, используют MyISAM.</dd>
<dd>&nbsp; Снижения производительности при переходе с <a href="/tag/mysql" target="_blank">MySQL</a> 4.1 на версию 5 замечено не было.</dd>
</dl>
</li>
<li>Для кэширования используется <a href="/tag/memcached" target="_blank">Memcached</a>.</li>
<li>Используется сегментирование баз данных.</li>
<li>Особенности использования Digg существенно облегчают процесс масштабирования. Большинство посетителей просто просматривают главную страницу и уходят. Это приводит к тому, что 98% запросов к базе данных являются операциями чтения. Такое соотношение операций чтения и записи позволяет не беспокоиться о комплексной работе по проектированию операций записи, что позволяет намного проще масштабировать проект.</li>
<li>Возникали проблемы, связанные с системой хранения данных, которые сообщали, что данные уже записаны на диск, когда на самом деле это было не так. Контроллеры делали это для создания впечатления более высокой производительности. Но на практике это приводило лишь к проблемам с целостностью данных. Это достаточно распространенная проблема, которую порой не так уж просто решить, правда все зависит от используемого оборудования.</li>
<li>Для облегчения нагрузки на базы данных используется кэшрование и <a href="/tag/apc" target="_blank">APC PHP Accelerator</a>.</li>
<li>С использованием рабочих потоков <a href="/tag/apache" target="_blank">Apache2</a>, FastCGI и <a href="/tag/php" target="_blank">PHP</a> акселератора возможно избежать необходимости каждый раз заново интерпретировать и компилировать PHP скрипты: скрипт компилируется только при первом обращении, что существенно ускоряет скорость его выполнения при последующих обращениях.</li>
</ul>
<h3>Подводим итоги</h3>
<ul>
<li>Используйте возможность выбора движка для <a href="/tag/mysql" target="_blank">MySQL</a>. Если Вам нужны транзакции &#8212; используйте InnoDB, если нет &#8212; MyISAM. Например, если на master сервере расположены транзакционные таблицы, то для slave серверов можно использовать и MyISAM.</li>
<li>В определенный момент рост стал невозможен путем добавления дополнительной оперативной памяти, пришлось продолжать рост путем изменения архитектуры.</li>
<li>Люди часто жалуются, что Digg медлителен. Скорее это вызвано их огромными <a href="/tag/javascript" target="_blank">JavaScript</a> библиотеками, чем работой их серверной системы.</li>
<li>Стоит тщательно выбирать какие именно приложения развертывать. Они приложили все усилия, чтобы не использовать приложения, требующие больших вычислительных мощностей. Очевидно, что Digg работает на совершенно стандартной <a href="/tag/lamp" target="_blank">LAMP</a> архитектуре, но тем не менее реализована она достаточно интересно. У инженеров часто возникает желание реализовать какой-либо дополнительный функционал, но всегда стоит иметь ввиду, что они могут разрушить инфраструктуру, если она не сможет расти теми же темпами. Так что с этим стоит повременить до тех пор пока система сможет выдерживать все необходимые нагрузки. Это приводит к планированию ресурсов, особенно большое внимание этому аспекту уделяет <a href="/tag/flickr" target="_blank">Flickr</a>.</li>
<li>Вам остается лишь догадываться, сможет ли <a href="/tag/digg" target="_blank">Digg</a> удержать свои позиции, если и дальше будет ограничивать добавление новых возможностей, или уступит более активно развивающимся сервисам социальных закладок? Возможно если бы была возможность увеличивать масштабы более простыми методами, более быстрое добавление новых функций и возможностей позволило бы более эффективно конкурировать на этом рынке? С другой стороны, просто добавление новых возможностей может и не поменять ситуацию кардинальным образом.</li>
<li>Основные проблемы с масштабируемостью и производительностью связаны с обработкой данных и в большинстве случаев они не зависят от используемого языка программирования. Вы столкнетесь с ними при работе с <a href="/tag/java" target="_blank">Java</a>, <a href="/tag/php" target="_blank">PHP</a>, <a href="/tag/ruby" target="_blank">Ruby</a>, или подставьте сюда Ваш любимый язык программирования.</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-digg/feed/</wfw:commentRss>
		<slash:comments>14</slash:comments>
		</item>
		<item>
		<title>Архитектура Wikimedia</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-wikimedia/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-wikimedia/#comments</comments>
		<pubDate>Fri, 28 Mar 2008 12:32:49 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Apache]]></category>
		<category><![CDATA[lighttpd]]></category>
		<category><![CDATA[Linux]]></category>
		<category><![CDATA[Lucene]]></category>
		<category><![CDATA[LVS]]></category>
		<category><![CDATA[Memcached]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[PHP]]></category>
		<category><![CDATA[Squid]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[архитектура Wikimedia]]></category>
		<category><![CDATA[геораспределение]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/scalability/arkhitektura-wikimedia/</guid>
		<description><![CDATA[Wikimedia является платформой для Wikipedia, Wiktionary и еще семи менее крупных wiki-проектов. Этот документ очень пригодится новичкам, пытающимся довести свои проекты до масштабов гигантских вебсайтов. Здесь можно найти множество интересных деталей и инновационных идей, которые уже успели доказать свою работоспособность на самых посещаемых сайтах всего Интернета. Источники информации Перевод статьи. Автор &#8212; Todd Hoff. Архитектура [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://wikimedia.org" target="_blank" rel="nofollow">Wikimedia</a> является платформой для <a href="http://wikipedia.org" target="_blank" rel="nofollow">Wikipedia</a>, <a href="http://wiktionary.org" target="_blank" rel="nofollow">Wiktionary</a> и еще семи менее крупных wiki-проектов. Этот документ очень пригодится новичкам, пытающимся довести свои проекты до масштабов гигантских вебсайтов. Здесь можно найти множество интересных деталей и инновационных идей, которые уже успели доказать свою работоспособность на самых посещаемых сайтах всего Интернета.<br />
<span id="more-59"></span></p>
<h3>Источники информации</h3>
<p><em>Перевод <a href="http://highscalability.com/wikimedia-architecture" target="_blank" rel="nofollow">статьи</a>. Автор &#8212; <a href="http://highscalability.com/user/todd-hoff" target="_blank" rel="nofollow">Todd Hoff</a>.</em></p>
<ul>
<li><a href="http://www.nedworks.org/~mark/presentations/san/Wikimedia%20architecture.pdf" target="_blank" rel="nofollow">Архитектура Wikimedia</a></li>
<li><a href="http://meta.wikimedia.org/wiki/Wikimedia_servers" target="_blank" rel="nofollow">Серверы Wikimedia</a></li>
<li><a href="http://oracle2mysql.wordpress.com/2007/08/22/12/" target="_blank" rel="nofollow">scale-out vs scale-up</a> из блога &#171;Oracle to MySQL&#187;</li>
</ul>
<h3>Платформа</h3>
<ul>
<li><a href="/tag/apache" target="_blank">Apache</a></li>
<li><a href="/tag/linux" target="_blank">Linux</a></li>
<li><a href="/tag/mysql" target="_blank">MySQL</a></li>
<li><a href="/tag/php" target="_blank">PHP</a></li>
<li><a href="/tag/squid" target="_blank">Squid</a></li>
<li><a href="/tag/LVS" target="_blank">LVS</a></li>
<li><a href="/tag/lucene" target="_blank">Lucene</a> для поиска</li>
<li><a href="/tag/memcached" target="_blank">Memcached</a> для распределенного кэширования объектов</li>
<li><a href="/tag/lighttpd" target="_blank">lighttpd</a> для работы с изображениями</li>
</ul>
<h3>Статитстика</h3>
<ul>
<li>8 миллионов статей распределены по сотням языковых подпроектов (английские, голландские, &#8230;)</li>
<li>В десятке самых высоконагруженных проектов по данным <a href="http://alexa.com" target="_blank" rel="nofollow">Alexa</a></li>
<li>Экспоненциальный рост: в терминах посетителей, трафика и серверов удвоение происходит каждые 4-6 месяцев</li>
<li>30000 HTTP запросов в секунду в периоды пиковой нагрузки</li>
<li>3 GBps трафик данных</li>
<li>3 датацентра: Тампа, Амстердам, Сеул</li>
<li>350 серверов, конфигурации варьируются от однопроцессорных Pentium 4 с 512 MB оперативной памяти до двухпроцессорных Xeon Quad-Core с 16 GB RAM.</li>
<li>Управляется ~6 людьми</li>
<li>Три кластера на трех разных континентах</li>
</ul>
<h3>Архитектура</h3>
<ul>
<li>Географическая балансировка нагрузки, основываясь на IP клиента, перенаправляет их на ближайший кластер. Происходит статическое отображение множества IP адресов на множество стран, а затем и на множество кластеров.</li>
<li>Кэширование с помощью <a href="/tag/squid" target="_blank">Squid</a> группируется по типу контента: текст для wiki отдельно от изображений и больших статических файлов.</li>
<li>На данный момент функционирует 55 <a href="/tag/squid" target="_blank">Squid</a> серверов, плюс еще 20 подготавливается к запуску.</li>
<li>1000 HTTP запросов в секунду на каждый сервер, в периоды повышенной нагрузки эта цифра может достигать 2500.</li>
<li>~ 100-250 MBps на сервер.</li>
<li>~ 14000-32000 открытых соединений на каждом сервере.</li>
<li>До 40 GB дискового кэша на каждом Squid сервере.</li>
<li>До 4 дисков в каждом сервере (1U серверы).</li>
<li>8 GB оперативной памяти, половину использует <a href="/tag/squid" target="_blank">Squid</a>.</li>
<li><a href="http://www.powerdns.com" target="_blank" rel="nofollow">PowerDNS</a> предоставляет геораспределение.</li>
<li>В основном и региональных датацентрах текстовые и медиа кластеры построены на <a href="/tag/lvs" target="_blank">LVS</a>, <abbr title="Common Address Reduncancy Protocol">CARP</abbr> <a href="/tag/squid" target="_blank">Squid</a>, кэш <a href="/tag/squid" target="_blank">Squid</a>. В основном датацентре также находится хранилище медиа-данных.</li>
<li>Для того, чтобы обеспечить предоставление только последних версий страниц, всем Squid-серверам отправляются инвалидационные запросы.</li>
<li>Централизованно управляемая и синхронизированная установка программного обеспечения для сотен серверов.</li>
<li>MediaWiki отлично масштабируется с несколькими процессорами, так что закупаются двухпроцессорный четырех ядерные серверы (8 ядер на сервер).</li>
<li>Одно и то же оборудование выполняет как задачи внешнего хранения данных, так и кэширования <a href="/tag/memcached" target="_blank">Memcached</a>.</li>
<li><a href="/tag/memcached" target="_blank">Memcached</a> используется для кэширования метаданных изображений, данных парсера, различий между ревизиями, пользователей, сессий. Метаданные, такие как история ревизий, отношений статей (ссылки, категории и так далее), учетные записи пользователей хранятся в основных базах данных</li>
<li>Сам текст находится во внешних хранилищах данных.</li>
<li>Статические (загруженные пользователями) файлы, например изображения, хранятся отдельно на сервере изображений, а метаданные (размер, тип и так далее) кэшируются в основной базе данных и объектном кэше.</li>
<li>Отдельная база данных для каждой вики (не отдельный сервер!).</li>
<li>Один master и много реплицированных slave серверов.</li>
<li>Операции чтения равномерно распределяются по slave серверам, операции записи направляются на master.</li>
<li>Иногда master используется и для операция чтения, когда репликация на slave еще не завершена.</li>
<li>Внешнее хранение данных:
<dl>
<dd>&ndash; Текст статей хранится на отдельных кластерах, которые представляют собой простой средство хранения данных с возможностью только дописывания новых данных. Такой подход позволяет сохранить дорогостоящее место в высоконагруженных основных базах данных от редкоиспользуемой информации.</dd>
<dd>&ndash; Благодаря этому появляются дополнительные неиспользованные ресурсы на серверах приложений (порой 250-500 GB на сервер).</dd>
<dd>&ndash; На данной момент используются реплицируемые кластеры из 3 <a href="/tag/mysql" target="_blank">MySQL</a> серверов, но в будущем это может измениться, так как требуется более удобное управление ими.</dd>
</dl>
</li>
</ul>
<h3>Подводим итоги</h3>
<ul>
<li>Сфокусируйтесь на архитектуре, а не на операциях или чем-то другом.</li>
<li>Иногда кэширование обходится дороже, чем повторные вычисление или поиск данных в исходном источнике.</li>
<li>Старайтесь избегать сложных алгоритмов, запросов к базе данных и тому подобного.</li>
<li>Кэшируйте каждый результат, который дорого вам обошелся и является относительно локальным.</li>
<li>Сфокусируйтесь на &#171;горячих точках&#187; в коде.</li>
<li>Масштабируйтесь разделением:
<dl>
<dd>&ndash; операций чтения и записи (master/slave);</dd>
<dd>&ndash; сложных операций и более частых и простых (группы запросов);</dd>
<dd>&ndash; больших, популярных вики и более мелких.</dd>
</dl>
</li>
<li>Улучшайте кэширование: временная и пространственная локализация данных, а также уменьшение набора данных на каждом сервере.</li>
<li>Выполняйте компрессию текстовых данных, храните только изменения в статьях.</li>
<li>Казалось бы простые вызовы библиотечных функций порой на практике могут занимать слишком много времени.</li>
<li>Скорость поиска данных на диске ограничена, так что чем больше дисков &#8212; тем лучше!</li>
<li>Масштабирование с использованием обычного оборудование не означает использование самых дешевых вещей, которые удастся найти. Серверы баз данных Wikipedia сегодня представляют собой 16GB RAM, двух- или четырех-ядерные серверы с 6 15000 rpm SCSI дисками, организованными в RAID 0. Возможно они бы и использовали более дешевые системы, но 16 GB как раз хватает для размещения основного объема данных, а остальное берут на себя жесткие диски, это вполне соответствует потребностям системы, которую они построили. Примерно по таким же причинам их веб-сервера имеют 8 ядер, так как это позволяет достичь неплохой производительности <a href="/tag/php" target="_blank">PHP</a> при достаточно простой организации балансировки нагрузки.</li>
<li>Для масштабирования требуется выполнение массы работы, но если заранее этого не предусмотреть &#8212; понадобится сделать еще больше. MediaWiki изначально была написана для одного master сервера баз данных. Затем добавилась поддержка slave. Затем добавилось распределение по языкам и проектам. Дизайн системы с тех пор прекрасно выдерживает все нагрузки, но без очистки от новых узких мест системы не обошлось.</li>
<li>Каждый, кто хочет разработать свою базу данных таким образом, чтобы она позволила недорого масштабироваться с уровня одного сервера до уровня десятки лучших сайтов Интернета, должен начать с обработки слегка устаревших данных на реплицированных slave серверах, при этом не забывать балансировать нагрузку операций чтения между slave серверами. Если это возможно &#8212; блоки данных (группы пользователей, учетных записей, или чего угодно) должны размещаться каждый на разных серверах. Можно делать это с самого начала используя виртуализацию, чтобы удостовериться в работоспособности архитектуры, когда вы еще &#171;маленькие&#187;. Это <strong>намного</strong> проще, чем когда вы делаете то же самое, но под ежемесячно удваивающейся нагрузкой.</li>
</ul>
<p>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-wikimedia/feed/</wfw:commentRss>
		<slash:comments>16</slash:comments>
		</item>
		<item>
		<title>Архитектура Friends for Sale</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-friends-for-sale/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-friends-for-sale/#comments</comments>
		<pubDate>Mon, 17 Mar 2008 18:44:12 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Capistrano]]></category>
		<category><![CDATA[CentOS]]></category>
		<category><![CDATA[Facebook]]></category>
		<category><![CDATA[Friends for Sale]]></category>
		<category><![CDATA[LVM]]></category>
		<category><![CDATA[Memcached]]></category>
		<category><![CDATA[mongrel]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[nginx]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[Pingdom]]></category>
		<category><![CDATA[Rails]]></category>
		<category><![CDATA[RoR]]></category>
		<category><![CDATA[Ruby on Rails]]></category>
		<category><![CDATA[Starling]]></category>
		<category><![CDATA[SVN]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[социальные сети]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/scalability/arkhitektura-friends-for-sale/</guid>
		<description><![CDATA[За три коротких месяца Friend for Sale (рейтинговая система в условиях рыночной экономики) попала в десятку лучших приложений Facebook, непринужденно обрабатывая 200 запросов в секунду и демонстрируя шокирующее количество просмотров страниц, за месяц достигающее 300 миллионов просмотров. Все это дело рук двух разработчиков, работающих не полный рабочий день, которые смогли создать успешное веб-приложение, имея в [...]]]></description>
			<content:encoded><![CDATA[<p><img src="/wp-content/uploads/friends-for-sale.gif" alt="Friends for Sale Logo" title="Friends for Sale" style="float:right; margin: 80px 16px;" /><br />
За три коротких месяца <em><a href="http://www.facebook.com/apps/application.php?id=7019261521" target="_blank" rel="nofollow">Friend for Sale</a></em> (рейтинговая система в условиях рыночной экономики) попала в десятку лучших приложений <em>Facebook</em>, непринужденно обрабатывая 200 запросов в секунду и демонстрируя шокирующее количество просмотров страниц, за месяц достигающее 300 миллионов просмотров. Все это дело рук двух разработчиков, работающих не полный рабочий день, которые смогли создать успешное веб-приложение, имея в своем распоряжении лишь кластер из дюжины серверов и <a href="/tag/ruby-on-rails" target="_blank">Ruby on Rails</a>.</p>
<p>Как Friends for Sale масштабируется для того, чтобы обеспечить торговлю всеми этими красивыми людьми? Как Вы думаете, сколько стоят Ваши друзья на открытом рынке?<br />
<span id="more-53"></span></p>
<h3>Источники информации</h3>
<p><em>Традиционная пара фраз, чтобы отдать должное <a href="http://highscalability.com/friends-sale-architecture-300-million-page-view-month-facebook-ror-app" target="_blank" rel="nofollow">оригиналу</a> и его <a href="http://highscalability.com/user/todd-hoff" target="_blank" rel="nofollow">автору</a>. Продолжаем:</em></p>
<ul>
<li>Ответы на стандартный набор вопросов от Siqi Chen и Alexander Le, создателей Friends for Sale;</li>
<li><a href="http://highscalability.com/docs/EmergingTechSIGPresentation.pdf" target="_blank" rel="nofollow">Virality on Facebook</a>.</li>
</ul>
<h3>Платформа</h3>
<ul>
<li><a href="/tag/ruby-on-rails" target="_blank">Ruby on Rails</a></li>
<li><a href="/tag/centos" target="_blank">CentOS</a> (64 bit)</li>
<li><a href="/tag/capistrano" target="_blank">Capistrano</a> &#8212; для обновлений и перезапусков серверов</li>
<li><a href="/tag/memcached" target="_blank">Memcached</a></li>
<li><a href="/tag/mysql" target="_blank">MySQL</a></li>
<li><a href="/tag/nginx" target="_blank">nginx</a></li>
<li><a href="/tag/starling" target="_blank">Starling</a> &#8212; распределенный сервер очередей</li>
<li>Softlayer &#8212; хостинг</li>
<li><a href="/tag/pingdom" target="_blank">Pingdom</a> &#8212; мониторинг</li>
<li><a href="/tag/lvm" target="_blank">LVM</a></li>
<li><a href="http://magicmodels.rubyforge.org/magic_multi_connections/" target="_blank" rel="nofollow">Magic Multi-Connections Gem</a> &#8212; разделение операций чтения и записи между серверами</li>
</ul>
<h3>Статистика</h3>
<ul>
<li>Это Facebook приложение находится в десятке наиболее популярных;</li>
<li>Около 600 тысяч активных пользователей;</li>
<li>Полмиллиона уникальных посетителей ежедневно, и эта цифра неуклонно растет;</li>
<li>Темпы роста проекта достигают 300% в месяц;</li>
<li>200 запросов в секунду;</li>
<li>5 TB трафика в месяц;</li>
<li>Над проектом работают 2 разработчика и 1 админимтратор баз данных.</li>
<li>4 сервера баз данных, 6 серверов приложений, 1 тестовый сервер и 1 сервер для балансировки нагрузки:
<dl>
<dd>&ndash; Каждый из серверов приложений содержит 4 ядра и 8 GB оперативной памяти.</dd>
<dd>&ndash; На каждом из них работает 16 сервисов <a href="/tag/mongrel" target="_blank">mongrel</a> (в сумме &#8212; 96).</dd>
<dd>&ndash; 4 GB оперативной памяти на каждом из них отведено под <a href="/tag/memcached" target="_blank">memcached</a>.</dd>
<dd>&ndash; Сервера баз данных имеют более серьезное оборудование: при тех же 4-х ядрах, они имеют 32 GB оперативной памяти и RAID 10 массив из четырех 15000rpm SCSI дисков, работающих в режиме &#171;master/slave&#187;.</dd>
</dl>
</li>
</ul>
<h3>Давайте знакомиться</h3>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Для чего нужна ваша система?</p>
<p>Наша система разработана в качестве платформы для нашего Facebook приложения, Friends for Sale.<br />
В целом оно представляет собой аналог рейтинговой системы <a href="http://www.hotornot.com/" target="_blank" rel="nofollow">Hot-or-Not</a> с некоторым добавлением рыночной экономики. В момент проведения интервью это приложение было на 10-м месте по популярности среди приложений Facebook.</p>
<p>Описание этого приложения на самом Facebook гласит:</p>
<div style="background: #bbff00; padding: 8px; margin-top: 5px; margin-bottom:35px;">Покупайте и продавайте своих друзей как питомцев! Вы можете научить их толкаться, отправлять подарки или просто представлять Вас в выгодном свете.<br />
Зарабатывайте как практичный инвестор в питомцев или как популярный товар!
</div>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Почему вы решили построить эту систему?</p>
<p>Мы разработали ее скорее как эксперимент для того, чтобы проверить удалось ли нам понять концепции и измерения вирусного эффекта в рамках Facebook. Мне кажется нам это удалось. <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> С какими конкретными сложными задачами, связанными с дизайном, архитектурой или реализацией системы, вам пришлось столкнуться при построении системы?</p>
<p>Как и в любом Facebook приложении, каждый запрос является динамическим, так что кэширование страниц невозможно. Так как приложение является интерактивным, со множеством операций записи, определенные трудности вызвало масштабирование базы данных.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Каковы были ваши действия, направленные для решения этих задач?</p>
<p>С самого начала мы активно использовали <a href="/tag/memcached" target="_blank">memcached</a> &#8212; для перезагрузки страницы совсем не требуется выполнение SQL запросов. В основном мы использовали кэширование фрагментов Rails с индивидуальной логикой актуальности.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы оцениваете размеры вашей системы?</p>
<p>Вчера статистика показала более полумиллиона уникальных посетителей, и эта цифра неуклонно растет.<br />
За этот месяц было зарегистрировано более 300 миллионов просмотров страниц.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Каковы показатели использования пропускной способности интернет-канала?</p>
<p>В прошлом месяце было потрачено 3 терабайта трафика, но в этом месяце ожидается цифра не меньше 5 терабайт. Эти цифры состоят по большей части из XHTML / CSS и нескольких небольших иконок.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как много документов используется в системе? Сколько изображений? Какой объем данных?</p>
<p>По большому счету у нас нет уникальных документов&#8230; но зато у нас есть около 10 миллионов профилей пользователей.<br />
Единственными используемыми изображениями являются несколько статических иконок.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы оцениваете темпы роста вашей системы?</p>
<p>Месяц назад за сутки просматривалось около трех миллионов страниц, на данный момент эта цифра достигла 10 миллионов в сутки. Из чего можно сделать вывод, что ориентировочные темпы роста проекта составляют 300% в месяц. Если говорить о ежесекундной нагрузке, то на данный момент она составляет около 200 запросов в секунду.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какая часть посетителей платит вам за участие в вашем проекте?</p>
<p>Он абсолютно бесплатен для пользователей.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Каковы показатели &#171;текучести&#187; пользователей?</p>
<p>В среднем около 1% в сутки, с ежедневным ростом в 3% от этой цифры, если говорить в терминах новых установок .</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как много учетных записей активно принимали участие в проекте за последний месяц?</p>
<p>По данным <a href="/tag/google" target="_blank">Google</a> за последний месяц проект посетил 2.1 миллион уникальных пользоывтелей.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какова архитектура вашей системы?</p>
<p>Она представляет собой относительно стандартный Rails кластер. В качестве интерфейса между запросами пользователей и серверами приложений используется proxy балансировщик нагрузки, который перенаправляет запросы напрямую шести четырехядерным серверам приложений. На каждом сервере приложений запущено 16 <a href="/tag/mongrel" target="_blank">mongrel</a>&#8216;ов, что в сумме дает 96. Балансировщик нагрузки перенаправляет запросы напрямую на порты серверов <a href="/tag/mongrel" target="_blank">mongrel</a>. В дополнение к этому на каждом сервере приложений выделено 4 GB оперативной памяти под <a href="/tag/memcached" target="_blank">memcached</a>, а также работает локальный сервер распределенного менеджера очередей <a href="/tag/starling" target="_blank">Starling</a> и несколько менее важных фоновых процессов.</p>
<p><a href="/tag/subd" target="_blank">СУБД</a> работает на двух серверах (четыре ядра, 32 GB оперативной памяти, четыре 15000rpm SCSI диска в RAID 10) в режиме &#171;master/slave&#187;. Для организации распределения операций чтения и записи между серверами используется <a href="http://magicmodels.rubyforge.org/magic_multi_connections/" target="_blank" rel="nofollow">Magic Multi-Connections Gem</a> от Dr Nic.</p>
<p>На данный момент ведется работа над добавлением дополнительных серверов, работающих в роли &#171;slave&#187;, для обеспечения более эффективного распределения нагрузки, избыточности и политик хранения запасных копий данных. Помимо этого нам помогают Percona (ребята из mysqlperformanceblog) с удаленной работой над архитектурой базы данных.</p>
<p>Нашим хостинг-провайдером является Softlayer &#8212; он просто фантастический. Основной проблемой был тот факт, что их балансировщик нагрузки не справлялся со своей задачей &#8230; поначалу у нас возникала масса проблем, связанных с задержками и повисшими соединениями. Переход на отдельный сервер с запущенным только nginx в режиме proxy балансировщика нагрузки позволила решить все проблемы.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Каким образом планируется масштабировать архитектуру вашего проекта?</p>
<p>Каких-то конкретных планов нет. На уровне приложения система не использует какие-либо общие ресурсы, так что все достаточно тривиально. На уровне баз данных на данный момент все еще используется один сервер в роли &#171;master&#187;, но мы стараемся отложить неизбежный переход к сегментированной базе данных на как можно более длительный срок. На данный момент базы данных масштабируются вертикально, но со временем, надеюсь, мы сможем от этого избавиться.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Назовите самые интересные уникальные факты о вашем проекте?</p>
<p>Я могу назвать:</p>
<ol>
<li>Ни один из двух разработчиков ранее не имел опыта в крупномасштабных разработках на основе <a href="/tag/rails" target="_blank">Rails</a>.</li>
<li>Наша траектория роста проекта достаточно редка в истории разработок с использованием <a href="/tag/rails" target="_blank">Rails</a>.</li>
<li>У нас практически не было возможностей для кэширования статических страниц &#8212; каждый запрос страницы приходилось обрабатывать <a href="/tag/rails" target="_blank">Rails</a>.</li>
</ol>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Чему вам удалось научиться? Каков залог вашего успеха? Чего бы вам хотелось сделать по-другому в прошлом, если бы была такая возможность? Что бы вы оставили как есть?</p>
<p>Отличные хостинг, оборудование и архитектура БД являются очень важными факторами. Мы привыкли пользоваться услугами хостинга Railsmachine, который честно говоря является отличным провайдером shared хостинга, но со временем они потеряли возможность выдерживать необходимую нагрузку. В итоге почти месяц мы были едва способны отвечать на запросы браузеров из-за проблем с оборудованием, хотя последующий переход на Softlayer занял всего два часа. Стоит заранее выбирать качественный хостинг, если планируется масштабирование проекта, смена хостинг-провайдера &#8212; не очень веселое занятие.</p>
<p>Основным выводом, который нам удалось сделать, является тот факт, что причиной проблемы с масштабированием практически всегда является база данных. Все без исключений проблемы с производительностью в итоге сводились к серверу баз данных, конфигурации СУБД, эффективности запросов или решению вопроса насчет необходимости использования индексов.</p>
<p>Определенно нам нужен был более качественный хостинг намного раньше.</p>
<p>Мы определенно не сменим наш framework &#8212; <a href="/tag/rails" target="_blank">Rails</a> был незаменим при быстрой разработке приложения, нам удалось доказать, что для масштабирования проекта на <a href="/tag/ror" target="_blank">RoR</a> достаточно двух парней, абсолютно не имеющих опыта в этом.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Кто входит в состав вашей команды?</p>
<p>У нас есть два разработчика, включая меня. Помимо этого недавно мы начали пользоваться услугами помощи с DBA, о которой уже упоминалось.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Сколько всего людей участвует в проекте?</p>
<p>В технической части &#8212; два разработчика и один администратор баз данных, работающий на контрактной основе.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Где они расположены с географической точки зрения?</p>
<p>Все участники проекта живут в районе SOMA, San Francisco.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Каковы обчзанности каждого из участников проекта?</p>
<p>Оба разработчика проекта по совместительству являются и его создателями. Поначалу я (Siqi) был ответственным за дизайн и разработку пользовательского интерфейса, но так как у меня был некоторый опыт с развертыванием систем я взял на себя и разработку управления сетевыми операциями и развертывания. Мой коллега Alex был ответственным за большую часть <a href="/tag/rails" target="_blank">Rails</a> кода, вся логика приложения &#8212; его рук дело.</p>
<p>На данный момент я по большей части занимаюсь более техническими моментами, такими как оптимизация сетевых операций и работы и репликации <a href="/tag/mysql" target="_blank">MySQL</a>. С трудом получается вернуться к работе над пользовательским интерфейсом &#8212; к тому, что мне по-настоящему нравится. Но это был опыт, который явно стоило получить, так что я стараюсь извлекать максимум выгоды из этого занятия.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> У вас есть какая-то определенная философия менеджмента?</p>
<p>Да &#8212; найти самых умелых и сообразительных людей, сделать им наилучшее возможное предложение и убраться с их пути. Самые лучшие менеджеры должны уметь НЕ МЕШАТЬ работникам, так что я стараюсь максимально этому следовать при работе с другими участниками проекта. Но, к сожалению, мне удается это далеко не всегда.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Если ваша команда работает раздельно, как вам удается координировать свою работу?</p>
<p>Нам стоило бы задуматься об использования каких-либо эффективных средств общения. Мне кажется, что использование удаленной работа / outsourcing&#8217;а является по-настоящему сложной задачей &#8212; я предпочитаю обходиться без этого в разработке основы системы. Для системного администрирования или разработки архитектуры БД это было бы более оправданно.</p>
<h3>Что вы используете для разработки?</h3>
<p>Мы используем <a href="/tag/rails" target="_blank">Rails</a> с несколькими plug-in&#8217;ами, самыми важными являются cache-fu от Cris Wanstrath и magic multi connections от Dr Nic. В качестве текстового редактора я предпочитаю vim с плагином rails.vim.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какие языки программирования используются?</p>
<p><a href="/tag/ruby-on-rails">Ruby on Rails</a></p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Сколько используется серверов?</p>
<p>На данный момент используется кластер из 12 серверов.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как они используются?</p>
<p>4 сервера баз данных, 6 серверов приложений, 1 тестовый сервер и 1 сервер для балансировки нагрузки.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Кто их предоставляет?</p>
<p>Мы заказываем их у Softlayer &#8212; до подключения их к системе проходит порой менее четырех часов, что очень неплохо.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какая операционная система используется?</p>
<p>CentOS 5 (64 бит)</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какой http сервер используется?</p>
<p>nginx</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какая СУБД используется?</p>
<p>MySQL 5.1</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Вы используете обратную proxy?</p>
<p>Мы просто используем встроенный в nginx proxy балансировщик нагрузки.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы развертываете вышу систему в датацентре?</p>
<p>Мы используем хостинг выделенных серверов, Softlayer.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какова ваша стратегия хранения данных?</p>
<p>Мы используем резервное копирование NAS помимо внутренних SCSI RAID массивов.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какой объем дискового пространства вам доступен?</p>
<p>На всех серверах в сумме около 5 TB.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы наращиваете объем дисково пространства?</p>
<p>Спонтанно. Мы еще не выполнили каких-либо исследований в планировании дискового пространство, но это было явно зря не сделано.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Вы используйте какой-либо сервис хранения информации?</p>
<p>Нет.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Вы используете виртуализацию хранимых данных?</p>
<p>Нет.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как организована работа с сессиями?</p>
<p>На данный момент она поручена СУБД, но передача их обслуживания напрямую memcached &#8212; достаточно несложная задача.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как организована архитектура вашей БД?</p>
<p>На данный момент &#8212; &#171;master/slave&#187;. Мы осуществляем переход к нескольким &#171;slave&#187; с proxy балансировщиком нагрузке для режима &#171;только для чтения&#187;.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как организована балансировка нагрузки?</p>
<p>На программном уровне средствами nginx.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какой framework / AJAX библоиотеку вы используете?</p>
<p>Rails.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какие средства распределенного управления задачами вы используете?</p>
<p><a href="/tag/starling">Starling</a></p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы управляете рекламой в проекте?</p>
<p>Мы участвуем в нескольких рекламных сетях. Мы оцениваем эффективность каждой рекламной сети с помощью eCPM на уровне приложения.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Имеете ли вы стандартную API на вашем сайте?</p>
<p>Нет.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Сколько человек в вашей команде?</p>
<p>2 разработчика.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какими наборами способностей обладают участники вашей команды?</p>
<p>Я: дизайн пользовательского интерфейса, разработка, ограниченные знания в Rails, оптимизация MySQL, развертывание Rails.</p>
<p>Alex: разработка логики приложения, дизайн пользовательского интерфейса, программная инженерия в целом.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какие средства разработки вы используете?</p>
<p>Alex работает в OS X, а я предпочитаю Ubuntu. Для контроля за версиями используется <a href="/tag/svn" target="_blank">SVN</a>. В качестве текстового редактора я использую VIM, а Alex &#8212; TextMate.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как проходит процесс разработки?</p>
<p>На логическом уровне все упирается в тесты, мы проводим их достаточно экстенсивно. На уровне приложения все ограничивается быстрыми итерациями и не менее быстры тестированием.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Какова ваша стратегия кэширования объектов и контента?</p>
<p>Мы используем <a href="/tag/memcached" target="_blank">memcached</a> без TTL и просто вручную очищаем кэш при необходимости.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как происходит кэширование на клиентской стороне?</p>
<p>Никак.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы управляете вашей системой?<br />
<img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы проверяете глобальную доступность и моделируете производительность для конечных пользователей?</p>
<p>Мы используем <a href="/tag/pingdom" target="_blank">Pingdom</a> для внешнего мониторинга за сайтом &#8212; они отлично справляются.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы проверяете работоспособность ваших серверов и сетей?</p>
<p>На данный момент мы полагаемся на внешний мониторинг и ping мониторинг от Softlayer. В перспективе мы рассматриваем FiveRuns как возможное решение для мониторинга серверов.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы строите на графиках или диаграммах сетевую и серверную статистику, а также тенденции?</p>
<p>Мы не занимаемся этим.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы тестируете систему?</p>
<p>Сначала мы разворачиваем ее на тестовом сервере и проводим несколько тестов, после чего разворачиваем систему уже на серверах приложений.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы анализируете производительность?</p>
<p>Мы отслеживаем каждый SQL-запрос в процессе разработки, это позволяет нам убедиться, что не выполняются никакие ненужные запросы или создание экземпляра модели. Помимо этого мы не выполняем каких-либо тестов на производительность.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы обеспечиваете безопасность?</p>
<p>Тщательно.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы решаете какие возможности добавить или оставить?</p>
<p>Решения основываются на отзывах пользователей и критическом взгляде на них. Мы верим в простоту, так что нам приходится как следует все взвесить перед добавлением каких-либо существенных возможностей.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы реализуете веб-аналитику?</p>
<p>Мы используем собственную систему оценок для оптимизации вирусного эффекта, но помимо этого пользуемся и услугами <a href="http://www.google.com/analytics" target="_blank" rel="nofollow">Google Analytics</a>.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Используете ли вы A/B тестирование?</p>
<p>Да, время от времени мы используем их для тонкой настройки аспектов дизайна для того, чтобы оптимизировать его под вирусный эффект.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы выполняете резервное копирование и восстановление?</p>
<p>Мы используем LVM для создания ежедневных и еженедельных инкрементальных резервных копий.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как выполняются обновления оборудования и программного обеспечения?</p>
<p>На данный момент мы делаем это вручную, за исключением развертывания <a href="/tag/rails" target="_blank">Rails</a> приложения. Для обновления и перезапуска серверов приложений мы используем <a href="/tag/capistrano" target="_blank">Capistrano</a>.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы выполняете глобальные изменения в структуре базы данных при обновлениях?</p>
<p>Обычно мы начинаем переход с второстепенных серверах баз данных, а затем просто переключаем основные.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Каковы ваши планы насчет защиты от сбоев и развития бизнеса?</p>
<p>Не самым лучшим образом&#8230;</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Есть ли у вас отдельная операционная команда, работающая над сайтом?</p>
<p>Было бы неплохо, но нет <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Используете ли вы <abbr title="Content Delievery Network">CDN</abbr>? Если да, то какую и для каких целей?</p>
<p>Нет.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как выглядит модель ваших доходов?</p>
<p><abbr title="Costs per thousand impressions">CPM</abbr>: больше просмотров страниц &#8212; больше денег. Помимо этого у нас бывают прямые поощрительные предложения через нашу виртуальную валюту.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как вы продвигаете ваш продукт?</p>
<p>Это же социальная сеть. Мы просто используем вирусный эффект для поддержания роста проекта.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Используете ли вы какие-либо особенно интересные технологии или алгоритмы?</p>
<p>Я думаю Ruby запросто мог бы подойти под это определение, но на самом деле нет &#8212; мы не проводим научных исследований, мы просто стараемся быть полезными для посетителей.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Храните ли вы изображения в юазе данных?</p>
<p>Нет, это бы была не самая лучшая идея.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как много работы над организацией взаимодействия с пользователями приходится выполнять?</p>
<p>Я бы сказал, что никакой, если вам не приходилось раньше масштабировать что-либо, и достаточно много, если приходилось. Достаточно сложно сказать что именно станет проблемой до тех пор, пока на самом деле с ними не столкнешься. Как только ты пройдешь через это, у тебя будет достаточно знаний, чтобы осознанно проводить какую-либо работу в этом направлении.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Приходилось ли вам сталкиваться с какими-либо сюрпризами, положительными или отрицательными?</p>
<p>Было удивительно, насколько ненадежным может оказаться поставщик оборудования, и как может отличаться уровень технической поддержки одного хостинг-провайдера по сравнению с другим. Одной из основных вещей, которая вам понадобится при масштабировании системы &#8212; хостинг, способный поддерживать ваши потребности.</p>
<p>С другой стороны, было удивительно насколько далеко смогла наз завести архитектура с одним &#171;master&#187; и несколькими &#171;slave&#187; на самом обыкновенном оборудовании. Я думаю, что даже миллиард просмотров страниц в месяц достижим при таком подходе к базе данных.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Как ваша система эволюционирует для соответствия новым требованиям к масштабируемости?</p>
<p>По большому счету она этого не делает, мы просто исправляем узкие места в системе и смотрим что же будет дальше.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Кем вы восхищаетесь?</p>
<p>Brad Fitzpatrick за изобретение memcache, а также каждым, кому успешно удалось горизонтально масштабировать свой проект.</p>
<p><img src="/wp-content/themes/copyblogger/images/bullet.gif" alt="#" title="" /> Каковы ваши планы по изменению архитектуры в будущем?</p>
<p>Скоро предется переходить к сегментированной по пользователям базе данных, так как скоро мы достигнем пределов базы данных по операциям записи и размерам.</p>
<h3>Их мысли о вирусном эффекте Facebook</h3>
<ul>
<li>Facebook моделирует социальную сеть в цифровой форме максимально точно и полно, по крайней мере насколько это возможно.</li>
<li>Построение социальной сети более важно, чем возможности, предоставляемые пользователям.</li>
<li>Facebook позволяет быстро распространять новые приложения через социальную сеть.</li>
<li>Идея вашего приложения должна быть социальной, затягивающей и универсальной.</li>
<li>Социальный аспект является основой вирусного эффекта.</li>
<li>&#171;Затягивание&#187; пользователей позволяет зарабатывать на нем.</li>
<li>Универсальность дает необходимый потенциал.</li>
<li>Friends for Sale &#8212; социальный проект, так как предоставляет возможность торговать своей частью социального графа.</li>
<li>Он затягивает, так как в основе лежит в какой-то степени сумасшедшая идея, ненавязчивая, слегка флиртующая, и немного циничная.</li>
<li>Он универсальный, так как все люди в какой-то степени самовлюбленны, знают себе цену, и хотят флиртовать с &#171;горячими&#187; людьми.</li>
<li>Каждая часть приложения является потенциальной для вовлечения новых пользователей.</li>
<li>Каждый пользователь в среднем приводит 1.4 новых, что является залогом экспонентациального роста.</li>
<li>Для каждого нового пользователя отслеживается количество приглашений, нотификаций, записей на &#171;стене&#187;, кликов в профиле и других факторов.</li>
<li>Для каждого канала поступления новых пользователей вычисляются проценты нажавших, успешно вовлеченных и выходов из проекта.</li>
</ul>
<h3>Подводим итоги</h3>
<ul>
<li>На Facebook требуется масштабирование с самого начала. Дорога до миллиона просмотров страниц в сутки заняла 4 недели.</li>
<li><a href="/tag/ruby-on-rails" target="_blank">Ruby on Rails</a> может масштабироваться.</li>
<li>При правильном подходе к архитектуре может масштабироваться практически все что угодно, сосредоточтесь на этом.</li>
<li>Вам определенно нужна продуманная архитектура базы данных, качественный хостинг, а также правильно настроенное оборудование.</li>
<li>С использованием кэширования и современных серверов, может пройти достаточно длитекльный период времени до тех пор, пока понадобится использование баз данных с более сложной структурой, такой как сегменгирование.</li>
<li>Социальная сеть &#8212; это реальность. Количество новых пользователей в хорошо реализованном Facebook приложении на самом деле ошеломляет.</li>
<li>Большая часть проблем с производительностью в итоге сводится к базе данных. Дишний раз обратите внимание на конфигурацию СУБД, запросы и использование индексов.</li>
<li><strong>Люди до сих пор пользуются Vi!</strong></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-friends-for-sale/feed/</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>Архитектура YouTube</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-youtube/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-youtube/#comments</comments>
		<pubDate>Sat, 01 Mar 2008 13:07:09 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Apache]]></category>
		<category><![CDATA[BigTable]]></category>
		<category><![CDATA[lighttpd]]></category>
		<category><![CDATA[Linux]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[NetScalar]]></category>
		<category><![CDATA[psyco]]></category>
		<category><![CDATA[Python]]></category>
		<category><![CDATA[YouTube]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[архитектура YouTube]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[производительность]]></category>
		<category><![CDATA[хранение данных]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/scalability/arkhitektura-youtube/</guid>
		<description><![CDATA[Рост YouTube был феноменально быстр, количество просмотров видео превысило 100 миллионов в сутки при том, что только около пяти человек работало над масштабированием проекта. Как им удается управлять предоставлением всех этих видеороликов своим посетителям? Как они развивались с тех пор, как были приобретены Google? Источники информации В отличии от остальных, этот перевод статьи от Todd [...]]]></description>
			<content:encoded><![CDATA[<p>Рост <a href="http://www.youtube.com" target="_blank" rel="nofollow">YouTube</a> был феноменально быстр, количество просмотров видео превысило 100 миллионов в сутки при том, что только около пяти человек работало над масштабированием проекта. Как им удается управлять предоставлением всех этих видеороликов своим посетителям? Как они развивались с тех пор, как были приобретены <a href="/tag/google" target="_blank">Google</a>?<br />
<span id="more-51"></span></p>
<h3>Источники информации</h3>
<p><em>В отличии от <a href="/highload" target="_blank">остальных</a>, этот перевод <a href="http://highscalability.com/youtube-architecture" target="_blank" rel="nofollow">статьи</a> от <a href="http://highscalability.com/user/todd-hoff" rel="nofollow" target="_blank">Todd Hoff</a>&#8216;а уже был выполнен до меня (при желании можно найти в любой поисковой системе), но я все равно решил опубликовать свою версию просто для собственного развития и полноты <a href="/highload" target="_blank">коллекции</a>, да и многим читателям, возможно, покажется интересным. Что ж, перейдем к источнику информации оригинала:</em></p>
<ul>
<li><a href="http://video.google.com/videoplay?docid=-6304964351441328559" target="_blank" rel="nofollow">Google Video</a></li>
</ul>
<h3>Платформа</h3>
<ul>
<li><a href="/tag/apache" target="_blank">Apache</a></li>
<li><a href="/tag/python" target="_blank">Python</a></li>
<li><a href="/tag/linux" target="_blank">Linux</a> (SuSe)</li>
<li><a href="/tag/mysql" target="_blank">MySQL</a></li>
<li><a href="/tag/psyco" target="_blank">psyco</a>, динамический компилятор <a href="/tag/python" target="_blank">Python</a> &rarr; <a href="/tag/c" target="_blank">C</a></li>
<li><a href="/tag/lighttpd" target="_blank">lighttpd</a> для видео</li>
</ul>
<h3>Что внутри?</h3>
<h4>Статистика</h4>
<ul>
<li>Поддержка обработки более 100 миллионов видеороликов в сутки</li>
<li>Сервис был запущен в феврале 2005 года</li>
<li>В марте 2006 года в среднем производилось около 30 миллионов просмотров видео в день</li>
<li>К июлю 2006 года эта цифра достигла 100 миллионов просмотров в день</li>
<li>Над проектом работают: 2 системных администратора, 2 архитектора масштабируемости программного обеспечения, 2 разработчика новых возможностей, 2 инженера по сетям, 1 архитектор баз данных</li>
</ul>
<h4>Рецепт управления огромными темпами роста</h4>
<pre lang="PHP">
while (true)
{
   identify_and_fix_bottlenecks();
   drink();
   sleep();
   notice_new_bottleneck();
}
</pre>
<p>Этот цикл проходит далеко не одну итерацию ежедневно.</p>
<h3>Веб-серверы</h3>
<ul>
<li><a href="/tag/netscalar" target="_blank">NetScalar</a> используется для балансировки нагрузки и кэширования статического контента.</li>
<li><a href="/tag/apache" target="_blank">Apache</a> работает с включенным <strong>mod_fast_cgi</strong></li>
<li>Запросы отправляются на обработку с помощью серверного приложения на <a href="/tag/python" target="_blank">Python</a>.</li>
<li>Приложение взаимодействует с различными базами данных и другими источниками информации для формирования финальной <a href="/tag/html" taget="_blank">HTML</a>-страницы.</li>
<li>Масштабирование обычно происходит просто добавлением дополнительных компьютеров.</li>
<li>Код на <a href="/tag/python" target="_blank">Python</a> обычно не является узким местом системы, он проводит большую часть времени заблокированным RPC.</li>
<li><a href="/tag/python" target="_blank">Python</a> предоставляет быстроту и гибкость в процессе разработки и развертывания. Этот факт является очень актуальным, если учесть кто является их конкурентами.</li>
<li>На формирование страницы обычно уходит не более 100 миллисекунд.</li>
<li><a href="/tag/psyco" target="_blank">psyco</a>, динамический компилятор <a href="/tag/python" target="_blank">Python</a> &rarr; <a href="/tag/c" target="_blank">C</a>, использует JIT подход к компилированию для оптимизации внутренних циклов</li>
<li>Для интенсивных вычислений, таких как шифрование, используются расширения, написанные на <a href="/tag/c" target="_blank">C</a>.</li>
<li>Какая-то часть заранее сгенерированного <a href="/tag/html" taget="_blank">HTML</a> хранится в кэше.</li>
<li>Кэширование данных в <a href="/tag/subd" target="_blank">СУБД</a> на уровне строк.</li>
<li>Кэшируются полностью сформированные объекты <a href="/tag/python" target="_blank">Python</a>.</li>
<li>Некие данные вычисляются и отправляется каждому серверу для кэширования в локальной оперативной памяти. Эта стратегия годится далеко не всегда, чаще всего более эффективен другой метод: самым быстрым кэшем является само серверное приложение, а отправка уже готовых данных остальным серверам для дальнейшей обработки обычно не занимает так много времени. Для организации такого подхода необходимы агенты, осуществляющие отслеживание изменений, предварительную обработку и отправку данных.</li>
</ul>
<h3>Управление видео</h3>
<ul>
<li>Издержки включают в себя затраты на пропускную способность каналов связи, приобретение нового оборудования и оплату огромных счетов за электроэнергию.</li>
<li>Каждый видеоролик расположен на мини-кластере, что означает управление работой с ним группой из нескольких компьютеров.</li>
<li>Использование кластеров влечет за собой:
<dl>
<dd>&ndash; увеличение производительности пропорционально количеству дисков, на которых расположен контент;</dd>
<dd>&ndash; возможность поддержания функционирования всей системы даже в случае прекращения работоспособности части компьютеров;</dd>
<dd>&ndash; возможность организации создания резервных копий <a href="/tag/online" target="_blank">online</a>.</dd>
</dl>
</li>
<li>В роли HTTP-сервера для работы с видео используется <a href="/tag/lighttpd" target="_blank">lighttpd</a>:
<dl>
<dd>&ndash; Он способен дать фору <a href="/tag/apache" target="_blank">Apache</a> в плане производительности предоставления статического контента;</dd>
<dd>&ndash; Для работы с событиями ввода-вывода используется <strong>epoll</strong>;</dd>
<dd>&ndash; Многопоточная конфигурация способна обрабатывать большее количество соединений одновременно;</dd>
</dl>
</li>
<li>Самая популярная часть контента размещается в <strong><abbr title="Content Delievery Network">CDN</abbr></strong>
<dd>
<dd>&ndash; <strong><abbr title="Content Delievery Network">CDN</abbr></strong> реплицирует весь контент в разных частях системы;</dd>
<dd>&ndash; Компьютеры <strong><abbr title="Content Delievery Network">CDN</abbr></strong> в основном предоставляют данные напрямую из кэша в оперативной памяти, так как ассортимент популярного видео с течением времени меняется достаточно медленно.</dd>
</dl>
</li>
<li>Менее популярный контент, количество просмотров в день которого варьируется в диапазоне от одного до двадцати, обычно размещается на серверах <a href="/tag/youtube" target="_blank">YouTube</a>, расположенных в датацентрах на <em>colocation</em>:
<dl>
<dd>&ndash; Не смотря на тот факт, что такое видео может быть просмотрено всего несколько раз за день, количество таких роликов велико, что приводит к случайным блокировкам данных на жестких дисках;</dd>
<dd>&ndash; В такой ситуации кэширование практически бесполезно, инвестиции в кэширование контента с низкой вероятностью востребованности обычно является пустой тратой средств;</dd>
<dd>&ndash; Более детальная настройка низкоуровневых компонентов системы, таких как, например, RAID-контроллеры, в этой ситуации может достаточно положительно повлиять на производительность;</dd>
<dd>&ndash; Выбор оптимального размера оперативной памяти на каждой машине также очень важен: как недостаточное, так и излишнее ее количество не являются эффективными решениями.</dd>
</dl>
</li>
</ul>
<h4>Ключевые моменты</h4>
<ul>
<li>Чем <strong>проще</strong> &#8212; тем <strong>лучше</strong>;</li>
<li>Старайтесь минимизировать количество устройств (маршрутизаторов, коммутаторов и тому подобных) между контентом и пользователями: далеко не факт, что все они будут способны выдерживать интенсивную нагрузку;</li>
<li>Старайтесь использовать самое обыкновенное оборудование. Hi-end оборудование обычно влечет за собой рост издержек, связанных с сопутствующими процессами, например технической поддержкой, а также уменьшает вероятность нахождение решения той или иной проблемы с оборудованием в Сети;</li>
<li>Используйте самые простые распространенные утилиты. <a href="/tag/youtube" target="_blank">YouTube</a> использует идущий в комплекте с <a href="/tag/linux" target="_blank">Linux</a> набор утилит для построения системы именно на их основе;</li>
<li>Не забывайте о случайных доступах к жестким дискам, эту, казалось бы, мелочь тоже стоит настроить.</li>
</ul>
<h3>Управление миниатюрами видео</h3>
<ul>
<li>На удивление сложно решаемая задача, особенно если необходима эффективность;</li>
<li>Для каждого видео хранится 4 миниатюры, что приводит к существенному преобладанию количества миниатюр над количеством видеороликов;</li>
<li>Миниатюры хранятся всего на нескольких компьютерах;</li>
<li>Некоторые проблемы наблюдаются в связи с работой с большим количеством маленьких объектов:
<dl>
<dd>&ndash; Проблемы на уровне операционной системы, связанные с большим количеством запросов на поиск данных, а также кэшем страниц и <em>inode</em>&#8216;ов файловой системы;</dd>
<dd>&ndash; Ограничение на количество файлов в одной директории (особенно актуально для <strong>ext3</strong>), возможно частичное решение в виде перехода к более иерархической структуре хранения данных, а также переходе к ядру    <a href="/tag/linux" target="_blank">Linux</a> версии 2.6, что может привести к более чем стократному росту производительности, но в любом случае хранение такого огромного количества файлов в локальной файловой системе &#8212; не самая лучшая идея;</dd>
<dd>&ndash; Большое количество запросов в секунду, так как одна страница может содержать до 60 миниатюр различных видеороликов;</dd>
<dd>&ndash; В условиях таких нагрузок <a href="/tag/apache" target="_blank">Apache</a> показывает плохую производительность;</dd>
<dd>&ndash; Проводились эксперименты с использованием <a href="/tag/squid" target="_blank">squid</a> (обратной proxy) между <a href="/tag/apache" target="_blank">Apache</a> и посетителями. Какое-то время такой вариант казался работоспособным, но с ростом нагрузки производительность начала падать. С обработки 300 запросов в секунду она упала до 20;</dd>
<dd>&ndash; Попытки использовать <a href="/tag/lighttpd" target="_blank">lighttpd</a> также не завершились успехом: однопоточный режим не справлялся с задачей, а многопоточный требовал отдельного кэша для каждого потока, что сводило на нет его эффективность;</dd>
<dd>&ndash; С таким количеством изображений добавление в систему нового компьютера могло занимать более 24 часов;</dd>
<dd>&ndash; Перезагрузка занимала 6-10 часов, так как кэш должен был &#171;разогреться&#187; прежде чем перестать использовать данные с жестких дисков.</dd>
</dl>
</li>
<li>Решением всех описанных выше проблем стала распределенная система хранения данных <a href="/tag/bigtable" target="_blank">BigTable</a> от <a href="/tag/google" target="_blank">Google</a>:
<dl>
<dd>&ndash; Она позволяет избежать проблем, связанных с большим количеством файлов, так как объединяет маленькие файлы вместе.</dd>
<dd>&ndash; Она работает быстро и устойчива к сбоям, помимо этого она прекрасно приспособлена для работы по ненадежной сети.</dd>
<dd>&ndash; Уменьшает задержки, так как использует распределенный многоуровневый кэш, который способен работать даже между удаленными датацентрами.</dd>
</dl>
</li>
</ul>
<h3>Базы данных</h3>
<ul>
<li>Раньше:
<dl>
<dd>&ndash; <a href="/tag/mysql" target="_blank">MySQL</a> использовалась для хранения данных: пользователей, тэгов, описаний и так далее.</dd>
<dd>&ndash; Данные хранились на монолитном RAID 10 массиве, состоящем из 10 жестких дисков;</dd>
<dd>&ndash; Оборудование арендовалось, что негативно сказывалось на состоянии их кредитных карточек. В случае необходимости нового оборудования, на оформление заказа и доставку мог уходить далеко не один день.</dd>
<dd>&ndash; Они прошли через весь путь эволюции: сначала был один сервер, затем добавилось несколько дополнительных серверов, обслуживающих операции чтения, после чего они решили разбить базу данных на части, и, наконец, они пришли к полноценной распределенной архитектуре.</dd>
<dd>&ndash; Поначалу их система страдала от задержек, связанных с реплицированием. Основной сервер, обрабатывающий операции записи, являлся мощным сервером, работающим в многопоточном режиме, это было необходимо для своевременного выполнения большого объема работы. Второстепенные сервера, которые обрабатывали только операции чтения, асинхронно реплицировали данные в одном потоке, что влекло за собой возможность серьезного отставания некоторых из них.</dd>
<dd>&ndash; Обновления были причиной частого отсутствия необходимой информации в кэше, что заставляло сервера читать данные с жестких дисков. Этот факт сильно замедлял процесс чтения и репликации.</dd>
<dd>&ndash; Реплицирующая архитектура требует немалых вложений в оборудование, необходимого для поддержания постоянно растущих темпов записи информации.</dd>
<dd>&ndash; Основным из кардинальных решений, принятых в архитектуре системы было отделение обеспечения процесса просмотра видео от основного кластера. Основной целью посетителей является просмотр видео, а второстепенные задачи можно возложить и на менее производительный кластер.</dd>
</dl>
</li>
<li>Сейчас:
<dl>
<dd>&ndash; Используются распределенные базы данных;</dd>
<dd>&ndash; Сегментированная система <em>(прим.: <a href="/net/scalability/arkhitektura-flickr" target="_blank">по аналогии с Flickr</a>)</em>;</dd>
<dd>&ndash; Распределенные чтение и запись;</dd>
<dd>&ndash; Более эффективное расположение кэша, что ведет к уменьшению работы с жесткими дисками;</dd>
<dd>&ndash; Такая архитектура привела к 30%-й экономии на оборудовании;</dd>
<dd>&ndash; Задержки в реплицировании сведены к нулю;</dd>
<dd>&ndash; Размеры базы данных могут расти практически неограниченно</dd>
</dl>
</li>
</ul>
<h3>Стратегия размещения в датацентрах</h3>
<ul>
<li>Поначалу использовались хостинг провайдеры, предоставляющие услуги colocation. Не самый экономичный подход, но тогда не было другого выхода.</li>
<li>Хостинг провайдеры не могут поспеть за темпами роста проекта. Не всегда получается получить контроль над необходимым оборудованием или сделать необходимые соглашения о предоставлению сетевых услуг.</li>
<li>Решением этой проблемы стало создание собственной базы для размещения оборудования. Появилась возможность настраивать абсолютно все и подписывать свои собственные контракты такого рода.</li>
<li>Было использовано 5 или 6 разных датацентров в дополнение к <abbr title="Content Delievery Network">CDN</abbr>.</li>
<li>Видео поступает из случайного датацентра, никаких специальных проверок не проводится. Если ролик становится достаточно популярным &#8212; он перемещается в <abbr title="Content Delievery Network">CDN</abbr>.</li>
<li>Основным фактором, влияющим на доступность того или иного ролика является пропускная способность канала связи.</li>
<li>Для изображений же более актуальны задержки, особенно если на одной страницы должно быть размещено под 60 изображений.</li>
<li>Репликация изображений производится средствами <a href="/tag/bigtable" target="_blank">BigTable</a>. В этом случае используются различные меры для определения ближайшего места, откуда можно получить необходимые данные.</li>
</ul>
<h3>Подводим итоги</h3>
<ul>
<li><strong>Остановитесь на секунду.</strong> Креативные и рискованные трюки могут помочь справиться с задачей в краткосрочном периоде, но со временем понадобятся более продуманные решения.</li>
<li><strong>Расставьте приоритеты.</strong> Определите какие части Вашего сервиса являются более важными и стройте  систему обеспечения ресурсами и усилиями именно в соответствии с поставленными приоритетами.</li>
<li><strong>Выбирайте свои битвы.</strong> Не бойтесь пользоваться аутсорсингом в некоторых ключевых сервисах. <a href="/tag/youtube" target="_blank">YouTube</a> использует <abbr title="Content Delievery Network">CDN</abbr> для распределения своего наиболее популярного контента. Создание своей собственной подобной сети стоило бы им слишком много и потребовало бы слишком много времени. Возможно у Вас появятся подобные возможности в отношении Вашей системы.</li>
<li><strong>Будьте проще!</strong> Простота позволяет изменять архитектуру более быстро, что позволяет своевременно реагировать на возникающие проблемы. Никто на самом деле не знает что такое <em>простота</em>, но если Вы не боитесь делать изменения, то это неплохой знак что вашей системе свойственна та самая <em>простота</em>.</li>
<li><strong>Сегментирование.</strong> Сегментирование позволяет изолировать и ограничить дисковое пространство, процессорное время, оперативную память и ввод-вывод. Оно выполняется не только для повышения производительности операций записи.</li>
<li><strong>Постоянная работа над поиском и устранением узких мест в системе:</strong>
<dl>
<dd>&ndash; на программном уровне это чаще всего бывает кэширование и работа с <a href="/tag/subd" target="_blank">СУБД</a>;</dd>
<dd>&ndash; на уровне операционной системы &#8212; операции ввода-вывода;</dd>
<dd>&ndash; на уровне оборудования &#8212; оперативная память и RAID массивы.</dd>
</dl>
</li>
<li><strong>Залог Вашего успеха &#8212; командная работа.</strong> Хорошая команда разного рода специалистов должна понимать принцип системы вцелом и того, что лежит <em>под</em> ней. Каждый должен знать свое дело: настраивать принтеры, подключать к системе новые компьютеры, строить сети и так далее. С отличной командой Вам по силам все что угодно.</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-youtube/feed/</wfw:commentRss>
		<slash:comments>38</slash:comments>
		</item>
		<item>
		<title>Архитектура Flickr</title>
		<link>http://www.insight-it.ru/masshtabiruemost/arkhitektura-flickr/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-flickr/#comments</comments>
		<pubDate>Fri, 08 Feb 2008 19:41:28 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Apache]]></category>
		<category><![CDATA[Cvsup]]></category>
		<category><![CDATA[flickr]]></category>
		<category><![CDATA[Ganglia]]></category>
		<category><![CDATA[Java]]></category>
		<category><![CDATA[Linux]]></category>
		<category><![CDATA[Memcached]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[Perl]]></category>
		<category><![CDATA[PHP]]></category>
		<category><![CDATA[RedHat]]></category>
		<category><![CDATA[shard]]></category>
		<category><![CDATA[Smarty]]></category>
		<category><![CDATA[Squid]]></category>
		<category><![CDATA[Subcon]]></category>
		<category><![CDATA[SystemImager]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[архитектура Flickr]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[кластер]]></category>
		<category><![CDATA[сервер]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/net/scalability/arkhitektura-flickr/</guid>
		<description><![CDATA[Flickr является мировым лидером среди сайтов размещения фотографий. Перед Flickr стоит впечатляющая задача, они должны контролировать обширное море ежесекундно обновляющегося контента, непрерывно пополняющиеся легионы пользователей, постоянный поток новых предоставляемых пользователям возможностей, а делается все это при постоянной поддержке отличной производительности. Как же они это делают? Источники информации Как и предыдущий пост &#171;Архитектура Google&#187;, этот тоже [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.flickr.com" rel="nofollow" target="_blank">Flickr</a> является мировым лидером среди сайтов размещения фотографий. Перед Flickr стоит впечатляющая задача, они должны контролировать обширное море ежесекундно обновляющегося контента, непрерывно пополняющиеся легионы пользователей, постоянный поток новых предоставляемых пользователям возможностей, а делается все это при постоянной поддержке  отличной производительности. Как же они это делают?<br />
<span id="more-37"></span></p>
<h3>Источники информации</h3>
<p><em>Как и предыдущий пост <a href="/net/scalability/arkhitektura-google" target="_blank">&#171;Архитектура Google&#187;</a>, этот тоже является переводом <a href="http://highscalability.com/flickr-architecture" target="_blank" rel="nofollow">статьи</a> от <a href="http://highscalability.com/user/todd-hoff" target="_blank" rel="nofollow">Todd&#8217;а Hoff&#8217;а</a>. Возможно читателям <a href="/tag/google" target="_blank">Google</a> был более интересен, но подход Flickr к масштабируемости тоже более чем заслуживает внимания. Далее привожу источники информации из оригинальной статьи:</em></p>
<ul>
<li><a href="http://www.niallkennedy.com/blog/uploads/flickr_php.pdf" rel="nofollow" target="_blank">Flickr и PHP</a> (ранний документ)</li>
<li>Планирование нагрузок на LAMP</li>
<li><a href="http://www.bytebot.net/blog/archives/2007/04/25/federation-at-flickr-a-tour-of-the-flickr-architecture" rel="nofollow" target="_blank">Федерация Flickr: Тур по архитектуре Flickr</a></li>
<li><a href="http://highscalability.com/book-building-scalable-web-sites" rel="nofollow" target="_blank">Построение масштабируемых веб-сайтов</a> от Call Handerson&#8217;а из Flickr</li>
<li>История войн баз данных #3: Tim O&#8217;Reilly о Flickr</li>
<li><a href="http://www.iamcal.com/talks/" rel="nofollow" target="_blank">Cal Henderson&#8217;s Talks</a> &#8212; много полезных презентаций</li>
</ul>
<h3>Платформа</h3>
<ul>
<li><a href="/tag/php" target="_blank">PHP</a></li>
<li><a href="/tag/sql" target="_blank">MySQL</a></li>
<li>Сегментирование <em>(прим.: разбиение системы на части, обслуживающие каждая свою группу пользователей; называть можно было по-разному, но давайте остановимся на этом варианте перевода слова &#171;Shards&#187;)</em></li>
<li><a href="/tag/memcached" target="_blank">Memcached</a> для кэширования</li>
<li><a href="/tag/squid" target="_blank">Squid</a> в качестве обратной-прокси для html и изображений</li>
<li><a href="/linux" target="_blank">Linux</a> (<a href="/tag/redhat" target="_blank">RedHat</a>)</li>
<li><a href="/tag/smarty" target="_blank">Smarty</a> в роли шаблонизатора</li>
<li><a href="/tag/perl" target="_blank">Perl</a></li>
<li>PEAR для парсинга e-mail и XML</li>
<li>ImageMagick для обработки изображений</li>
<li><a href="/tag/java" target="_blank">Java</a> для узлового сервиса</li>
<li><a href="/tag/apache">Apache</a></li>
<li><a href="/tag/systemimager" target="_blank">SystemImager</a> для развертывания систем</li>
<li><a href="/tag/ganglia" target="_blank">Ganglia</a> для мониторинга распределенных систем</li>
<li><a href="/tag/subcon" target="_blank">Subcon</a> хранит важные системные конфигурационные файлы в SVN-репозитории для легкого развертывания на машины в кластере.</li>
<li><a href="/tag/cvsup" target="_blank">Cvsup</a> для распространения и обновления коллекций файлов по сети</li>
</ul>
<h3>Статистика</h3>
<ul>
<li>Более четырех миллиардов запросов в день</li>
<li>Примерно 35 миллионов фотографий в кэше <a href="/tag/squid" target="_blank">Squid</a></li>
<li>Около двух миллионов фотографий в оперативной памяти <a href="/tag/squid" target="_blank">Squid</a></li>
<li>Всего приблизительно 470 миллионов изображений, каждое представлено в 4 или 5 размерах</li>
<li>38 тысяч запросов к <a href="/tag/memcached" target="_blank">memcached</a> (12 миллионов объектов)</li>
<li>2 петабайта дискового пространства</li>
<li>Более 400000 фотографий добавляются ежедневно</li>
</ul>
<h3>Архитектура</h3>
<p>Симпатичное изображение архитектуры Flickr можно увидеть на <a href="http://www.slideshare.net/techdude/scalable-web-architectures-common-patterns-and-approaches/138" target="_blank" rel="nofollow">этом слайде</a>. Краткое ее описание выглядит следующим образом:<br />
–– Два ServerIron<br />
–––– <a href="/tag/squid" target="_blank">Squid</a> кэши<br />
–––––– Системы хранения NetApp<br />
–––– Серверы <a href="/tag/php" target="_blank">PHP</a>-приложений<br />
–––––– Менеджер хранения данных<br />
–––––– Master-master сегменты<br />
–––––– Центральная база данных, структурированная по принципу Dual Tree<br />
–––––– <a href="/tag/memcached" target="_blank">Memcached</a> кластер<br />
–––––– Поисковая система</p>
<dl> </dl>
<dl>
<dd>– Структура Dual Tree является индивидуальным набором модификаций для <a href="/tag/sql" target="_blank">MySQL</a>, позволяющим масштабировать систему путем добавления новых мастер-серверов без использования кольцевой архитектуры. Эта система позволяет экономить на масштабировании, так как варианты мастер-мастер требовали бы удвоенных вложений в оборудование.</dd>
</dl>
<dl>
<dd>– Центральная база данных включает в себя таблицу пользователей, состоящую из основных ключей пользователей (несколько уникальных идентификационных номеров) и указатель на сегмент, на котором может быть найдена остальная информация о конкретном пользователе.</dd>
</dl>
<ul>
<li>Использование выделенных серверов для статического контента</li>
<li>Все, за исключением фотографий, хранится в базе данных</li>
<li>Отсутствие состояний заключается в том, что в случае необходимости они имеют возможность передать пользователей от сервера к серверу, что стало намного проще для них после создания своего API</li>
<li>В основе масштабируемости лежит репликация, но этот факт помогает лишь при обработке операций чтения</li>
<li>Для поиска по определенной части базы данных создается отдельная копия этого фрагмента</li>
<li>Использования горизонтального масштабирования для того чтобы можно было проще добавлять новые машины в систему</li>
<li>Обработка изображений, полученных от пользователей по электронной почте, происходит с помощью <a href="/tag/php" target="_blank">PHP</a></li>
<li>Раньше система страдала от задержек связанных с организацией по принципу мастер-слуга. При слишком большой нагрузке они имели одну точку, которая теоретически могла дать сбой.</li>
<li>Им было необходимо иметь возможность проводить технические работы во время непрерывной работы сайта, не прекращая его функционирование.</li>
<li>Были проведены отличные работы по планированию распределения дискового пространства, более подробную информацию можно найти по ссылкам в разделе &#171;Источники информации&#187;.</li>
<li>Для обеспечения возможности масштабирования в будущем, они пошли по федеративному пути развития:
<dl>
<dd>– <em>Сегменты системы:</em> Мои данные хранятся на моем сегменте, но запись о Вашем комментарии хранится на Вашем сегменте.</dd>
<dd>– <em>Глобальное кольцо:</em> Принцип работы схож с DNS, Вам необходимо знать куда Вы хотите пойти и кто контролирует то место, куда Вы собираетесь пойти.</dd>
<dd>– Логика на <a href="/tag/php" target="_blank">PHP</a> устанавливает соединение с сегментом и поддерживает целостность данных (10 строк кода с комментариями!)</dd>
</dl>
</li>
<li><strong>Сегменты:</strong>
<dl>
<dd>– Срез основной базы данных</dd>
<dd>– Активная репликация по принципу мастер-мастер: имеет несколько недостатков в <a href="/tag/sql" target="_blank">MySQL</a> 4.1. Автоматическое инкрементирование идентификационных номеров используется для поддержания системы в режиме одновременной активности обоих серверов в паре</dd>
<dd>– Привязывание новых учетных записей к сегментам системы происходит случайным образом</dd>
<dd>– Миграция пользователей проводится время от времени для того, чтобы избавиться от проблем, связанных с излишне активными пользователями. Необходима сбалансированность в этом процессе, особенно в случаях с большим количеством фотографий… 192 тысячи фотографий, 700 тысяч тэгов, может занять несколько минут. Миграция выполняется вручную.</dd>
</dl>
</li>
<li>Нажатие на <strong>Favorite</strong>:
<dl>
<dd>– Получается информация об учетной записи владельца из кэша для того, чтобы узнать к какому сегменту он привязан (допустим на shard-5)</dd>
<dd>– Получается информация о моей учетной записи из кэша, более конкретно &#8212;  мой сегмент (например shard-13) </dd>
<dd>– Начинается &#171;распределенная трансакция&#187; для определения ответов на вопросы: Кто добавил эту фотографию в избранное? Как изменился список избранных фотографий?</dd>
</dl>
</li>
<li>Подобные вопросы могут задаваться любому сегменту, информация на них абсолютно избыточна.</li>
<li>Для избавления от задержек, связанных с репликацией&#8230;
<dl>
<dd>– при каждой загрузке страницы, пользователю предоставляется список серверов</dd>
<dd>– если сервер не в состоянии ответить на запрос, запрос переходит к следующему серверу в списке; если список кончился &#8212; выводится сообщение об ошибке. При этом не используются постоянные соединения, каждый раз создаются и разрываются новые соединения.</dd>
</dl>
</li>
<li>Запросы на чтение и запись от каждого пользователя ограничиваются рамками одного сегмента. Задержки репликации исчезают из поля зрения пользователей.</li>
<li>Каждый сервер в рамках одного сегмента в обычном состоянии нагружен ровно на половину. Выключите половину серверов в каждом сегменте и система продолжит функционировать без изменений. Это значит, что один сервер внутри сегмента может взять на себя всю нагрузку второго, в то время как второй сервер может по каким либо причинам быть отключен от системы, например для проведения технических работ. Обновление оборудования производится очень просто: отключается половина сегмента, она же обновляется, подключается обратно, процесс повторяется для оставшейся половины.</li>
<li>Периоды пиковой нагрузки также нарушают правило 50% нагрузки. В такие моменты система получает 6-7 тысяч запросов в секунду, в то время как на данный момент система может работать на пятидесятипроцентном уровне нагрузки только при четырех тысячах запросов в секунду.</li>
<li>В среднем при загрузке одной страницы выполняется 27-35 SQL-запросов. Списки избранных фотографий обрабатываются в реальном времени, ровно как и доступ через API к базе данных. Все требования к нагрузке в реальном времени выполняются без каких-либо недостатков.</li>
<li>Более 36 тысяч запросов в секунду может выполняться не выходя за рамки возможностей системы, даже при резком росте трафика.</li>
<li>Каждый сегмент содержит данные о более чем 400 тысячах пользователей.
<dl>
<dd>– Многие данные хранятся в двух местах одновременно. Например, комментарий является частью между комментатором и автором комментируемого контента. Где его хранить? Как насчет обоих мест? Трансакции используются для предотвращения рассинхронизации данных: открывается первая трансакция, выполняется запись, открывается вторая трансакция, выполняется запись, подтверждается первая трансакция если все нормально, после чего вторая подтверждается только в случае  если первая прошла успешно.</dd>
</dl>
</li>
<li><strong>Поиск:</strong>
<dl>
<dd>- Используется два варианта поиска: поиск в рамках сегмента, поддерживающий до 35 тысяч запросов в секунду, а также проприетарный веб-поиск от Yahoo!</dd>
<dd>- В 90% случаев используется система от Yahoo!, за исключением поиска по тэгу фотографий одного пользователя и массовых изменений тэгов.</dd>
<dd>- Эту систему стоит рассматривать как аналог Lucene.</dd>
</dl>
</li>
<li><strong>Оборудование:</strong>
<dl>
<dd>- EMT64 под управлением RHEL 4 с 16 Gb оперативной памяти.</dd>
<dd>- 6 жестких дисков с 15000rpm, объединены в RAID-10.</dd>
<dd>- Размер для пользовательских метаданных достигает 12 терабайт (это не включает фотографии, для них цифры существенно больше).</dd>
<dd>- Используются 2U корпуса.</dd>
</dl>
</li>
<li><strong>Процедура резервного копирования данных:</strong>
<dl>
<dd>- ibbackup выполняется регулярно посредством cron daemon&#8217;а, на каждом сегменте настроен на разное время.</dd>
<dd>- Каждую ночь делается снимок со всего кластера баз данных.</dd>
<dd>- Запись или удаление нескольких больших файлов с резервными копиями одновременно на реплицирующую систему хранения может сильно сократить производительность системы вцелом на последующие несколько часов из-за процесса репликации. Выполнение этого на активно работающей системе хранения фотографий было бы не самой лучшей идеей.</dd>
<dd>- Содержание нескольких резервных копий всех Ваших данных требует существенных материальных затрат, но оно того стоит. Особенно это актуально для тех ситуаций, когда Вы понимаете, что что-то пошло не так только спустя несколько  дней после того как это случилось, в таких случаях неплохо иметь, например, резервные копии 1, 3, 10 и 30-дневной давности.</dd>
</dl>
</li>
<li>Фотографии хранятся в системе хранения данных. После загрузки изображения система выдает различные его размеры, на чем ее работа заканчивается. Метаданные и ссылки на файловые системы, где расположены фотографии, хранятся в базе данных.</li>
<li>Аггрегация данных проходит очень быстро, так как она ограничена пределами сегмента.</li>
<li>max_connections = 400 соединений на каждый сегмент, неплохой запас. Значение для кэша потоков установлено равным 45, так как не бывает ситуаций когда более 45 пользователей одновременно выполняют какие-либо действия с одним конкретным сегментом.</li>
<li><strong>Тэги:</strong>
<dl>
<dd>- Тэги плохо вписываются в традиционную нормализованную схему реляционной базы данных. Денормализация или активное кэширование &#8212; единственные способы сгенерировать облако меток для сотен миллионов тэгов в течении миллисекунд.</dd>
<dd>Некоторые данные обрабатываются отдельными вычислительными кластерами, которые сохраняют результаты своей работы в MySQL, так как иначе вычисление сложных отношений заняло бы все процессорное время основных серверов баз данных.</dd>
</dl>
</li>
<li>Направления для развития: ускорение работы с помощью создания организационного плана для непрерывной работы всей системы на уровне нескольких датацентров, таким образом чтобы все датацентры имели возможность получать запросы на общий уровень данных (как сами БД, так и memcache и прочее) все вместе одновременно. Если все части системы постоянно активны &#8212; время простоя оборудования будет сведено к минимуму.</li>
</ul>
<h3>Подводим итоги</h3>
<ul>
<li>Старайтесь думть о своем приложении как о чем-то большем, чем просто веб-приложении, тогда у Вас возможно появятся поддержка различных API, RSS и Atom ленты и многие другие возможности.</li>
<li>Отсутствие состояний системы позволяет более  легко выполнять модернизации не моргнув и глазом.</li>
<li>Реструктуризация базы данных &#8212; не самое лучшее занятие.</li>
<li>Планирование нагрузок должно проводиться уже на ранних этапах развития проекта</li>
<li>Начинайте медленно. Не покупайте сразу много оборудования просто из-за того, что Вы рады/боитесь, что ваш сайт взорвется.</li>
<li>Измеряйте реально, планирование нагрузок должно базироваться на реальных вещах, а не абстрактных.</li>
<li>Внедряйте ведение логов и индивидуальные измерения для оценки реальных показателей на основе серверной статистики, статистика использования не менее важна чем серверная.</li>
<li>Кэширование и оперативная память может стать ответом на все вопросы.</li>
<li>Создавайте четкие уровни абстракции между работой базы данных, бизнес-логикой, логикой страниц, разметкой страниц и презентационным уровнем. Это позволяет ускорить циклы итеративной разработки.</li>
<li>Разделение приложения на уровни позволяет каждому заниматься своим делом: разработчики могут строить логику страниц, в то время как дизайнеры работают с удобством работы для пользователей.</li>
<li>Делайте релизы как можно чаще, пускай даже это будет происходить каждые полчаса.</li>
<li>Забудьте о всех небольших эффективных вещах, предварительная оптимизация является корнем всего зла в примерно 97% всех случаев.</li>
<li>Тестируйте в работе. Постройте архитектурные механизмы (флаги конфигурации, балансировку нагрузки, и так далее), которые позволят Вам разворачивать новое оборудование в (и из) работу.</li>
<li>Забудьте об искусственных тестах, они годятся только для получения общего представления о нагрузках, но не для планирования. Искуственные тесты дают искусственные результаты, для настоящих тестов все же стоит пользоваться реальным временем выполнения задач.</li>
<li>Найдите максимальное значения для всех показателей:
<dl>
<dd>- Какой максимум чего-то, что может выполнять каждый сервер?</dd>
<dd>- Как близко параметр находится к максимуму и каковы тенденции?</dd>
<dd>- <a href="/tag/sql" target="_blank">MySQL</a> (дисковый ввод/вывод?)</dd>
<dd>- <a href="/tag/squid" target="_blank">Squid</a> (дисковый ввод/вывод? или процессорное время?)</dd>
<dd>- <a href="/tag/memcached" target="_blank">Memcached</a> (процессорное время? или пропускная способность сети?)</dd>
</dl>
</li>
<li>Старайтесь учесть особенности использования Вашего приложения.
<dl>
<dd>- Возможен ли резкий рост нагрузки, связанный с каким-либо событием? Например: какое-либо бедствие, или может быть новость?</dd>
<dd>- Flickr получает на 20-40% больше новых фотографий в первый рабочий день нового года, чем в любой пик в предыдущем году.</dd>
<dd>- По воскресеньям нагрузка в среднем на 40-50% выше, чем в любой другой день недели.</dd>
</dl>
</li>
<li>Учтите возможность экспонентациального роста. Больше пользователей означает больше контента, больше контента означает больше соединений, больше соединений означает более активное использование.</li>
<li>Планируйте возможные варианты управления работой системы в периоды пиковых нагрузок.</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-flickr/feed/</wfw:commentRss>
		<slash:comments>41</slash:comments>
		</item>
		<item>
		<title>Общаемся с базой данных</title>
		<link>http://www.insight-it.ru/programmirovanie/php/obshhaemsya-s-bazojj-dannykh/</link>
		<comments>http://www.insight-it.ru/programmirovanie/php/obshhaemsya-s-bazojj-dannykh/#comments</comments>
		<pubDate>Wed, 16 Jan 2008 19:04:09 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[PHP]]></category>
		<category><![CDATA[SQL]]></category>
		<category><![CDATA[MySQL]]></category>
		<category><![CDATA[PostgreSQL]]></category>
		<category><![CDATA[БД]]></category>
		<category><![CDATA[интерфейс]]></category>
		<category><![CDATA[кодинг]]></category>
		<category><![CDATA[ООП]]></category>
		<category><![CDATA[СУБД]]></category>
		<category><![CDATA[технология]]></category>
		<category><![CDATA[хранение данных]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/programming/php/obshhaemsya-s-bazojj-dannykh/</guid>
		<description><![CDATA[На этот раз хочется обсудить такой одновременно важный и несложный момент в реализации работы любого интернет-проекта, как координации работы Ваших скриптов с СУБД. Если подойти к этому вопросу &#34;в лоб&#34;, то код станет очень неудобен как для понимания, так и для использования: код станет переполнен различными функциями соединения с БД, отправки запросов, преобразования результатов запросов [...]]]></description>
			<content:encoded><![CDATA[<p>На этот раз хочется обсудить такой одновременно важный и несложный момент в реализации работы любого интернет-проекта, как координации работы Ваших скриптов с СУБД.</p>
<p>Если подойти к этому вопросу &quot;в лоб&quot;, то код станет очень неудобен как для понимания, так и для использования: код станет переполнен различными функциями соединения с БД, отправки запросов, преобразования результатов запросов в массивы PHP, подсчета строк, которые затронул запрос, а также многие и многие другие.</p>
<p>Для желающих минимизировать подобного рода издержки в процессе написания кода, хочу предложить один из, на мой взгляд, самых эффективных способов решения этой проблемы.</p>
<p><span id="more-26"></span></p>
<p>Этим способом будет являться написание класса, реализующего интерфейс между СУБД и PHP-скриптами. Для начала стоит определиться с ассортиментом функций, которые будет призван выполнять наш класс:</p>
<ul>
<li><em>установка соединения</em>, а также проверка успешности выполнения этого действия;</li>
<li><em>отправка запросов</em>, как заданных извне так и, возможно, из какого-либо ассортимента заранее написанных запросов;</li>
<li><em>обработка результатов запросов</em>, не ограничивающаяся одним SELECT, должны быть предоставлены методы обработки результатов любых видов запросов (или хотябы большинства).</li>
</ul>
<p>Вполне очевидным является тот факт, что методы этого класса будут использоваться практически повсеместно в большинстве проектов. Вследствии чего становится нецелесообразным создание объекта нашего класса и передача его по всем функциям и методам всех скриптов, в таких случае намного предпочтительнее делать владельцем методов и переменных сам класс, а не экземпляр класса, с помощью ключевого слова <strong>static</strong>. Это позволит пользоваться услугами нашего класса из любого места кода. Приступим-с собственно к кодингу, начать стоит с заготовки пустого класса:</p>
<pre lang="PHP">
<?php
class SQL
{
  private static $connection; // соединение с СУБД
  static function connect()  // установка соединения
  {

  }
  static function query($str,$bool=false) // произвольный запрос
  {

  }

?>
</pre>
<p>В зависимости от предпочитаемой Вами СУБД набор конкретных функций, используемых в реализации нашего класса, будет вариироваться. В большинстве случаев предпочитаю пользоваться PostgreSQL, на это причин у меня несколько, но это тема для отдельного разговора. Благодаря этому факту приводимый в качестве примера код будет использовать функции для работы именно с этой СУБД. Для поклонников же других этот систем вопрос в подавляющем большинстве случаев заключается лишь в замене этих функций на аналогичные из других модулей PHP, например для популярной и широкораспространенной MySQL достаточно будет всеголишь пройтись автозаменой <strong>pg_ =&gt; mysql_</strong> и слегка подредактировать параметры некоторых функций.</p>
<p>Перейдем к реализации установления соединения с СУБД, не стоит ожидать увидеть здесь ничего необычного:</p>
<pre lang="PHP">
static function connect()  // установка соединения
{
  self::$connection=pg_pconnect("host=localhost dbname=pgsql user=pgsql password=MyPassword");
  // не забываем менять указанные данные для авторизации на правильные
  if(!isset(self::$connection))
  {
    echo "Сайт не работает по техническим причинам.Просим прощения за доставленные неудобства.";
    exit;	// ни в коем случае не выводим более информативных сообщений об ошибке, чем это
  }
}
</pre>
<p>А вот с отправкой и обработкой результатов запросов ситуация далеко не так однозначна. Помимо простой передачи самого текста запроса в СУБД, необходимо правильно определить тип запроса и в соответствии с этим обработать результат. Можно конечно попытаться сделать это автоматически на основе вытаскивания первого слова из текста запроса, но мне всетаки кажется более предпочтительным определение &quot;вручную&quot; желаемого вида представление результата. Выполнение произвольных запросов может выглядеть, например, следующим образом:</p>
<pre lang="PHP">
static function query($str,$bool=false) // произвольный запрос
{
  //echo $str.""; // очень удобно на стадии разработки в процессе поиска ошибок
  $result=@pg_query(self::$connection,$str); // @ - для сокрытия теоретически возможных ошибок
  // or die('Query failed: '.pg_last_error());
  // не забываем убирать в комментарий в финальном варианте проекта
  // или совсем удалять
  if($result)  // Если получен результат, отличный от false
  {
    if($bool)  // Если выбран результат в виде boolean
    {
      return true;
    }
    else  // Если выбран результат в виде массива
    {
      $n=pg_num_rows($result);	// для создания универсального формата массива
      if($n==1)return pg_fetch_array($result,0,PGSQL_ASSOC);
      else  // даже когда результат содержит только одну строку
      {
        $j=pg_num_rows($result);
        $list=array();
        for($i=0;$i<$j;$i++)
        $list[]=pg_fetch_array($result,$i,PGSQL_ASSOC);
        return $list;
      }
    }
  }else return false;
}
</pre>
<p>Помимо базовой отправки запросов, в некоторых случаях имеет смысл написать несколько методов, отправляющих частоиспользуемые запросы, что в некоторых случаях позволяет сократить объем и уменьшить нагроможденность кода. Хоть я и предпочитаю не пользоваться такими вещами, но привести пример такого рода метода все же стоит:</p>
<pre lang="PHP">
static function selectAll($table)
{ // пример метода отправки чаcтоиспользуемых запросов
  return self::query("select * from ".$table.";");
}
</pre>
<p>Если чувствуете необходимость в подобных функциях, можно написать огромное количество, все ограничивается лишь Вашим воображением и знаниями SQL.</p>
<p>Что ж, осталось лишь собрать весь код в <a href="/wp-content/uploads/source/sql.class.phps">единый листинг</a>:</p>
<pre lang="PHP">
<?php
class SQL
{
  private static $connection; // соединение с СУБД
  static function connect()  // установка соединения
  {
    self::$connection=pg_pconnect("host=localhost dbname=pgsql user=pgsql password=MyPassword");
    // не забываем менять указанные данные для авторизации на правильные
    if(!isset(self::$connection))
    {
      echo "Сайт не работает по техническим причинам.Просим прощения за доставленные неудобства.";
      exit;	// ни в коем случае не выводим более информативных сообщений об ошибке, чем это
    }
  }
  static function query($str,$bool=false) // произвольный запрос
  {
    //echo $str.""; // очень удобно на стадии разработки в процессе поиска ошибок
    $result=@pg_query(self::$connection,$str); // @ - для сокрытия теоретически возможных ошибок
    // or die('Query failed: '.pg_last_error());
    // не забываем убирать в комментарий в финальном варианте проекта
    // или совсем удалять
    if($result)  // Если получен результат, отличный от false
    {
      if($bool)  // Если выбран результат в виде boolean
      {
        return true;
      }
      else  // Если выбран результат в виде массива
      {
         $n=pg_num_rows($result);	// для создания универсального формата массива
         if($n==1)return pg_fetch_array($result,0,PGSQL_ASSOC);
         else  // даже когда результат содержит только одну строку
         {
           $j=pg_num_rows($result);
           $list=array();
           for($i=0;$i<$j;$i++)
           $list[]=pg_fetch_array($result,$i,PGSQL_ASSOC);
           return $list;
         }
      }
    }else return false;
  }
  static function selectAll($table)
  { // пример метода отправки чаcтоиспользуемых запросов
    return self::query("select * from ".$table.";");
  }
}
?>
</pre>
<p>Вот так вот оно и выглядит в простейшем варианте, дорабатывать под собственные нужды код можно до бесконечности естественно, но в большинстве случаев даже такой реализации вполне должно хватать.</p>
<p>Эта статья является частью <a href="/dzhentelmenskij-nabor-php-programmista">серии статей "Джентельменский набор PHP программиста"</a>, если Вам понравилась эта статья то очень вероятно, что Вам придутся по душе и остальные статьи.</p>
<p>Не забываем <a href="/feed" target="_blank">подписываться на RSS блога</a>, а также на <a href="/comments/feed" target="_blank">ленту комментариев</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/programmirovanie/php/obshhaemsya-s-bazojj-dannykh/feed/</wfw:commentRss>
		<slash:comments>21</slash:comments>
		</item>
	</channel>
</rss>

