Insight IT

Информационные технологии

Seems like I'm back

Опубликовано 12 октября 2009, автор: Иван Блинков

Пресловутый кризис добрался-так и до стартапчика, в котором я работал последние полтора года, фирма практически развалилась на глазах за последние несколько месяцев, не смотря на многообещающую технологию поиска изображений и вполне существенные инвестиции в прошлом. Апогеем данного процесса стала «реорганизация», заключающаяся в банальном сокращении 70% сотрудников и без того немногочиленной компании. Что ж, в общем я остался без работы, что судя по всему освободило массу моего времени. Таким образом помимо учебы (кстати если кому интересно: я летом получил степень бакалавра, и теперь учусь на магистерской программе «Электронный бизнес») я теперь запросто смогу снова заняться ведением моего давно заброшенного блога. Ждите новых постов :)
Кстати работу я все же не торопясь ищу, если у кого есть какие предложения — я завел под это дело отдельный ящик hh@blinkov.ru.
Некое подобие резюме можно прочитать вот по этой ссылке.

Архитектура Plenty of Fish

Опубликовано 18 января 2010, автор: Иван Блинков

Plenty of Fish представляет собой очень популярный сервис онлайн знакомств, насчитывающий более 45 миллионов посетителей в месяц и 30+ миллионов просмотров страниц в сутки (что составляет около 500-600 страниц в секунду). Но это не самая интересная часть истории... Все это управляется единственным человеком при использовании нескольких серверов, при этом он тратит на работу всего пару часов в день и зарабатывает 6 миллионов долларов на рекламе от Google. Завидуете? Я тоже :) Как же ему удалось соединить столько влюбленных пар, используя так мало ресурсов? (далее...)

Aladdin от Baidu

Опубликовано 14 января 2010, автор: Иван Блинков

Aladdin Logo

Наверняка все прекрасно знают о лидерах интернет-поиска в российской части интернета: про Google, Яндекс или Рамблер сказано уже не мало слов, все много раз о них читали, пользовались, обсуждали — ведь уже прошло больше 10 лет с момента создания каждой из этих поисковых систем и, как следствие, их конкуренции на просторах рунета. Намного меньше же внимания на российских информационных сайтах уделяется национальным проектам других стран, а ведь среди них тоже есть заслуживающие внимания экземпляры, об одном из них я бы и хотел сегодня поведать.
(далее...)

Sun Unified Storage

Опубликовано 13 января 2010, автор: Иван Блинков

По работе мне доводилось активно «иметь дело» с железкой от Sun под названием Sun Unified Storage 7410. Представляет собой достаточно мощную систему хранения данных с установленным Solaris, но доступом и управлением исключительно через веб-интерфейс. Основной «фишкой» системы является модульность: дисковый массив наращивается подключаемыми внешне дисковыми модулями по примерно 20-50ТБ, сетевой интерфейс также модульный — на выбор начиная от нескольких обычных Ethernet по 1GBps и заканчивая оптоволокном, CX4 или InfiniBand. Две таких машины можно легко объединить в одну виртуальную для повышения надежности доступа к данным, подключив к ним общий дисковый массив. RAID используется софтверный средствами ZFS, вполне стандартный набор опций из зеркалирования, stripe, RAID5/6 и их комбинаций.

С точки зрения производительности тоже достаточно интересная штука: при подключении через 4x 1GBps Ethernet (с использованием LACP, но это тема для отдельного поста) определенно упирается в сеть, но все равно отлично подходит для использования в решении многих прикладных задач. Из интересных опций можно отметить прозрачное использование нескольких SSD-дисков в каждом дисковом массиве в роли кэша.

Все функции системы абсолютно прозрачны и настраиваются в несколько кликов через веб-интерфейс, командная строка хоть при желании и доступна, но практически не нужна. Там же можно увидеть статистику использования подсистем и прочую полезную информацию. В целом отличная система хранения данных: простая, надежная, быстрая, удобная, вместительная и масштабируемая, правда с одним большим НО — цена просто зашкаливает, прицениться можно, сходив по ссылке в начале записи, но вообще есть и более дешевые модели в этой серии.

К чему я это все вспомнил? На почту пришел очередной рекламный буклет от Sun с предложением попробовать Sun Unified Storage в виртуальной машине VirtualBox или VMWare, сам еще не установил — времени не нашлось, но возможно Вам покажется интересным. Конечно это не совсем то же самое, что и физическая железка — производительность дисковых и сетевых подсиситем не померять, но веб-интерфейс заценить можно.

Архитектура Stack Overflow

Опубликовано 8 января 2010, автор: Иван Блинков

Stack Overflow

Stack Overflow является любимым многими программистами сайтом, где можно задать профессиональный вопрос и получить ответы от коллег. Этот проект был написан двумя никому не известными парнями, о которых никто никогда раньше не слышал. Хорошо, не совсем так. Stack Overflow был создан топовыми программистами и звездами блогосферы: Jeff Atwood и Joel Spolsky. В этом отношении Stack Overflow похож на ресторан, владельцами которого являются знаменитости. По оценкам Joel'а около 1/3 программистов всего мира использовали этот интернет-ресурс, так что должно быть он представляет собой что-то достаточно полезное и интересное.

Одним из ключевых моментов в истории Stack Overflow является использование вертикального масштабирования, как достаточно работоспособного решения достаточного большого класса проблем. Не смотря на то, что публика на сегодняшний день больше склоняется к подходу с использованием горизонтальным масштабирования и не-SQL баз данных.

Если Вы стремитесь к масштабу Google, у Вас нет другого выхода, как двигаться в направлении не-SQL. Но Stack Overflow — это не Google, ровно как и подавляющее большинство других сайтов. Когда Вы задумываетесь о возможных вариантов дизайна Вашего проекта, попробуйте учесть и историю Stack Overflow, она тоже имеет право на жизнь. В этот век многоядерных машин с большим объемом оперативной памяти и невероятными темпами развития методов параллельного программирования, вертикальное масштабирование все еще является жизнеспособной стратегией и не должна сразу же отбрасываться в сторону просто так как это теперь больше не модно. Возможно в один прекрасный день мы получим лучшее из обоих миров, но на сегодняшний момент перед нами лежит большой болезненный выбор стратегии масштабирования, от которого определенно зависит судьба Вашего проекта.

Joel любит похвастаться тем, что они достигли производительности, сравнимой с другими сайтами аналогичных размеров, используя в 10 раз меньше оборудования. Он удивляется, работали над этими сайтами по-настоящему хорошие программисты. Давайте взглянем на то, как им это удалось, и дадим Вам возможность побыть судьей.

(далее...)

Terrastore

Опубликовано 7 января 2010, автор: Иван Блинков

Terrastore является свежеиспеченной системой хранения документов, с отличными возможностями по масштабируемости и эластичной настройке, при этом без жертв со стороны консистентности данных.

Вместо подробного описания несколько ключевых характеристик продукта:

  • Легкодоступность: данные доступны посредством повсеместно используемого протокола HTTP.
  • Распреденность: узлы могут работать и существовать на любых доступных серверах.
  • Эластичность: имеется возможность динамического добавления и удаления узлов кластера на лету, без малейшего простоя системы и каких-либо изменений в конфигурации.
  • Масштабируемость на уровне данных: документы разбиваются на группы и распределяются между доступными узлами с автоматической прозрачной балансировкой, в том числе и при добавлении и исключении узлов в кластере.
  • Масштабируемость на вычислительном уровне: запросы и обновление данных распределяются по узлам, которые физически хранят используемые данные, тем самым минимизируется трафик и распределяется вычислительная нагрузка.
  • Консистентность: система обеспечивает по-документную консистентность данных, таким образом гарантируя тот факт, что пользователь всегда получает самую свежую версию документа, обеспечивая изоляцию для параллельных модификаций документов.
  • Отсутствие схемы: предоставляет JSON интерфейс, основанный на коллекциях; пользователям предоставляется возможность просто создать свою коллекцию и положить туда что угодно.
  • Простота в работе: установка полностью работоспособного кластера заключается в вводе всего нескольких команд и не требует какого-либо редактирование XML-конфигов.
  • Богатый функционал: поддерживаются push-down предикаты, запросы по диапазонам и серверные функции обновления.

Если Вам показалось интересным, у Вас есть возможность получить более подробную информациюпринять участие в проектескачать дистрибутив или получить копию исходного кода!
 (далее...)

Нам два годика

Опубликовано 3 января 2010, автор: Иван Блинков

В общем судя по всему я решил считать 3 января 2008 года Днем Рождения Insight IT, так что как раз самое время написать очередной бестолковый «праздничный» пост, по совместительству выполняющий роль «новогоднего» (надо же поздравить всех читателей с Наступившим, хоть и несколько поздновато; отметил я просто замечательно и три дня провел без интернета). В повестке дня у нас сегодня обзор основных событий прошедшего года и планы на наступивший, кому интересно — читаем дальше ;) (далее...)

Новый Google: интернет-гигант проливает свет на темы поиска в реальном времени, локального поиска, облачных вычислений и освобождения данных

Опубликовано 29 декабря 2009, автор: Иван Блинков

Когда речь заходит о продуктовых и бизнес стратегиях, Google обычно становится одной из самых скрытных и секретных компаний. Но не смотря на это, интернет-гигант некоторое время назад согласился дать серию интервью, в основном с участием высшего продуктового менеджмета, работающего в штабквартире в Mountain View, CA.

В четырех отдельных интервью, сотрудники Google окунулись в самые насущные темы, наиболее актуальные для компании в целом. Среди них оказались различные вопросы, начиная с поиска в реальном времени, локального поиска, и заканчивая облачными вычислениями, а также так называемой возможностью освобождения данных. Под освобождением данных имеется ввиду комплекс мер, направленных на предоставлении пользователям возможности экспортировать их файлы и другую цифровую информацию из продуктов Google (если они сами этого захотят, конечно же).

Достаточно любопытный факт: менеджеры Google реально очень скучные. И им правда нравится выглядеть именно так (по крайней мере пока их PR-коллеги находятся рядом). Они не разговаривают о конкурентах. Они не делают прогнозов о развитии индустрии. И они не говорят конкретно кто над чем работает внутри Google. Просто-напросто они фокусируются на совершенствовании своих продуктов, особенно в направлении удобства использования пользователями, разве этого не достаточно?

Возможно Jack Menzel, старший продукт-менеджер, лучше всего это выразил, когда пошутил о «неблагодарности» работы над веб-поиском в Google: «Вы демонстрируете [новую функцию поиска] людям, а они говорят: 'Да, вроде она работает, ну и что?'» (Как быстро все мы забываем, каково это было искать информацию в Интернете всего несколько лет назад.) Что ж, без дальнейших предисловий, перейдем к основным моментам, связанным с различными аспектами работы Google.

(далее...)

Дизайн, верстка и RSS

Опубликовано 28 декабря 2009, автор: Иван Блинков

Я лично считаю, что очень важно после каких-либо кардинальных изменений сайта получить feedback от пользователей. Данный пост служит именно для этих целей. (далее...)

Архитектура MySpace

Опубликовано 21 декабря 2009, автор: Иван Блинков

MySpace.com является одним из наиболее быстро набирающих популярность сайтов в Интернете с 65 миллионами пользователей и 260000 регистрациями в день. Этот сайт часто подвергается критике из-за не достаточной производительности, хотя на самом деле MySpace удалось избежать ряда проблем с масштабируемостью, с которыми большинство других сайтов неизбежно сталкивались. Как же им это удалось?
(далее...)

Переезд + реконструкция

Опубликовано 20 декабря 2009, автор: Иван Блинков

Уважаемые читатели, у меня для вас есть ряд замечательных новостей:

  • Блог переехал на новый хостинг, теперь живем в США
  • Блог по прежнему работает на WordPress, от идеи трансфера на GAE я отказался из-за нехватки сил и времени
  • Оформление было переверстано на HTML5, пока все еще далеко от идеала, возможно буду переделывать (пользователей IE и прочего антиквариата просьба не кидаться камнями — сами виноваты)
  • Ради эксперимента добавлена поддержка Google Chrome Frame
  • Все плагины и сам движок были обновлены и доведены до ума — раньше все работало на устаревших версиях
  • Я вспомнил, что у меня был аккаунт на твиттере:  follow me!
  • Решил попробовать вернуть AdSense в том виде, в котором он был когда-то давно, может быть на хлеб с маслом хватит, пока работу не найду :)