Файлы в космосе

30 Март 2008 2 Comments Иван Блинков

…или Kosmos Distributed File System

Kosmos Distributed File System
Сегодня речь пойдет об еще одной распределенной файловой системе — KosmosFS. У русских людей название этого проекта определенно вызывает ассоциации с космосом, но изначально все же свою лепту в него внес изначальный разработчик — Kosmix.

По большому счету KFS мало чем выделяется из множества своих конкурентов, по своей структуре она состоит из сервера метаданных и серверов блоков, доступ к системе производится средствами клиентской библиотеки, предоставляющей соответствующий API. Список возможностей файловой системы также вполне стандартен:

  • Инкрементальная масштабируемость. При добавлении дополнительных узлов в кластер, система сама адаптируется для вовлечения их в полноценную работу.
  • Стабильный доступ. Реплицируемость данных (по-умолчанию в трех экземплярах) позволяет гарантировать доступность данных вне зависимости от сбоев в работе отдельных узлов.
  • Балансировка блоков данных. Периодически сервер метаданных перераспределяет данные с целью более оптимального использования дискового пространства.
  • Целостность данных. Для обеспечения целостности данных вычисляются и сравниваются контрольные суммы блоков данных.
  • Кэширование. Для увеличения производительности используется кэширования на уровне клиентской библиотеки.
  • Прозрачная работа с недоступными узлами. Клиентская библиотека прозрачно для приложения переключается на альтернативный сервер с данными, если обнаруживает что один из них недоступен.
  • Поддержка языков программирования: C++, Java, Python.
  • Скрипты. С системой предоставляется набор скриптов для развертывания, запуска и остановки узлов.

Но написать этот пост меня подтолкнул вовсе не этот список. В комментариях к одной из предыдущих моих записей читатели подняли тему о целесообразности использования Java для реализации HDFS в частности и Hadoop в целом. В качестве альтернативы был предложен C++ (только на словах конечно же), аргументируя это тем, что такая реализация была бы эффективнее. KFS же как раз и является той самой альтернативой HDFS, написанной на C++. KFS тесно интегрируется с Hadoop с помощью его интерфейсов для файловой системы. Это позволяет Hadoop-приложениям незаметно работать с KFS точно так же, как если бы на ее месте была бы HDFS. Код для интеграции с Hadoop был выпущен в виде патча к Hadoop-JIRA-1963, а начиная с Hadoop версии 0.15 этот код входит в стандартный дистрибутив, ровно как и детальная инструкция по интеграции.

2 comments

  • Edward:

    Я не по теме. Просто увидел форму для комментирования и хочу сказать, что Цветовая гамма этой формы (в т.ч. подсветка) просто ужасны, в первую очередь из-за недостаточной контрастности. Может быть вам будет это интересно.

  • [quote comment="471"]Я не по теме. Просто увидел форму для комментирования и хочу сказать, что Цветовая гамма этой формы (в т.ч. подсветка) просто ужасны, в первую очередь из-за недостаточной контрастности. Может быть вам будет это интересно.[/quote]Впринципе для такого плана сообщений есть страница «О сайте», но не важно, переносить его туда мне просто лень, так что попытаюсь ответить здесь:

    Я честно говоря не знаю какой цвет может создавать больший контраст с пастельно голубым или светло-серым цветом, чем черный. Если кто-то мог бы предложить что-то более читабельное, то я был бы только рад, но лично меня такое сочетание цветов на данный момент вполне устраивает.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>