Файлы в космосе
Опубликовано 30 марта 2008, автор: Иван Блинков
...или Kosmos Distributed File System

Сегодня речь пойдет об еще одной распределенной файловой системе — . У русских людей название этого проекта определенно вызывает ассоциации с космосом, но изначально все же свою лепту в него внес изначальный разработчик — .
По большому счету KFS мало чем выделяется из множества своих конкурентов, по своей структуре она состоит из сервера метаданных и серверов блоков, доступ к системе производится средствами клиентской библиотеки, предоставляющей соответствующий API. Список возможностей файловой системы также вполне стандартен:
- Инкрементальная масштабируемость. При добавлении дополнительных узлов в кластер, система сама адаптируется для вовлечения их в полноценную работу.
- Стабильный доступ. Реплицируемость данных (по-умолчанию в трех экземплярах) позволяет гарантировать доступность данных вне зависимости от сбоев в работе отдельных узлов.
- Балансировка блоков данных. Периодически сервер метаданных перераспределяет данные с целью более оптимального использования дискового пространства.
- Целостность данных. Для обеспечения целостности данных вычисляются и сравниваются контрольные суммы блоков данных.
- Кэширование. Для увеличения производительности используется кэширования на уровне клиентской библиотеки.
- Прозрачная работа с недоступными узлами. Клиентская библиотека прозрачно для приложения переключается на альтернативный сервер с данными, если обнаруживает что один из них недоступен.
- Поддержка языков программирования: C++, Java, Python.
- Скрипты. С системой предоставляется набор скриптов для развертывания, запуска и остановки узлов.
Но написать этот пост меня подтолкнул вовсе не этот список. В комментариях к одной из предыдущих моих записей читатели подняли тему о целесообразности использования Java для реализации HDFS в частности и Hadoop в целом. В качестве альтернативы был предложен C++ (только на словах конечно же), аргументируя это тем, что такая реализация была бы эффективнее. KFS же как раз и является той самой альтернативой HDFS, написанной на C++. KFS тесно интегрируется с Hadoop с помощью его интерфейсов для файловой системы. Это позволяет Hadoop-приложениям незаметно работать с KFS точно так же, как если бы на ее месте была бы HDFS. Код для интеграции с Hadoop был выпущен в виде патча к Hadoop-JIRA-1963, а начиная с Hadoop версии 0.15 этот код входит в стандартный дистрибутив, ровно как и детальная инструкция по интеграции.

2 комментария на запись “Файлы в космосе”
Я не по теме. Просто увидел форму для комментирования и хочу сказать, что Цветовая гамма этой формы (в т.ч. подсветка) просто ужасны, в первую очередь из-за недостаточной контрастности. Может быть вам будет это интересно.
[quote comment="471"]Я не по теме. Просто увидел форму для комментирования и хочу сказать, что Цветовая гамма этой формы (в т.ч. подсветка) просто ужасны, в первую очередь из-за недостаточной контрастности. Может быть вам будет это интересно.[/quote]Впринципе для такого плана сообщений есть страница «», но не важно, переносить его туда мне просто лень, так что попытаюсь ответить здесь:
Я честно говоря не знаю какой цвет может создавать больший контраст с пастельно голубым или светло-серым цветом, чем черный. Если кто-то мог бы предложить что-то более читабельное, то я был бы только рад, но лично меня такое сочетание цветов на данный момент вполне устраивает.