VMware виртуализирует Hadoop в рамках проекта с открытым кодом Serengeti


 

Компания VMware объявила о создании проекта с открытым кодом Serengeti, в рамках которого платформа распределенной обработки данных Hadoop будет оптимизирована для исполнения в виртуализированных средах. Как обещают в компании, проект упростит организацию облачных сервисов на основе различных дистрибутивов Hadoop, работающих в виртуальных машинах VMware. В компании обещают, что Serengeti позволит эластично масштабировать кластеры Hadoop на виртуальных машинах и обеспечит высокую готовность и оптимальное использование аппаратных ресурсов.

Hadoop будет оптимизирована для исполнения под управлением облачной системы виртуализации VMware vSphere. Уже сейчас поддерживаются дистрибутивы Hadoop, предлагаемые компаниями Cloudera, MapR, IBM и Greenplum. В VMware обещают, что Serengeti будет непрерывно совершенствоваться — планируется добавлять поддержку других дистрибутивов и новых возможностей.

Serengeti будет распространяться по лицензии Apache. Как считают в VMware, виртуализованные дистрибутивы Hadoop больше всего подойдут для компаний, тестирующих платформу на кластерах с числом узлом меньше 20.

Источник: “Открытые системы” www.osp.ru

Подробнее: http://www.osp.ru/news/2012/0615/13013666/