O Que É

A Aceleração para Hadoop otimiza o uso dos recursos computacionais e de armazenamento em cada nó do seu cluster Hadoop nativamente, agilizando processos, estendendo a conectividade, e trazendo simplicidade, reuso e transparência para o desenvolvimento das aplicações Hadoop.

Por Que É Importante

Inicialmente utilizado como ambiente específico para o processamento de dados online de aplicações web, hoje o Hadoop está evoluindo rapidamente como framework altamente escalável para os múltiplos desafios de processamento e análise em Big Data.
Contudo o desenvolvimento de aplicações otimizadas para Hadoop pode ser extremamente complexo, impondo seus próprios desafios de agilidade à TI e ao Negócio. Além disto, apesar de sua excelente escalabilidade horizontal, o framework ainda é pouco eficiente no aproveitamento dos recursos individuais de processamento e armazenamento, limitando os benefícios globais de escala, performance, complexidade operacional e custo total de propriedade.

Fluxo de dados MapReduce típico

A Aceleração para Hadoop atua nesses pontos-chave, introduzindo a tecnologia DMX-h em modo nativo com benefícios imediatos de performance e economia de recursos, e ambiente de desenvolvimento GUI poderoso, flexível e intuitivo que simplifica extremamente o desenvolvimento e evolução das suas aplicações.


Benefícios

  • A Aceleração para Hadoop com DMX-h permite realizar todo o potencial do Big Data com agilidade, performance, e economia.
  • Simplifica desenvolvimento, manutenção, e reutilização no Hadoop, eliminando requisitos de programação e scripting complexos.
  • 3x mais performance, throughput, e escalabilidade para os principais use cases de ETL no framework MapReduce, nativamente.
  • Etapas de Sort no Hadoop até 80% mais rápidas para todas as aplicações, transparentemente. Benefícios imediatos, sem alteração nem tuning.
  • Extração e carga de/para HDFS 6x mais rápida que as capacidades nativas do Hadoop, com ampla conectividade.
  • Maior transparência e governabilidade, graças ao amplo suporte a metadados.

Características

  • Engine de alta performance, executado nativamente dentro do MapReduce, sem geração de código nem compilação.
  • Ambiente gráfico para desenvolvimento de ETL MapReduce, sem escrever código.
  • Cinco transformações fundamentais, poderosas e flexíveis. Fácil combinação e reuso para produzir qualquer data flow.
  • Self-tuning engine: processos otimizados desde a criação, automaticamente.
  • Metadados para análise de impacto, linhagem de dados, e fluxo de execução.
  • Instalação leve, sem dependências de banco de dados, compilador, ou servidor de aplicações.