Русский /

Hadoop

Компания First Line Software специализируется на внедрении, оптимизации и настройке кластеров, созданных на основе Hadoop, улучшении их рабочих характеристик, масштабируемости, а также повышении степени надежности. Наши инженеры и архитекторы ПО накопили огромный опыт в создании надежных распределенных систем с высокой степенью масштабируемости, способных хранить, обрабатывать и анализировать громадные объемы структурированных и неструктурированных данных.

Hadoop позволяет осуществлять параллельную обработку громадных объемов информации (масштаба петабайтов) в больших кластерах. Hadoop является одной из основных технологий для данной сферы деятельности. Hadoop интенсивно используется как лидерами отрасли (Orbitz, Chevron или eBay), так и небольшими организациями, работающими в различных сферах деятельности: электронной коммерции, энергетике, сетевой безопасности, здравоохранении и т.д.

Специалисты компании First Line Software по NoSQL и работе с большими объемами данных способны поддерживать широкий спектр начинаний и проектов, включая: 

  • Настройку недорогого хранилища данных с высокой степенью масштабируемости, работающего на платформе HBase, установленной на Hadoop (для обеспечения доступа к хранилищам данных Hadoop по методам баз данных или для транзакционных приложений высокого уровня), включая процессы миграции ETL.
  • Внедрение Hadoop Hive, инфраструктуры хранилища данных, непосредственно поверх Hadoop или в сочетании с HBase (если от конечной системы требуется небольшое время задержки отклика) для аналитических операций.
  • Внедрение специализированных процессов обработки MapReduce (с использованием Pig, Java, Python или R).
  • Внедрение мощной поисковой системы, создаваемой на основе сочетания Lucene/SOLR и Hadoop (мы накопили немалый опыт в использовании Lucene для морфологического анализа, обработки сложных слов и т.д.).
  • Внедрение систем интеллектуального анализа данных для хранилища информации на основе Hadoop, с использованием открытых программных инструментов, например, Pentaho или JasperReports.
  • Внедрение Mahout поверх Hadoop для обучаемых систем или систем сбора и анализа информации (к примеру, рекомендательные и классификационные сервисы).
  • Для обработки больших объемов графических данных пригодится решение на основе Titan, транзакционной базы данных с высокой степенью масштабируемости, способной использовать HBase в качестве сервера хранилища данных.

Для получения более подробной информации о том, чем мы можем помочь Вам в реализации проектов, связанных с большими объемами информации, свяжитесь с нами. 

Свяжитесь с нами