курси Hadoop

курси Hadoop

Місцеві, інструктор під керівництвом жити Apache Hhaoop навчальних курсів демонструють через інтерактивні практичний практиці основні компоненти екосистеми Хаооп і як ці технології можуть бути використані для вирішення великомасштабних проблем.

Hhaoop підготовка доступна як "на місці навчання" або "дистанційне навчання жити". На місці навчання в прямому ефірі може здійснюватися на місцевому рівні в україна або в Неbleprog корпоративні навчальні центри в україна. Дистанційне навчання в прямому ефірі здійснюється шляхом інтерактивного, віддаленого робочого стола.

Nobleпрога-ваш місцевий навчальний провайдер

Testimonials

★★★★★
★★★★★

Hadoop Course Outlines

Title
Duration
Overview
Title
Duration
Overview
7 hours
Overview
Alluxio - це система віртуальної розподіленої системи зберігання з відкритим кодом, яка об'єднує різноманітні системи зберігання даних та дозволяє програмам взаємодіяти з даними на швидкості пам'яті. Він використовується такими компаніями, як Intel, Baidu та Alibaba.

У цій інструкції під керівництвом живих тренінгів учасники навчаться використовувати Alluxio для монтажу різних обчислювальних систем із системами зберігання даних та ефективного управління даними з декількох петабайтних масштабів, оскільки вони проходять через створення додатка з Alluxio.

До кінця цього тренінгу учасники зможуть:

- Розробіть програму з Alluxio
- Підключіть великі системи та програми даних, зберігаючи при цьому одне простору імен
- Ефективно витягувати значення з великих даних у будь-якому форматі зберігання
- Покращення продуктивності робочого навантаження
- Розгортати та керувати Alluxio автономним або кластеризованим

Аудиторія

- Дані вченого
- Розробник
- Системний адміністратор

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
28 hours
Overview
Аудиторія:

Цей курс призначений для демістифікації великих даних / технологій хадопа і показати, що це не важко зрозуміти.
14 hours
Overview
Sqoop - це програмне забезпечення з відкритим кодом для передачі даних між Hadoop і реляційними базами даних або мейнфреймами. Він може використовуватися для імпорту даних з реляційної системи керування базами даних (RDBMS), такими як MySQL, Oracle або мейнфрейм у розподілену файлову систему Hadoop (HDFS). Після цього дані можуть бути перетворені в Hadoop MapReduce, а потім повторно експортуються назад в RDBMS.

У цій навчальній інструкції, учасники навчаться навчатися, як використовувати Sqoop для імпорту даних з традиційної реляційної бази даних до зберігання Hadoop таких HDFS або Hive і навпаки.

До кінця цього тренінгу учасники зможуть:

- Встановити та налаштувати Sqoop
- Імпортувати дані з MySQL на HDFS і Hive
- Імпортувати дані з HDFS і Hive в MySQL

Аудиторія

- Системні адміністратори
- Інженери-дані

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика

Примітка

- Щоб просити індивідуальне навчання для цього курсу, зв'яжіться з нами, щоб організувати.
14 hours
Overview
Apache Samza - це нестандартна, асинхронна обчислювальна платформа з відкритим кодом для обробки потоку. Він використовує Apache Kafka для обміну повідомленнями та Apache Hadoop YARN для відмовостійкості, ізоляції процесорів, безпеки та управління ресурсами.

Цей навчальний курс, навчальний курс навчання, означає принципи створення систем обміну повідомленнями та розподіленої обробки потоку, а учасники ходитимуть шляхом створення зразка проекту Samza і виконання роботи.

До кінця цього тренінгу учасники зможуть:

- Використовуйте Samza, щоб спростити код, необхідний для отримання та отримання повідомлень.
- Відокремити обробку повідомлень від програми.
- Використовуйте Samza для реалізації асинхронних обчислень в режимі реального часу.
- Використовуйте обробку потоку, щоб забезпечити більш високий рівень абстракції над системами обміну повідомленнями.

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
7 hours
Overview
Apache NiFi (Hortonworks DataFlow) є в режимі реального часу інтегрована логістика даних і проста платформа обробки подій, яка дозволяє рухатися, відстеження та автоматизації даних між системами. Вона написана з використанням потоку на основі програмування і надає веб-інтерфейс користувача для управління datafflow в режимі реального часу.

в цьому інструктор під керівництвом, жити навчання, учасники будуть вивчати основи потоку на основі програмування, як вони розробляють ряд демо-розширень, компонентів і процесорів з використанням Apache NiFi.

до кінця тренінгу учасники зможуть:

- розуміти nifi & #39; з архітектурою і потік даних концепцій.
- розробка розширень, що використовують NiFi та сторонні інтерфейси.
- звичай розвивати свої власні процесори Apache Nifi.
- ковтати і обробляти дані в реальному часі з різних і незвичайних форматів файлів і джерел даних.

Формат курсу

- Інтерактивна лекція та дискусія.
- багато вправ і практики.
- практичної реалізації в живій лабораторній обстановці.

курс параметри налаштування

- щоб запросити індивідуальну підготовку за цей курс, будь ласка, зв'яжіться з нами, щоб організувати.
21 hours
Overview
Apache NiFi (Hortonworks DataFlow) - це інтегрована логістика даних в реальному часі та проста платформа обробки подій, яка дозволяє переміщати, відстежувати та автоматизувати дані між системами. Він написаний з використанням потокового програмування та забезпечує веб-інтерфейс користувача для керування потоками даних у режимі реального часу.

У цій інструкції під керівництвом живих тренінгів учасники навчаться, як розпочати та керувати Apache NiFi в живій лабораторії.

До кінця цього тренінгу учасники зможуть:

- Встановити та налаштувати Apachi NiFi
- Джерело, перетворення та управління даними з різнорідних, розподілених джерел даних, включаючи бази даних та великі озера даних
- Автоматизація потоків даних
- Увімкнути потокову аналітику
- Застосовуйте різні підходи для прийому даних
- Трансформуйте великі дані та ділову статистику

Аудиторія

- Системні адміністратори
- Інженери-дані
- Розробники
- DevOps

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
14 hours
Overview
аудиторія

- розробників

Формат курсу

- лекції, практичні заняття, невеликі тести на шляху до оцінки розуміння
21 hours
Overview
Cloudera Impala - це двигун SQL-запитів з масивно паралельною обробкою (MPP) із відкритим кодом для кластерів Apache Hadoop.

Impala дає користувачам змогу видавати запити з низькою затримкою SQL на дані, що зберігаються в розподіленої файлової системи Hadoop та Apache Hbase, не вимагаючи руху даних або перетворення.

Аудиторія

Цей курс спрямований на аналітики та вчені даних, які виконують аналіз даних, що зберігаються в Hadoop через Business Intelligence або SQL-інструменти.

Після цього курсу делегати зможуть

- Витягніть важливу інформацію з кластерів Hadoop з Impala.
- Напишіть спеціальні програми для полегшення бізнес-інтелекту в Impalt SQL Dialect.
- Виправлення неполадок.
7 hours
Overview
Цей курс охоплює як використовувати мову Hive SQL (AKA: Hive HQL, SQL on Hive, HiveQL) для людей, які отримують дані з вуликів
21 hours
Overview
Hortonworks Data Platform - це платформа підтримки для платформи Apache Hadoop з відкритим кодом, яка забезпечує стабільну основу для розробки великих рішень даних у екосистемі Apache Hadoop.

Цей навчальний тренінг, присвячений інструктору, вводить Hortonworks та йде учасникам шляхом розгортання рішення Spark + Hadoop.

До кінця цього тренінгу учасники зможуть:

- Використовуйте Hortonworks, щоб надійно запустити Hadoop у великих масштабах
- Об'єднайте можливості безпеки, управління та операцій Hadoop за допомогою оперативних аналітичних робочих процесів Spark.
- Використовуйте Hortonworks для вивчення, перевірки, сертифікації та підтримки кожного з компонентів проекту Spark
- Процес різні типи даних, в тому числі структурований, неструктурований, в русі та відпочинку.

Аудиторія

- Адміністратори Hadoop

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Цей курс представляє HBase - магазин NoSQL на вершині Hadoop. Курс призначений для розробників, які будуть використовувати HBase для розробки додатків та адміністраторів, які будуть керувати кластерами HBase.

Ми будемо ходити розробник через HBase архітектуру та моделювання даних та розробки додатків на HBase. Також буде обговорюватися використання MapReduce з HBase, а також деякі теми адміністрації, пов'язані з оптимізацією продуктивності. Курс дуже практичний з великою кількістю лабораторних вправ.

Тривалість : 3 дні

Аудиторія : розробники та адміністратори
28 hours
Overview
Hadoop - це популярна система обробки великих даних. Python - це мова програмування високого рівня, відомий своїм зрозумілим синтаксисом та читаемостью коду.

У цій інструкції під керівництвом живих тренінгів учасники навчаться працювати з Hadoop, MapReduce, Pig і Spark за допомогою Python, коли вони пройдуть кілька прикладів і використовують випадки.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте основні концепції Hadoop, MapReduce, Pig і Spark
- Використовуйте Python з розподіленою файловою системою Hadoop (HDFS), MapReduce, Pig і Spark
- Використовуйте Snakebite для програмного доступу до HDFS у Python
- Використовуйте mrjob, щоб написати завдання MapReduce у Python
- Напишіть програми Spark за допомогою Python
- Розширюйте функціональність свині за допомогою Python UDF
- Керуйте роботами MapReduce та скриптами Pig, використовуючи Luigi

Аудиторія

- Розробники
- ІТ-фахівці

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
14 hours
Overview
Оскільки все більше і більше програмних і ІТ-проектів мігрують з локальної обробки та керування даними в розподілену обробку та зберігання великих даних, Менеджери проектів виявляють необхідність вдосконалювати свої знання та навички, щоб зрозуміти концепції та практику, що стосуються проектів та можливостей Big Data.

Цей курс ознайомить менеджера проектів з найпопулярнішою системою обробки великих даних: Hadoop.

У цьому тренінгу під керівництвом інструкторів учасники вивчатимуть основні компоненти екосистеми Hadoop та способи використання цих технологій для вирішення великомасштабних проблем. У процесі вивчення цих основ учасники також покращуть свою здатність спілкуватися з розробниками та розробниками цих систем, а також вченими даних та аналітиками, якими задіяні багато ІТ-проектів.

Аудиторія

- Менеджери проектів, які бажають впроваджувати Hadoop в існуючу інфраструктуру розвитку або ІТ
- Менеджери проектів, які потребують спілкування з міжфункціональними групами, до складу яких входять великі інженери даних, вчені даних та бізнес-аналітики

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Apache Ambari - це платформа керування відкритим кодом для надання, керування, моніторингу та захисту кластерів Apache Hadoop.

У цьому навчальному тренінгу учасники навчаться інструментам та практичним методам управління, що надаються Амбарі, для успішного управління кластерами Hadoop.

До кінця цього тренінгу учасники зможуть:

- Налаштуйте кластер Big Data, використовуючи Ambari
- Застосовуйте розширені функції та функції Ambari для різних випадків використання
- Необхідно легко додавати та видаляти вузли
- Покращуйте продуктивність кластера Hadoop за допомогою настроювання та налаштування

Аудиторія

- DevOps
- Системні адміністратори
- DBAs
- Hadoop тестування професіоналів

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Hadoop - це найпопулярніша система обробки великих даних.
21 hours
Overview
Apache Hadoop - це одна з найпопулярніших баз для обробки великих даних на кластері серверів. Цей курс охоплює управління даними в HDFS, розширеній свині, вулику та HBase. Ці передові технології програмування будуть корисними для досвідчених розробників Hadoop.

Аудиторія : розробники

Тривалість: три дні

Формат: лекції (50%) та практичні лабораторії (50%).
28 hours
Overview
Apache Hadoop - це найпопулярніша база для обробки Big Data на кластерах серверів. Цей курс представить розробнику різні компоненти (HDFS, MapReduce, Pig, Hive і HBase) екосистеми Hadoop.
21 hours
Overview
Apache Hadoop - це найпопулярніша база для обробки великих даних. Hadoop забезпечує багатий та глибокий аналітичний потенціал, і це робить дорогу в традиційний світ аналітиків BI. Цей курс представить аналітик основним компонентам Hadoop eco системи та її аналітику

Аудиторія

Бізнес аналітики

Тривалість

три дні

Формат

Лекції та руки в лабораторіях.
21 hours
Overview
Apache Hadoop - це найпопулярніша база для обробки Big Data на кластерах серверів. У рамках цих трьох (необов'язково, чотирьох) днів курси відвідувачі дізнаються про переваги бізнесу та використовуватимуть випадки для Hadoop та її екосистеми, як планувати розгортання кластера та зростання, як встановлювати, підтримувати, контролювати, виправляти та оптимізувати Hadoop. Вони також практикують навантаження на масове завантаження кластерів, знайомляться з різними дистрибутивами Hadoop, а також практикують встановлення та управління інструментами екосистеми Hadoop. Курс завершується обговоренням щодо забезпечення кластера з Kerberos.

"... матеріали були дуже добре підготовлені і ретельно покриті. Лабораторія була дуже корисною та добре організованою "
- Ендрю Нгуєн, головний інтегратор DW Engineer, Microsoft Online Advertising

Аудиторія

Адміністратори Hadoop

Формат

Лекції та практичні лабораторії, приблизний баланс 60% лекцій, 40% лабораторій.
21 hours
Overview
Курс присвячено IT фахівцям, які шукають рішення для зберігання та обробки великих наборів даних в розподіленому системному середовищі

Мета курсу:

Отримання знань щодо адміністрування Hadoop кластерів
14 hours
Overview
Datameer - це платформа бізнес-аналітики та аналітики, побудована на Hadoop. Це дозволяє кінцевим користувачам легко знаходити, вивчати та корелювати великомасштабні, структуровані, напівструктуровані та неструктуровані дані у зручному для використання спосіб.

У цій інструкції під керівництвом живих тренінгів учасники навчаться використовувати Datameer для подолання крутих навчальних кривої Hadoop, коли вони проходять процедуру встановлення та аналізу ряду великих джерел даних.

До кінця цього тренінгу учасники зможуть:

- Створюйте, перевіряйте та інтерактивно вивчайте озеро даних підприємства
- Доступ до сховищ даних бізнес-аналітики, транзакційних баз даних та інших аналітичних магазинів
- Використовуйте користувальницький інтерфейс електронних таблиць, щоб створювати конвеєрні обробки даних від кінцевого до кінця
- Доступ до попередньо побудованих функцій для вивчення складних зв'язків даних
- Використовуйте майстри перетягування для візуалізації даних та створення інформаційних панелей
- Використовуйте таблиці, діаграми, графіки та карти, щоб аналізувати результати запитів

Аудиторія

- Аналітик даних

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Велика аналітика даних включає в себе процес вивчення великої кількості різноманітних наборів даних, з метою виявлення кореляцій, прихованих візерунків та інших корисних відомостей.

Індустрія охорони здоров'я має величезну кількість складних різнорідних медичних та клінічних даних. Застосування великих аналітичних даних щодо даних про стан здоров'я надає величезний потенціал для отримання статистичних даних для покращення надання медичних послуг. Однак величезна кількість цих наборів дає великі проблеми при аналізі та практичному застосуванні до клінічного середовища.

У цьому навчанні під керівництвом інструктора, живе тренування (віддалене), учасники навчаться виконувати великі аналізи даних у сфері здоров'я, коли вони проходять через низку практичних навчань у прямому ефірі.

До кінця цього тренінгу учасники зможуть:

- Встановіть і настройте великі інструменти аналізу даних, такі як Hadoop MapReduce та Spark
- Зрозумійте характеристики медичних даних
- Застосовуйте великі методи передачі медичних даних
- Вивчення великих систем даних та алгоритмів у контексті охорони здоров'я

Аудиторія

- Розробники
- Дані вчених

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика.

Примітка

- Щоб просити індивідуальне навчання для цього курсу, зв'яжіться з нами, щоб організувати.
21 hours
Overview
Цей курс призначений для розробників, архітекторів, учених даних або будь-якого профілю, для якого потрібен доступ до даних інтенсивно або на регулярній основі.

Основна тема курсу - маніпулювання та перетворення даних.

Серед інструментів в екосистемі Hadoop цей курс включає використання свиней та вуликів, обидва з яких значною мірою використовуються для перетворення даних та маніпулювання.

Це навчання також стосується показників ефективності та оптимізації ефективності.

Курс цілком керується пунктами в презентаціях теоретичних аспектів.
35 hours
Overview
Аудиторія:

Курс призначений для ІТ-фахівців, які шукають рішення для зберігання та обробки великих наборів даних в розподіленому системному середовищі

Мета:

Глибокі знання про адміністрування кластера Хадопа.
14 hours
Overview
Tigon - це платформа обробки потоків з відкритим вихідним кодом, в режимі реального часу, з низькою затримкою, високою пропускною спроможністю, натуральною оптоволоконною лінією, що стоїть на вершині HDFS та HBase за наполегливість. Прикладні програми Tigon використовують такі випадки, як виявлення та аналіз вторгнення в мережу, аналіз ринку соціальних мереж, аналітика місць розташування та рекомендації користувачам у реальному часі.

Під керівництвом інструктора, живого тренінгу, вводять підхід Тигона до поєднання режиму реального часу та пакетної обробки, оскільки він ходить учасників шляхом створення прикладу програми.

До кінця цього тренінгу учасники зможуть:

- Створюйте потужні поточні програми для обробки великих обсягів даних
- Опрацюйте джерела потоку, такі як Twitter і веб-серверів
- Використовуйте Tigon для швидкого приєднання, фільтрації та об'єднання потоків

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
Weekend Hadoop courses, Evening Hadoop training, Hadoop boot camp, Hadoop instructor-led, Weekend Hadoop training, Evening Hadoop courses, Hadoop coaching, Hadoop instructor, Hadoop trainer, Hadoop training courses, Hadoop classes, Hadoop on-site, Hadoop private courses, Hadoop one on one training

Course Discounts

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Some of our clients

is growing fast!

We are looking to expand our presence in Ukraine!

As a Business Development Manager you will:

  • expand business in Ukraine
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!