курси Hadoop

курси Hadoop

Навчальні курси Apache Hadoop, організовані місцевими інструкторами, демонструють шляхом обговорення та практичної практики основні компоненти екосистеми Hadoop та способи використання цих технологій для вирішення великих проблем. Тренування Hadoop доступні як "навчальне тренування на місці" або "дистанційне навчання в режимі реального часу". Навчання на місці може здійснюватися локально на приміщеннях клієнта в Україні україна або в корпоративних навчальних центрах NobleProg в Росії україна . Дистанційне навчання в режимі реального часу здійснюється за допомогою інтерактивного, віддаленого робочого столу. NobleProg - Ваш постачальник місцевих навчальних закладів

Testimonials

★★★★★
★★★★★

Hadoop Subcategories

Hadoop Course Outlines

CodeNameDurationOverview
hadoopadmHadoop Administration21 hoursКурс присвячено IT фахівцям, які шукають рішення для зберігання та обробки великих наборів даних в розподіленому системному середовищі

Мета курсу:

Отримання знань щодо адміністрування Hadoop кластерів
hadoopforprojectmgrsHadoop for Project Managers14 hoursОскільки все більше і більше програмних і ІТ-проектів мігрують з локальної обробки та керування даними в розподілену обробку та зберігання великих даних, Менеджери проектів виявляють необхідність вдосконалювати свої знання та навички, щоб зрозуміти концепції та практику, що стосуються проектів та можливостей Big Data.

Цей курс ознайомить менеджера проектів з найпопулярнішою системою обробки великих даних: Hadoop.

У цьому тренінгу під керівництвом інструкторів учасники вивчатимуть основні компоненти екосистеми Hadoop та способи використання цих технологій для вирішення великомасштабних проблем. У процесі вивчення цих основ учасники також покращуть свою здатність спілкуватися з розробниками та розробниками цих систем, а також вченими даних та аналітиками, якими задіяні багато ІТ-проектів.

Аудиторія

- Менеджери проектів, які бажають впроваджувати Hadoop в існуючу інфраструктуру розвитку або ІТ
- Менеджери проектів, які потребують спілкування з міжфункціональними групами, до складу яких входять великі інженери даних, вчені даних та бізнес-аналітики

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
sqoopMoving Data from MySQL to Hadoop with Sqoop14 hoursSqoop - це програмне забезпечення з відкритим кодом для передачі даних між Hadoop і реляційними базами даних або мейнфреймами. Він може використовуватися для імпорту даних з реляційної системи керування базами даних (RDBMS), такими як MySQL, Oracle або мейнфрейм у розподілену файлову систему Hadoop (HDFS). Після цього дані можуть бути перетворені в Hadoop MapReduce, а потім повторно експортуються назад в RDBMS.

У цій навчальній інструкції, учасники навчаться навчатися, як використовувати Sqoop для імпорту даних з традиційної реляційної бази даних до зберігання Hadoop таких HDFS або Hive і навпаки.

До кінця цього тренінгу учасники зможуть:

- Встановити та налаштувати Sqoop
- Імпортувати дані з MySQL на HDFS і Hive
- Імпортувати дані з HDFS і Hive в MySQL

Аудиторія

- Системні адміністратори
- Інженери-дані

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика

Примітка

- Щоб просити індивідуальне навчання для цього курсу, зв'яжіться з нами, щоб організувати.
hadooppythonHadoop with Python28 hoursHadoop - це популярна система обробки великих даних. Python - це мова програмування високого рівня, відомий своїм зрозумілим синтаксисом та читаемостью коду.

У цій інструкції під керівництвом живих тренінгів учасники навчаться працювати з Hadoop, MapReduce, Pig і Spark за допомогою Python, коли вони пройдуть кілька прикладів і використовують випадки.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте основні концепції Hadoop, MapReduce, Pig і Spark
- Використовуйте Python з розподіленою файловою системою Hadoop (HDFS), MapReduce, Pig і Spark
- Використовуйте Snakebite для програмного доступу до HDFS у Python
- Використовуйте mrjob, щоб написати завдання MapReduce у Python
- Напишіть програми Spark за допомогою Python
- Розширюйте функціональність свині за допомогою Python UDF
- Керуйте роботами MapReduce та скриптами Pig, використовуючи Luigi

Аудиторія

- Розробники
- ІТ-фахівці

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
nifidevApache NiFi for Developers7 hoursApache NiFi (Hortonworks DataFlow) - це інтегрована логістика даних в реальному часі та проста платформа обробки подій, яка дозволяє переміщати, відстежувати та автоматизувати дані між системами. Він написаний з використанням потокового програмування та забезпечує веб-інтерфейс користувача для керування потоками даних у режимі реального часу.

У цій інструкції під керівництвом живих тренінгів учасники вивчатимуть основи потокового програмного забезпечення, оскільки вони розробити ряд демо-розширень, компонентів і процесорів, що використовують Apache NiFi.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте архітектуру NiFi та концепції потоку даних
- Розробіть розширення за допомогою NiFi та сторонніх API
- Користувальницькі розробляють власний процесор Apache Nifi
- Імпортуйте та обробляйте дані в режимі реального часу з різних та незвичних форматів файлів та джерел даних

Аудиторія

- Розробники
- Інженери-дані

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
nifiApache NiFi for Administrators21 hoursApache NiFi (Hortonworks DataFlow) - це інтегрована логістика даних в реальному часі та проста платформа обробки подій, яка дозволяє переміщати, відстежувати та автоматизувати дані між системами. Він написаний з використанням потокового програмування та забезпечує веб-інтерфейс користувача для керування потоками даних у режимі реального часу.

У цій інструкції під керівництвом живих тренінгів учасники навчаться, як розпочати та керувати Apache NiFi в живій лабораторії.

До кінця цього тренінгу учасники зможуть:

- Встановити та налаштувати Apachi NiFi
- Джерело, перетворення та управління даними з різнорідних, розподілених джерел даних, включаючи бази даних та великі озера даних
- Автоматизація потоків даних
- Увімкнути потокову аналітику
- Застосовуйте різні підходи для прийому даних
- Трансформуйте великі дані та ділову статистику

Аудиторія

- Системні адміністратори
- Інженери-дані
- Розробники
- DevOps

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
datameerDatameer for Data Analysts14 hoursDatameer - це платформа бізнес-аналітики та аналітики, побудована на Hadoop. Це дозволяє кінцевим користувачам легко знаходити, вивчати та корелювати великомасштабні, структуровані, напівструктуровані та неструктуровані дані у зручному для використання спосіб.

У цій інструкції під керівництвом живих тренінгів учасники навчаться використовувати Datameer для подолання крутих навчальних кривої Hadoop, коли вони проходять процедуру встановлення та аналізу ряду великих джерел даних.

До кінця цього тренінгу учасники зможуть:

- Створюйте, перевіряйте та інтерактивно вивчайте озеро даних підприємства
- Доступ до сховищ даних бізнес-аналітики, транзакційних баз даних та інших аналітичних магазинів
- Використовуйте користувальницький інтерфейс електронних таблиць, щоб створювати конвеєрні обробки даних від кінцевого до кінця
- Доступ до попередньо побудованих функцій для вивчення складних зв'язків даних
- Використовуйте майстри перетягування для візуалізації даних та створення інформаційних панелей
- Використовуйте таблиці, діаграми, графіки та карти, щоб аналізувати результати запитів

Аудиторія

- Аналітик даних

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
tigonTigon: Real-time Streaming for the Real World14 hoursTigon - це платформа обробки потоків з відкритим вихідним кодом, в режимі реального часу, з низькою затримкою, високою пропускною спроможністю, натуральною оптоволоконною лінією, що стоїть на вершині HDFS та HBase за наполегливість. Прикладні програми Tigon використовують такі випадки, як виявлення та аналіз вторгнення в мережу, аналіз ринку соціальних мереж, аналітика місць розташування та рекомендації користувачам у реальному часі.

Під керівництвом інструктора, живого тренінгу, вводять підхід Тигона до поєднання режиму реального часу та пакетної обробки, оскільки він ходить учасників шляхом створення прикладу програми.

До кінця цього тренінгу учасники зможуть:

- Створюйте потужні поточні програми для обробки великих обсягів даних
- Опрацюйте джерела потоку, такі як Twitter і веб-серверів
- Використовуйте Tigon для швидкого приєднання, фільтрації та об'єднання потоків

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
alluxioAlluxio: Unifying Disparate Storage Systems7 hoursAlluxio - це система віртуальної розподіленої системи зберігання з відкритим кодом, яка об'єднує різноманітні системи зберігання даних та дозволяє програмам взаємодіяти з даними на швидкості пам'яті. Він використовується такими компаніями, як Intel, Baidu та Alibaba.

У цій інструкції під керівництвом живих тренінгів учасники навчаться використовувати Alluxio для монтажу різних обчислювальних систем із системами зберігання даних та ефективного управління даними з декількох петабайтних масштабів, оскільки вони проходять через створення додатка з Alluxio.

До кінця цього тренінгу учасники зможуть:

- Розробіть програму з Alluxio
- Підключіть великі системи та програми даних, зберігаючи при цьому одне простору імен
- Ефективно витягувати значення з великих даних у будь-якому форматі зберігання
- Покращення продуктивності робочого навантаження
- Розгортати та керувати Alluxio автономним або кластеризованим

Аудиторія

- Дані вченого
- Розробник
- Системний адміністратор

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
samzaSamza for Stream Processing14 hoursApache Samza - це нестандартна, асинхронна обчислювальна платформа з відкритим кодом для обробки потоку. Він використовує Apache Kafka для обміну повідомленнями та Apache Hadoop YARN для відмовостійкості, ізоляції процесорів, безпеки та управління ресурсами.

Цей навчальний курс, навчальний курс навчання, означає принципи створення систем обміну повідомленнями та розподіленої обробки потоку, а учасники ходитимуть шляхом створення зразка проекту Samza і виконання роботи.

До кінця цього тренінгу учасники зможуть:

- Використовуйте Samza, щоб спростити код, необхідний для отримання та отримання повідомлень.
- Відокремити обробку повідомлень від програми.
- Використовуйте Samza для реалізації асинхронних обчислень в режимі реального часу.
- Використовуйте обробку потоку, щоб забезпечити більш високий рівень абстракції над системами обміну повідомленнями.

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
hdpHortonworks Data Platform (HDP) for Administrators21 hoursHortonworks Data Platform - це платформа підтримки для платформи Apache Hadoop з відкритим кодом, яка забезпечує стабільну основу для розробки великих рішень даних у екосистемі Apache Hadoop.

Цей навчальний тренінг, присвячений інструктору, вводить Hortonworks та йде учасникам шляхом розгортання рішення Spark + Hadoop.

До кінця цього тренінгу учасники зможуть:

- Використовуйте Hortonworks, щоб надійно запустити Hadoop у великих масштабах
- Об'єднайте можливості безпеки, управління та операцій Hadoop за допомогою оперативних аналітичних робочих процесів Spark.
- Використовуйте Hortonworks для вивчення, перевірки, сертифікації та підтримки кожного з компонентів проекту Spark
- Процес різні типи даних, в тому числі структурований, неструктурований, в русі та відпочинку.

Аудиторія

- Адміністратори Hadoop

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
ambariApache Ambari: Efficiently Manage Hadoop Clusters21 hoursApache Ambari - це платформа керування відкритим кодом для надання, керування, моніторингу та захисту кластерів Apache Hadoop.

У цьому навчальному тренінгу учасники навчаться інструментам та практичним методам управління, що надаються Амбарі, для успішного управління кластерами Hadoop.

До кінця цього тренінгу учасники зможуть:

- Налаштуйте кластер Big Data, використовуючи Ambari
- Застосовуйте розширені функції та функції Ambari для різних випадків використання
- Необхідно легко додавати та видаляти вузли
- Покращуйте продуктивність кластера Hadoop за допомогою настроювання та налаштування

Аудиторія

- DevOps
- Системні адміністратори
- DBAs
- Hadoop тестування професіоналів

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
ApHadm1Apache Hadoop: Manipulation and Transformation of Data Performance21 hoursЦей курс призначений для розробників, архітекторів, учених даних або будь-якого профілю, для якого потрібен доступ до даних інтенсивно або на регулярній основі.

Основна тема курсу - маніпулювання та перетворення даних.

Серед інструментів в екосистемі Hadoop цей курс включає використання свиней та вуликів, обидва з яких значною мірою використовуються для перетворення даних та маніпулювання.

Це навчання також стосується показників ефективності та оптимізації ефективності.

Курс цілком керується пунктами в презентаціях теоретичних аспектів.
apachehAdministrator Training for Apache Hadoop35 hoursАудиторія:

Курс призначений для ІТ-фахівців, які шукають рішення для зберігання та обробки великих наборів даних в розподіленому системному середовищі

Мета:

Глибокі знання про адміністрування кластера Хадопа.
BigData_A Practical Introduction to Data Analysis and Big Data35 hoursУчасники, які пройдуть це навчання, отримають практичне, реальне розуміння Big Data та пов'язаних з ним технологій, методологій та інструментів.

Учасники матимуть можливість застосувати ці знання на практиці шляхом практичних вправ. Групова взаємодія та відгук інструктора становлять важливу складову класу.

Курс починається з вступу в елементальні концепції Big Data, а потім переходить на мови програмування та методології, що використовуються для аналізу даних. Нарешті, ми обговорюємо інструменти та інфраструктуру, що дозволяють зберігати великі дані, розподілену обробку та масштабованість.

Аудиторія

- Розробники / програмісти
- ІТ-консультанти

Формат курсу

- Частина лекції, частина обговорення, практична практика та реалізація, що іноді зводиться до оцінки прогресу.
IntroToAvroApache Avro: Data Serialization for Distributed Applications14 hoursЦей курс призначений для

- Розробники

Формат курсу

- Лекції, практична практика, невеликі випробування на шляху вимірювання розуміння
HadoopDevAdHadoop for Developers and Administrators21 hoursHadoop - це найпопулярніша система обробки великих даних.
ImpImpala for Business Intelligence21 hoursCloudera Impala - це двигун SQL-запитів з масивно паралельною обробкою (MPP) із відкритим кодом для кластерів Apache Hadoop.

Impala дає користувачам змогу видавати запити з низькою затримкою SQL на дані, що зберігаються в розподіленої файлової системи Hadoop та Apache Hbase, не вимагаючи руху даних або перетворення.

Аудиторія

Цей курс спрямований на аналітики та вчені даних, які виконують аналіз даних, що зберігаються в Hadoop через Business Intelligence або SQL-інструменти.

Після цього курсу делегати зможуть

- Витягніть важливу інформацію з кластерів Hadoop з Impala.
- Напишіть спеціальні програми для полегшення бізнес-інтелекту в Impalt SQL Dialect.
- Виправлення неполадок.
hivehiveqlData Analysis with Hive/HiveQL7 hoursЦей курс охоплює як використовувати мову Hive SQL (AKA: Hive HQL, SQL on Hive, HiveQL) для людей, які отримують дані з вуликів
hadoopbaHadoop for Business Analysts21 hoursApache Hadoop - це найпопулярніша база для обробки великих даних. Hadoop забезпечує багатий та глибокий аналітичний потенціал, і це робить дорогу в традиційний світ аналітиків BI. Цей курс представить аналітик основним компонентам Hadoop eco системи та її аналітику

Аудиторія

Бізнес аналітики

Тривалість

три дні

Формат

Лекції та руки в лабораторіях.
hadoopadm1Hadoop For Administrators21 hoursApache Hadoop - це найпопулярніша база для обробки Big Data на кластерах серверів. У рамках цих трьох (необов'язково, чотирьох) днів курси відвідувачі дізнаються про переваги бізнесу та використовуватимуть випадки для Hadoop та її екосистеми, як планувати розгортання кластера та зростання, як встановлювати, підтримувати, контролювати, виправляти та оптимізувати Hadoop. Вони також практикують навантаження на масове завантаження кластерів, знайомляться з різними дистрибутивами Hadoop, а також практикують встановлення та управління інструментами екосистеми Hadoop. Курс завершується обговоренням щодо забезпечення кластера з Kerberos.

"... матеріали були дуже добре підготовлені і ретельно покриті. Лабораторія була дуже корисною та добре організованою "
- Ендрю Нгуєн, головний інтегратор DW Engineer, Microsoft Online Advertising

Аудиторія

Адміністратори Hadoop

Формат

Лекції та практичні лабораторії, приблизний баланс 60% лекцій, 40% лабораторій.
hbasedevHBase for Developers21 hoursЦей курс представляє HBase - магазин NoSQL на вершині Hadoop. Курс призначений для розробників, які будуть використовувати HBase для розробки додатків та адміністраторів, які будуть керувати кластерами HBase.

Ми будемо ходити розробник через HBase архітектуру та моделювання даних та розробки додатків на HBase. Також буде обговорюватися використання MapReduce з HBase, а також деякі теми адміністрації, пов'язані з оптимізацією продуктивності. Курс дуже практичний з великою кількістю лабораторних вправ.

Тривалість : 3 дні

Аудиторія : розробники та адміністратори
hadoopdevaAdvanced Hadoop for Developers21 hoursApache Hadoop - це одна з найпопулярніших баз для обробки великих даних на кластері серверів. Цей курс охоплює управління даними в HDFS, розширеній свині, вулику та HBase. Ці передові технології програмування будуть корисними для досвідчених розробників Hadoop.

Аудиторія : розробники

Тривалість: три дні

Формат: лекції (50%) та практичні лабораторії (50%).
hadoopdevHadoop for Developers (4 days)28 hoursApache Hadoop - це найпопулярніша база для обробки Big Data на кластерах серверів. Цей курс представить розробнику різні компоненти (HDFS, MapReduce, Pig, Hive і HBase) екосистеми Hadoop.
hadoopmaprHadoop Administration on MapR28 hoursАудиторія:

Цей курс призначений для демістифікації великих даних / технологій хадопа і показати, що це не важко зрозуміти.
bigdataanahealthBig Data Analytics in Health21 hoursВелика аналітика даних включає в себе процес вивчення великої кількості різноманітних наборів даних, з метою виявлення кореляцій, прихованих візерунків та інших корисних відомостей.

Індустрія охорони здоров'я має величезну кількість складних різнорідних медичних та клінічних даних. Застосування великих аналітичних даних щодо даних про стан здоров'я надає величезний потенціал для отримання статистичних даних для покращення надання медичних послуг. Однак величезна кількість цих наборів дає великі проблеми при аналізі та практичному застосуванні до клінічного середовища.

У цьому навчанні під керівництвом інструктора, живе тренування (віддалене), учасники навчаться виконувати великі аналізи даних у сфері здоров'я, коли вони проходять через низку практичних навчань у прямому ефірі.

До кінця цього тренінгу учасники зможуть:

- Встановіть і настройте великі інструменти аналізу даних, такі як Hadoop MapReduce та Spark
- Зрозумійте характеристики медичних даних
- Застосовуйте великі методи передачі медичних даних
- Вивчення великих систем даних та алгоритмів у контексті охорони здоров'я

Аудиторія

- Розробники
- Дані вчених

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика.

Примітка

- Щоб просити індивідуальне навчання для цього курсу, зв'яжіться з нами, щоб організувати.

Upcoming Hadoop Courses

CourseCourse DateCourse Price [Remote / Classroom]
Hadoop Administration on MapR - Kiev, Holosiyvskiy Park Tue, 2019-01-29 09:306000EUR / 7000EUR
A Practical Introduction to Data Analysis and Big Data - Kiev, Holosiyvskiy Park Mon, 2019-02-04 09:308750EUR / 9950EUR
Hadoop Administration on MapR - Kiev, Holosiyvskiy Park Mon, 2019-03-25 09:306000EUR / 7000EUR
A Practical Introduction to Data Analysis and Big Data - Kiev, Holosiyvskiy Park Mon, 2019-04-01 09:308750EUR / 9950EUR
A Practical Introduction to Data Analysis and Big Data - Kiev, Holosiyvskiy Park Mon, 2019-05-27 09:308750EUR / 9950EUR
Weekend Hadoop courses, Evening Hadoop training, Hadoop boot camp, Hadoop instructor-led, Weekend Hadoop training, Evening Hadoop courses, Hadoop coaching, Hadoop instructor, Hadoop trainer, Hadoop training courses, Hadoop classes, Hadoop on-site, Hadoop private courses, Hadoop one on one training

Course Discounts

CourseVenueCourse DateCourse Price [Remote / Classroom]
Business Process Modeling using BPMN and UMLKiev, Holosiyvskiy Park Tue, 2019-04-02 09:303150EUR / 3750EUR
Elasticsearch Advanced Administration, Monitoring and MaintenanceKiev, Holosiyvskiy Park Tue, 2019-04-02 09:303150EUR / 3750EUR
Introduction to Embedded ComputersKiev, Holosiyvskiy Park Wed, 2019-06-05 09:303150EUR / 3750EUR
Advanced Go ProgrammingKiev, Holosiyvskiy Park Mon, 2019-06-10 09:304725EUR / 5525EUR
Introduction to R for FinanceKiev, Holosiyvskiy Park Mon, 2019-06-17 09:305250EUR / 6050EUR

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Some of our clients

is growing fast!

We are looking to expand our presence in Ukraine!

As a Business Development Manager you will:

  • expand business in Ukraine
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!