курси Hadoop

курси Hadoop

Місцеві, інструктор під керівництвом жити Apache Hhaoop навчальних курсів демонструють через інтерактивні практичний практиці основні компоненти екосистеми Хаооп і як ці технології можуть бути використані для вирішення великомасштабних проблем.

Hhaoop підготовка доступна як "на місці навчання" або "дистанційне навчання жити". На місці навчання в прямому ефірі може здійснюватися на місцевому рівні в україна або в Неbleprog корпоративні навчальні центри в україна. Дистанційне навчання в прямому ефірі здійснюється шляхом інтерактивного, віддаленого робочого стола.

Nobleпрога-ваш місцевий навчальний провайдер

Machine Translated

Testimonials

★★★★★
★★★★★

Hadoop Course Outlines

Title
Duration
Overview
Title
Duration
Overview
7 hours
Overview
Alluxio - це система віртуальної розподіленої системи зберігання з відкритим кодом, яка об'єднує різноманітні системи зберігання даних та дозволяє програмам взаємодіяти з даними на швидкості пам'яті. Він використовується такими компаніями, як Intel, Baidu та Alibaba.

У цій інструкції під керівництвом живих тренінгів учасники навчаться використовувати Alluxio для монтажу різних обчислювальних систем із системами зберігання даних та ефективного управління даними з декількох петабайтних масштабів, оскільки вони проходять через створення додатка з Alluxio.

До кінця цього тренінгу учасники зможуть:

- Розробіть програму з Alluxio
- Підключіть великі системи та програми даних, зберігаючи при цьому одне простору імен
- Ефективно витягувати значення з великих даних у будь-якому форматі зберігання
- Покращення продуктивності робочого навантаження
- Розгортати та керувати Alluxio автономним або кластеризованим

Аудиторія

- Дані вченого
- Розробник
- Системний адміністратор

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
28 hours
Overview
Аудиторія:

Цей курс покликаний демістифікувати технології великих даних / hadoop і показати, що це не важко зрозуміти.
14 hours
Overview
Sqoop - це програмне забезпечення з відкритим кодом для передачі даних між Hadoop і реляційними базами даних або мейнфреймами. Він може використовуватися для імпорту даних з реляційної системи керування базами даних (RDBMS), такими як MySQL, Oracle або мейнфрейм у розподілену файлову систему Hadoop (HDFS). Після цього дані можуть бути перетворені в Hadoop MapReduce, а потім повторно експортуються назад в RDBMS.

У цій навчальній інструкції, учасники навчаться навчатися, як використовувати Sqoop для імпорту даних з традиційної реляційної бази даних до зберігання Hadoop таких HDFS або Hive і навпаки.

До кінця цього тренінгу учасники зможуть:

- Встановити та налаштувати Sqoop
- Імпортувати дані з MySQL на HDFS і Hive
- Імпортувати дані з HDFS і Hive в MySQL

Аудиторія

- Системні адміністратори
- Інженери-дані

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика

Примітка

- Щоб просити індивідуальне навчання для цього курсу, зв'яжіться з нами, щоб організувати.
14 hours
Overview
Apache Samza - це асинхронна обчислювальна рамка з відкритим кодом, що працює в реальному часі, для обробки потоків. Він використовує Apache Kafka для обміну повідомленнями, а Apache Hadoop YARN - для відмовостійкості, ізоляції процесора, безпеки та управління ресурсами.

Цей тренінг під керівництвом інструкторів представляє принципи, що стоять за системами обміну повідомленнями та обробкою розподілених потоків, під час проходження учасників шляхом створення зразкового проекту на базі Самзи та виконання завдань.

Після закінчення цього тренінгу учасники зможуть:

- Використовуйте Samza для спрощення коду, необхідного для створення та споживання повідомлень.
- Розв’яжіть обробку повідомлень із програми.
- Використовуйте Samza для здійснення асинхронних обчислень майже в реальному часі.
- Використовуйте потокову обробку для забезпечення більш високого рівня абстрагування над системами обміну повідомленнями.

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики
7 hours
Overview
Apache NiFi (Hortonworks DataFlow) є в режимі реального часу інтегрована логістика даних і проста платформа обробки подій, яка дозволяє рухатися, відстеження та автоматизації даних між системами. Вона написана з використанням потоку на основі програмування і надає веб-інтерфейс користувача для управління datafflow в режимі реального часу.

в цьому інструктор під керівництвом, жити навчання, учасники будуть вивчати основи потоку на основі програмування, як вони розробляють ряд демо-розширень, компонентів і процесорів з використанням Apache NiFi.

до кінця тренінгу учасники зможуть:

- розуміти nifi & #39; з архітектурою і потік даних концепцій.
- розробка розширень, що використовують NiFi та сторонні інтерфейси.
- звичай розвивати свої власні процесори Apache Nifi.
- ковтати і обробляти дані в реальному часі з різних і незвичайних форматів файлів і джерел даних.

Формат курсу

- Інтерактивна лекція та дискусія.
- багато вправ і практики.
- практичної реалізації в живій лабораторній обстановці.

курс параметри налаштування

- щоб запросити індивідуальну підготовку за цей курс, будь ласка, зв'яжіться з нами, щоб організувати.
21 hours
Overview
Apache NiFi (Hortonworks DataFlow) - це інтегрована логістика даних у режимі реального часу та проста платформа для обробки подій, яка дозволяє переміщувати, відстежувати та автоматизувати дані між системами. Він написаний за допомогою потокового програмування та забезпечує веб-інтерфейс для управління потоками даних у режимі реального часу.

У цьому навчанні на Apache NiFi під керівництвом інструкторів (на місці або на віддаленому рівні) учасники навчаться розгортати Apache NiFi та керувати Apache NiFi у прямому лабораторному середовищі.

Після закінчення цього тренінгу учасники зможуть:

- Встановлення та налаштування Apachi NiFi.
- Джерело, перетворення та управління даними з різних, розподілених джерел даних, включаючи бази даних та великі озера даних.
- Автоматизація потоків даних.
- Увімкнути потокову аналітику.
- Застосовуйте різні підходи до прийому даних.
- Перетворіть Big Data та перегляньте інформацію про бізнес.

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
14 hours
Overview
Аудиторія

- Розробники

Формат курсу

- Лекції, практичні заняття, невеликі тести на шляху до розуміння розуміння
21 hours
Overview
Cloudera Impala - це двигун SQL-запитів з масивно паралельною обробкою (MPP) із відкритим кодом для кластерів Apache Hadoop.

Impala дає користувачам змогу видавати запити з низькою затримкою SQL на дані, що зберігаються в розподіленої файлової системи Hadoop та Apache Hbase, не вимагаючи руху даних або перетворення.

Аудиторія

Цей курс спрямований на аналітики та вчені даних, які виконують аналіз даних, що зберігаються в Hadoop через Business Intelligence або SQL-інструменти.

Після цього курсу делегати зможуть

- Витягніть важливу інформацію з кластерів Hadoop з Impala.
- Напишіть спеціальні програми для полегшення бізнес-інтелекту в Impalt SQL Dialect.
- Виправлення неполадок.
7 hours
Overview
Цей курс охоплює використання мови SQL Hive (AKA: Hive HQL, SQL на Hive , Hive QL) для людей, які витягують дані з Hive
21 hours
Overview
Hortonworks Data Platform (HDP) - це платформа підтримки Apache Hadoop з відкритим кодом, що забезпечує стабільну основу для розробки великих рішень для даних в екосистемі Apache Hadoop .

Цей тренінг під керівництвом інструкторів (на місці або на дистанційному рівні) представляє Hortonworks Data Platform (HDP) та прогулює учасників шляхом розгортання рішення Spark + Hadoop .

Після закінчення цього тренінгу учасники зможуть:

- Використовуйте Hortonworks для надійного запуску Hadoop у великих масштабах.
- Уніфікуйте можливості безпеки, управління та операційних можливостей Hadoop за допомогою гнучких аналітичних робочих процесів Spark.
- Використовуйте Hortonworks для дослідження, підтвердження, сертифікації та підтримки кожного з компонентів у проекті Spark.
- Обробляйте різні типи даних, включаючи структуровані, неструктуровані, в русі та в спокої.

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
21 hours
Overview
Цей курс представляє HBase - магазин No SQL на вершині Hadoop . Курс призначений для розробників, які будуть використовувати HBase для розробки додатків, а також адміністраторів, які будуть керувати кластерами HBase.

Ми будемо йти розробником через архітектуру HBase, моделювання даних і розробку додатків на HBase. Також буде обговорено використання MapReduce з HBase, а також деякі теми адміністрування, пов'язані з оптимізацією продуктивності. Курс дуже практичний з великою кількістю лабораторних вправ.

Тривалість : 3 дні

Аудиторія : розробники та адміністратори
28 hours
Overview
Hadoop - це популярна система обробки великих даних. Python - це мова програмування високого рівня, відомий своїм зрозумілим синтаксисом та читаемостью коду.

У цій інструкції під керівництвом живих тренінгів учасники навчаться працювати з Hadoop, MapReduce, Pig і Spark за допомогою Python, коли вони пройдуть кілька прикладів і використовують випадки.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте основні концепції Hadoop, MapReduce, Pig і Spark
- Використовуйте Python з розподіленою файловою системою Hadoop (HDFS), MapReduce, Pig і Spark
- Використовуйте Snakebite для програмного доступу до HDFS у Python
- Використовуйте mrjob, щоб написати завдання MapReduce у Python
- Напишіть програми Spark за допомогою Python
- Розширюйте функціональність свині за допомогою Python UDF
- Керуйте роботами MapReduce та скриптами Pig, використовуючи Luigi

Аудиторія

- Розробники
- ІТ-фахівці

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
14 hours
Overview
Оскільки все більше і більше програмних і ІТ-проектів мігрують з локальної обробки та керування даними в розподілену обробку та зберігання великих даних, Менеджери проектів виявляють необхідність вдосконалювати свої знання та навички, щоб зрозуміти концепції та практику, що стосуються проектів та можливостей Big Data.

Цей курс ознайомить менеджера проектів з найпопулярнішою системою обробки великих даних: Hadoop.

У цьому тренінгу під керівництвом інструкторів учасники вивчатимуть основні компоненти екосистеми Hadoop та способи використання цих технологій для вирішення великомасштабних проблем. У процесі вивчення цих основ учасники також покращуть свою здатність спілкуватися з розробниками та розробниками цих систем, а також вченими даних та аналітиками, якими задіяні багато ІТ-проектів.

Аудиторія

- Менеджери проектів, які бажають впроваджувати Hadoop в існуючу інфраструктуру розвитку або ІТ
- Менеджери проектів, які потребують спілкування з міжфункціональними групами, до складу яких входять великі інженери даних, вчені даних та бізнес-аналітики

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Apache Ambari - це платформа управління з відкритим кодом для забезпечення, управління, моніторингу та забезпечення кластерів Apache Hadoop .

У цьому тренінгу під керівництвом інструкторів учасники навчатимуться інструментам управління та практикам, наданим Ambari для успішного управління кластерами Hadoop .

Після закінчення цього тренінгу учасники зможуть:

- Налаштуйте живий кластер Big Data за допомогою Ambari
- Застосовуйте розширені функції та функції Ambari до різних випадків використання
- Плавно додайте та видаляйте вузли за потребою
- Поліпшення продуктивності кластеру Hadoop за допомогою налаштування та налаштування

Аудиторія

- DevOps
- Системні адміністратори
- DBA
- Професіонали Hadoop тестування

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики
21 hours
Overview
Hadoop - це найпопулярніша система обробки великих даних.
21 hours
Overview
Apache Hadoop є одним з найпопулярніших фреймворків для обробки Big Data на кластерах серверів. Цей курс заглиблюється в управління даними в HDFS, просунуті Pig, Hive і HBase. Ці передові методи програмування будуть корисними для досвідчених розробників Hadoop .

Аудиторія : розробники

Тривалість: три дні

Формат: лекції (50%) та практичні заняття (50%).
28 hours
Overview
Apache Hadoop є найпопулярнішою базою для обробки Big Data на кластерах серверів. Цей курс познайомить розробника з різними компонентами (HDFS, MapReduce, Pig, Hive і HBase) екосистемою Hadoop .
21 hours
Overview
Apache Hadoop - це найпопулярніша база для обробки великих даних. Hadoop забезпечує багатий та глибокий аналітичний потенціал, і це робить дорогу в традиційний світ аналітиків BI. Цей курс представить аналітик основним компонентам Hadoop eco системи та її аналітику

Аудиторія

Бізнес аналітики

Тривалість

три дні

Формат

Лекції та руки в лабораторіях.
21 hours
Overview
Apache Hadoop є найпопулярнішою базою для обробки Big Data на кластерах серверів. У ході цих трьох (необов'язково, чотирьох) днів учасники дізнаються про ділові переваги та випадки використання Hadoop та його екосистеми, як планувати розгортання кластера та зростання, як встановлювати, підтримувати, контролювати, усувати та оптимізувати Hadoop . Вони також практикують завантаження масивних даних кластера, ознайомляться з різними дистрибутивами Hadoop і практикують встановлення та управління інструментами екосистеми Hadoop . Курс закінчується обговоренням забезпечення кластера з Kerberos.

“… Матеріали були дуже добре підготовлені і ретельно висвітлені. Лабораторія була дуже корисною та добре організованою »
- Ендрю Нгуєн, головний інженер з інтеграції DW, Microsoft Online Advertising

Аудиторія

Адміністратори Hadoop

Формат

Лекції та практичні заняття, приблизний баланс 60% лекцій, 40% лабораторних робіт.
21 hours
Overview
Курс присвячений ІТ-спеціалістам, які шукають рішення для зберігання та обробки великих наборів даних у середовищі розподіленої системи

Мета курсу:

Отримання знань про адміністрацію кластера Hadoop
14 hours
Overview
Datameer - це платформа бізнес-аналітики та аналітики, побудована на Hadoop. Це дозволяє кінцевим користувачам легко знаходити, вивчати та корелювати великомасштабні, структуровані, напівструктуровані та неструктуровані дані у зручному для використання спосіб.

У цій інструкції під керівництвом живих тренінгів учасники навчаться використовувати Datameer для подолання крутих навчальних кривої Hadoop, коли вони проходять процедуру встановлення та аналізу ряду великих джерел даних.

До кінця цього тренінгу учасники зможуть:

- Створюйте, перевіряйте та інтерактивно вивчайте озеро даних підприємства
- Доступ до сховищ даних бізнес-аналітики, транзакційних баз даних та інших аналітичних магазинів
- Використовуйте користувальницький інтерфейс електронних таблиць, щоб створювати конвеєрні обробки даних від кінцевого до кінця
- Доступ до попередньо побудованих функцій для вивчення складних зв'язків даних
- Використовуйте майстри перетягування для візуалізації даних та створення інформаційних панелей
- Використовуйте таблиці, діаграми, графіки та карти, щоб аналізувати результати запитів

Аудиторія

- Аналітик даних

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Аналітика великих даних включає процес вивчення великої кількості різноманітних наборів даних з метою виявлення кореляцій, прихованих зразків та інших корисних даних.

Промисловість охорони здоров'я має величезну кількість складних неоднорідних медичних та клінічних даних. Застосування аналітики великих даних щодо даних про охорону здоров'я представляє величезний потенціал для отримання розуміння щодо покращення надання медичної допомоги. Однак величезність цих наборів даних створює великі труднощі при аналізі та практичному застосуванні до клінічного середовища.

У цій навчальній програмі під керівництвом інструкторів (дистанційне навчання) учасники навчаться виконувати аналітику великих даних у галузі охорони здоров’я, переходячи через ряд практичних лабораторних вправ.

Після закінчення цього тренінгу учасники зможуть:

- Встановіть та налаштуйте інструменти для аналізу великих даних, такі як Hadoop MapReduce та Spark
- Розуміти характеристики медичних даних
- Застосовуйте методи великих даних для обробки медичних даних
- Вивчіть великі системи даних та алгоритми в контексті програм охорони здоров'я

Аудиторія

- Розробники
- Дані вчені

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики.

Примітка

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
21 hours
Overview
Цей курс призначений для розробників, архітекторів, учених даних або будь-якого профілю, для якого потрібен доступ до даних інтенсивно або на регулярній основі.

Основна тема курсу - маніпулювання та перетворення даних.

Серед інструментів в екосистемі Hadoop цей курс включає використання свиней та вуликів, обидва з яких значною мірою використовуються для перетворення даних та маніпулювання.

Це навчання також стосується показників ефективності та оптимізації ефективності.

Курс цілком керується пунктами в презентаціях теоретичних аспектів.
35 hours
Overview
Аудиторія:

Курс призначений для ІТ-фахівців, які шукають рішення для зберігання та обробки великих наборів даних у середовищі розподіленої системи

Go :

Глибокі знання про адміністрацію кластера Hadoop .
14 hours
Overview
Tigon - це платформа обробки потоків з відкритим вихідним кодом, в режимі реального часу, з низькою затримкою, високою пропускною спроможністю, натуральною оптоволоконною лінією, що стоїть на вершині HDFS та HBase за наполегливість. Прикладні програми Tigon використовують такі випадки, як виявлення та аналіз вторгнення в мережу, аналіз ринку соціальних мереж, аналітика місць розташування та рекомендації користувачам у реальному часі.

Під керівництвом інструктора, живого тренінгу, вводять підхід Тигона до поєднання режиму реального часу та пакетної обробки, оскільки він ходить учасників шляхом створення прикладу програми.

До кінця цього тренінгу учасники зможуть:

- Створюйте потужні поточні програми для обробки великих обсягів даних
- Опрацюйте джерела потоку, такі як Twitter і веб-серверів
- Використовуйте Tigon для швидкого приєднання, фільтрації та об'єднання потоків

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
Weekend Hadoop courses, Evening Hadoop training, Hadoop boot camp, Hadoop instructor-led, Weekend Hadoop training, Evening Apache Hadoop courses, Hadoop coaching, Apache Hadoop instructor, Hadoop trainer, Apache Hadoop training courses, Hadoop classes, Hadoop on-site, Hadoop private courses, Hadoop one on one training

Course Discounts

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Some of our clients

is growing fast!

We are looking to expand our presence in Ukraine!

As a Business Development Manager you will:

  • expand business in Ukraine
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!