курси Apache Spark

курси Apache Spark

Місцеві, інструктор під керівництвом жити Apache свічки навчальних курсів демонструють через практичний практиці, як іскри вписується в велику екосистему даних, і як використовувати іскру для аналізу даних.

Apache Spark навчання доступне як "на місці навчання" або "дистанційне навчання жити". На місці навчання в прямому ефірі може здійснюватися на місцевому рівні в україна або в Неbleprog корпоративні навчальні центри в україна. Дистанційне навчання в прямому ефірі здійснюється шляхом інтерактивного, віддаленого робочого стола.

Nobleпрога-ваш місцевий навчальний провайдер

Machine Translated

Testimonials

★★★★★
★★★★★

Apache Spark Subcategories

Apache Spark Course Outlines

Title
Duration
Overview
Title
Duration
Overview
21 hours
Overview
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
7 hours
Overview
Alluxio - це система віртуальної розподіленої системи зберігання з відкритим кодом, яка об'єднує різноманітні системи зберігання даних та дозволяє програмам взаємодіяти з даними на швидкості пам'яті. Він використовується такими компаніями, як Intel, Baidu та Alibaba.

У цій інструкції під керівництвом живих тренінгів учасники навчаться використовувати Alluxio для монтажу різних обчислювальних систем із системами зберігання даних та ефективного управління даними з декількох петабайтних масштабів, оскільки вони проходять через створення додатка з Alluxio.

До кінця цього тренінгу учасники зможуть:

- Розробіть програму з Alluxio
- Підключіть великі системи та програми даних, зберігаючи при цьому одне простору імен
- Ефективно витягувати значення з великих даних у будь-якому форматі зберігання
- Покращення продуктивності робочого навантаження
- Розгортати та керувати Alluxio автономним або кластеризованим

Аудиторія

- Дані вченого
- Розробник
- Системний адміністратор

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Аналітика великих даних включає процес вивчення великої кількості різноманітних наборів даних з метою виявлення кореляцій, прихованих зразків та інших корисних даних.

Промисловість охорони здоров'я має величезну кількість складних неоднорідних медичних та клінічних даних. Застосування аналітики великих даних щодо даних про охорону здоров'я представляє величезний потенціал для отримання розуміння щодо покращення надання медичної допомоги. Однак величезність цих наборів даних створює великі труднощі при аналізі та практичному застосуванні до клінічного середовища.

У цій навчальній програмі під керівництвом інструкторів (дистанційне навчання) учасники навчаться виконувати аналітику великих даних у галузі охорони здоров’я, переходячи через ряд практичних лабораторних вправ.

Після закінчення цього тренінгу учасники зможуть:

- Встановіть та налаштуйте інструменти для аналізу великих даних, такі як Hadoop MapReduce та Spark
- Розуміти характеристики медичних даних
- Застосовуйте методи великих даних для обробки медичних даних
- Вивчіть великі системи даних та алгоритми в контексті програм охорони здоров'я

Аудиторія

- Розробники
- Дані вчені

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики.

Примітка

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
28 hours
Overview
Велику кількість реальних проблем можна описати в термінах графів. Наприклад, веб-графік, графік соціальної мережі, мережевий графік поїзду та мовний графік. Ці графіки, як правило, надзвичайно великі; обробка їх вимагає спеціалізованого набору інструментів і процесів - ці інструменти та процеси можна називати Graph Computing (також відомі як Graph Analytics).

У цій інструкції під керівництвом тренерів, учасники дізнаються про технологічні пропозиції та підходи до реалізації для обробки даних графіка. Мета полягає в тому, щоб визначити об'єкти реального світу, їх характеристики та взаємозв'язки, потім моделювати ці відносини та обробляти їх як дані, використовуючи графічний підхід. Почнемо з широкого огляду та обмежених конкретними інструментами, коли ми просуваємо низку конкретних досліджень, практичних вправ і живих розробок.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте, як графічні дані зберігаються та переміщуються
- Виберіть найкращі рамки для заданого завдання (від графічних баз даних до пакетної обробки)
- Запровадьте Hadoop, Spark, GraphX ​​і Pregel, щоб провести графічне обчислення на багатьох машинах паралельно
- Перегляньте великі проблеми, пов'язані з даними в реальному масштабі, з точки зору графіків, процесів та переходів

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Hortonworks Data Platform (HDP) - це платформа підтримки Apache Hadoop з відкритим кодом, що забезпечує стабільну основу для розробки великих рішень для даних в екосистемі Apache Hadoop .

Цей тренінг під керівництвом інструкторів (на місці або на дистанційному рівні) представляє Hortonworks Data Platform (HDP) та прогулює учасників шляхом розгортання рішення Spark + Hadoop .

Після закінчення цього тренінгу учасники зможуть:

- Використовуйте Hortonworks для надійного запуску Hadoop у великих масштабах.
- Уніфікуйте можливості безпеки, управління та операційних можливостей Hadoop за допомогою гнучких аналітичних робочих процесів Spark.
- Використовуйте Hortonworks для дослідження, підтвердження, сертифікації та підтримки кожного з компонентів у проекті Spark.
- Обробляйте різні типи даних, включаючи структуровані, неструктуровані, в русі та в спокої.

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
21 hours
Overview
Stream Processing відноситься до Stream Processing в режимі реального часу "даних у русі", тобто виконання обчислень даних під час їх отримання. Такі дані читаються як безперервні потоки з джерел даних, таких як датчики подій, активність користувачів веб-сайту, фінансові торги, перетягування кредитних карт, потоки кліків тощо. Структури Stream Processing потоків здатні зчитувати великі обсяги вхідних даних і надавати цінну інформацію майже миттєво.

У цьому навчанні на практиці під керівництвом інструкторів (на місці чи на віддаленому рівні) учасники дізнаються, як налаштувати та інтегрувати різні рамки Stream Processing передачі з існуючими системами зберігання великих даних та відповідними програмними програмами та мікросервісами.

Після закінчення цього тренінгу учасники зможуть:

- Встановіть та налаштуйте різні рамки Stream Processing , такі як Spark Streaming та Kafka Streaming.
- Розумійте та вибирайте найбільш підходящу основу для роботи.
- Обробляйте дані безперервно, одночасно та в режимі рекорду.
- Інтегруйте рішення Stream Processing даних з існуючими базами даних, сховищами даних, озерами даних тощо.
- Інтеграція найбільш підходящої бібліотеки обробки потоків з корпоративними програмами та мікросервісами.

Аудиторія

- Розробники
- Архітектори програмного забезпечення

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики

Примітки

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
14 hours
Overview
Magellan - це механізм розподіленого виконання з відкритим кодом для геопросторової аналітики великих даних. Реалізований поверх Apache Spark , він розширює Spark SQL і забезпечує реляційну абстракцію для геопросторової аналітики.

Цей тренінг під керівництвом викладачів знайомить із концепціями та підходами до впровадження геопросторової аналітики та прогулянок учасників шляхом створення програми прогнозного аналізу за допомогою Magellan on Spark.

Після закінчення цього тренінгу учасники зможуть:

- Ефективно запитувати, аналізувати та приєднуватися до геопросторових наборів даних у масштабі
- Впроваджуйте геопросторові дані в додатках бізнес-аналітики та прогнозної аналітики
- Використовуйте просторовий контекст для розширення можливостей мобільних пристроїв, датчиків, журналів та носіння

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
21 hours
Overview
Крива навчання Apache Spark повільно зростає, для отримання першої віддачі потрібно багато зусиль. Цей курс має на меті перейти через першу складну частину. Після проходження цього курсу учасники зрозуміють основи Apache Spark , вони чітко розмежують RDD від DataFrame, вони вивчать API Python та Scala , вони зрозуміють виконавців та завдання тощо. Також, дотримуючись кращих практик, цей курс сильно зосереджується на хмарне розгортання, Databricks та AWS. Студенти також зрозуміють різницю між AWS EMR та AWS Glue, одним із найсвіжіших сервісів Spark AWS.

АУДІЄНТ:

Інженер даних, DevOps , Data Scientist
21 hours
Overview
Об'єктивно:

Цей курс представить Apache Spark . Студенти дізнаються, як Spark вписується в екосистему Big Data , і як використовувати Spark для аналізу даних. Курс охоплює оболонку Spark для інтерактивного аналізу даних, Spark internals, Spark API, Spark SQL , Spark streaming, і машинне навчання і graphX.

АУДИТОРІЯ:

Розробники / аналітики даних
21 hours
Overview
Python - мова програмування високого рівня, що славиться чітким синтаксисом та читальністю коду. Spark - це двигун обробки даних, який використовується для запитів, аналізу та перетворення великих даних. PySpark дозволяє користувачам взаємодіяти Spark з Python .

У цьому тренінгу під керівництвом інструкторів учасники навчаться використовувати Python та Spark разом для аналізу великих даних під час роботи над практичними вправами.

Після закінчення цього тренінгу учасники зможуть:

- Дізнайтеся, як використовувати Spark with Python для аналізу Big Data .
- Робота над вправами, що імітують реальні обставини світу.
- Використовуйте різні інструменти та методи для аналізу великих даних за допомогою PySpark .

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики
7 hours
Overview
Spark SQL - це модуль Apache Spark для роботи зі структурованими та неструктурованими даними. Spark SQL надає інформацію про структуру даних, а також про обчислення, що виконуються. Ця інформація може бути використана для оптимізації. Дві загальні можливості використання Spark SQL :
- для виконання SQL запитів.
- для зчитування даних з існуючої установки Hive .

У цьому навчанні на практиці під керівництвом інструкторів (на місці або на віддаленому рівні) учасники навчаться аналізувати різні типи наборів даних за допомогою Spark SQL .

Після закінчення цього тренінгу учасники зможуть:

- Встановлення та налаштування Spark SQL .
- Виконайте аналіз даних за допомогою Spark SQL .
- Набір даних набору даних у різних форматах.
- Візуалізуйте дані та результати запитів.

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
35 hours
Overview
MLlib - це бібліотека машинного навчання Spark. Його мета полягає в тому, щоб зробити практичне машинне навчання масштабованим і легким. Вона складається з загальних алгоритмів навчання та утиліт, включаючи класифікацію, регресію, кластеризацію, спільну фільтрацію, зменшення розмірності, а також примітиви оптимізації нижнього рівня та API API вищого рівня.

Він поділяється на два пакети:

-

spark.mllib містить оригінальний API, побудований поверх RDD.

-

spark.ml надає API вищого рівня, побудований на базі DataFrames для побудови конвеєрів ML.

Аудиторія

Цей курс спрямований на інженерів і розробників, які прагнуть використовувати вбудовану бібліотеку машин для Apache Spark

Upcoming Spark Courses

Weekend Apache Spark courses, Evening Apache Spark training, Apache Spark boot camp, Apache Spark instructor-led, Weekend Apache Spark training, Evening Spark courses, Apache Spark coaching, Spark instructor, Apache Spark trainer, Spark training courses, Apache Spark classes, Apache Spark on-site, Apache Spark private courses, Apache Spark one on one training

Course Discounts

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Some of our clients

is growing fast!

We are looking to expand our presence in Ukraine!

As a Business Development Manager you will:

  • expand business in Ukraine
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!