курси Apache Spark

курси Apache Spark

Місцеві, інструктор під керівництвом жити Apache свічки навчальних курсів демонструють через практичний практиці, як іскри вписується в велику екосистему даних, і як використовувати іскру для аналізу даних.

Apache Spark навчання доступне як "на місці навчання" або "дистанційне навчання жити". На місці навчання в прямому ефірі може здійснюватися на місцевому рівні в україні або в Неbleprog корпоративні навчальні центри в україні. Дистанційне навчання в прямому ефірі здійснюється шляхом інтерактивного, віддаленого робочого стола.

Nobleпрога-ваш місцевий навчальний провайдер

Machine Translated

Відгуки

★★★★★
★★★★★

Spark Підкатегорії

Spark Зміст курсу

Назва курсу
Тривалість
Огляд
Назва курсу
Тривалість
Огляд
21 годин
Огляд
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
7 годин
Огляд
Alluxio - це система віртуальної розподіленої системи зберігання з відкритим кодом, яка об'єднує різноманітні системи зберігання даних та дозволяє програмам взаємодіяти з даними на швидкості пам'яті. Він використовується такими компаніями, як Intel, Baidu та Alibaba.

У цій інструкції під керівництвом живих тренінгів учасники навчаться використовувати Alluxio для монтажу різних обчислювальних систем із системами зберігання даних та ефективного управління даними з декількох петабайтних масштабів, оскільки вони проходять через створення додатка з Alluxio.

До кінця цього тренінгу учасники зможуть:

- Розробіть програму з Alluxio
- Підключіть великі системи та програми даних, зберігаючи при цьому одне простору імен
- Ефективно витягувати значення з великих даних у будь-якому форматі зберігання
- Покращення продуктивності робочого навантаження
- Розгортати та керувати Alluxio автономним або кластеризованим

Аудиторія

- Дані вченого
- Розробник
- Системний адміністратор

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 годин
Огляд
Аналітика великих даних включає процес вивчення великої кількості різноманітних наборів даних з метою виявлення кореляцій, прихованих зразків та інших корисних даних.

Промисловість охорони здоров'я має величезну кількість складних неоднорідних медичних та клінічних даних. Застосування аналітики великих даних щодо даних про охорону здоров'я представляє величезний потенціал для отримання розуміння щодо покращення надання медичної допомоги. Однак величезність цих наборів даних створює великі труднощі при аналізі та практичному застосуванні до клінічного середовища.

У цій навчальній програмі під керівництвом інструкторів (дистанційне навчання) учасники навчаться виконувати аналітику великих даних у галузі охорони здоров’я, переходячи через ряд практичних лабораторних вправ.

Після закінчення цього тренінгу учасники зможуть:

- Встановіть та налаштуйте інструменти для аналізу великих даних, такі як Hadoop MapReduce та Spark
- Розуміти характеристики медичних даних
- Застосовуйте методи великих даних для обробки медичних даних
- Вивчіть великі системи даних та алгоритми в контексті програм охорони здоров'я

Аудиторія

- Розробники
- Дані вчені

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики.

Примітка

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
28 годин
Огляд
Велику кількість реальних проблем можна описати в термінах графів. Наприклад, веб-графік, графік соціальної мережі, мережевий графік поїзду та мовний графік. Ці графіки, як правило, надзвичайно великі; обробка їх вимагає спеціалізованого набору інструментів і процесів - ці інструменти та процеси можна називати Graph Computing (також відомі як Graph Analytics).

У цій інструкції під керівництвом тренерів, учасники дізнаються про технологічні пропозиції та підходи до реалізації для обробки даних графіка. Мета полягає в тому, щоб визначити об'єкти реального світу, їх характеристики та взаємозв'язки, потім моделювати ці відносини та обробляти їх як дані, використовуючи графічний підхід. Почнемо з широкого огляду та обмежених конкретними інструментами, коли ми просуваємо низку конкретних досліджень, практичних вправ і живих розробок.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте, як графічні дані зберігаються та переміщуються
- Виберіть найкращі рамки для заданого завдання (від графічних баз даних до пакетної обробки)
- Запровадьте Hadoop, Spark, GraphX ​​і Pregel, щоб провести графічне обчислення на багатьох машинах паралельно
- Перегляньте великі проблеми, пов'язані з даними в реальному масштабі, з точки зору графіків, процесів та переходів

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 годин
Огляд
Hortonworks Data Platform (HDP) - це платформа підтримки Apache Hadoop з відкритим кодом, що забезпечує стабільну основу для розробки великих рішень для даних в екосистемі Apache Hadoop .

Цей тренінг під керівництвом інструкторів (на місці або на дистанційному рівні) представляє Hortonworks Data Platform (HDP) та прогулює учасників шляхом розгортання рішення Spark + Hadoop .

Після закінчення цього тренінгу учасники зможуть:

- Використовуйте Hortonworks для надійного запуску Hadoop у великих масштабах.
- Уніфікуйте можливості безпеки, управління та операційних можливостей Hadoop за допомогою гнучких аналітичних робочих процесів Spark.
- Використовуйте Hortonworks для дослідження, підтвердження, сертифікації та підтримки кожного з компонентів у проекті Spark.
- Обробляйте різні типи даних, включаючи структуровані, неструктуровані, в русі та в спокої.

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
21 годин
Огляд
Stream Processing відноситься до Stream Processing в режимі реального часу "даних у русі", тобто виконання обчислень даних під час їх отримання. Такі дані читаються як безперервні потоки з джерел даних, таких як датчики подій, активність користувачів веб-сайту, фінансові торги, перетягування кредитних карт, потоки кліків тощо. Структури Stream Processing потоків здатні зчитувати великі обсяги вхідних даних і надавати цінну інформацію майже миттєво.

У цьому навчанні на практиці під керівництвом інструкторів (на місці або на дистанційному рівні) учасники навчаться налаштувати та інтегрувати різні рамки Stream Processing з існуючими системами зберігання великих даних та відповідними програмними програмами та мікросервісами.

Після закінчення цього тренінгу учасники зможуть:

- Встановіть та налаштуйте різні рамки Stream Processing , такі як Spark Streaming та Kafka Streaming.
- Розумійте та вибирайте найбільш підходящу основу для роботи.
- Обробляйте дані безперервно, одночасно та в режимі рекорду.
- Інтегруйте рішення Stream Processing даних з існуючими базами даних, сховищами даних, озерами даних тощо.
- Інтеграція найбільш підходящої бібліотеки обробки потоків з корпоративними програмами та мікросервісами.

Аудиторія

- Розробники
- Архітектори програмного забезпечення

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики

Примітки

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
14 годин
Огляд
Magellan - це механізм розподіленого виконання з відкритим кодом для геопросторової аналітики великих даних. Реалізований поверх Apache Spark , він розширює Spark SQL і забезпечує реляційну абстракцію для геопросторової аналітики.

Цей тренінг під керівництвом викладачів знайомить із концепціями та підходами до впровадження геопросторової аналітики та прогулянок учасників шляхом створення програми прогнозного аналізу за допомогою Magellan on Spark.

Після закінчення цього тренінгу учасники зможуть:

- Ефективно запитувати, аналізувати та приєднуватися до геопросторових наборів даних у масштабі
- Впроваджуйте геопросторові дані в додатках бізнес-аналітики та прогнозування
- Використовуйте просторовий контекст для розширення можливостей мобільних пристроїв, датчиків, журналів та носіння

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
21 годин
Огляд
Крива навчання Apache Spark повільно зростає, для отримання першої віддачі потрібно багато зусиль. Цей курс має на меті перейти через першу складну частину. Після проходження цього курсу учасники зрозуміють основи Apache Spark , вони чітко розмежують RDD від DataFrame, вони вивчать API Python та Scala , зрозуміють виконавців та завдання тощо. хмарне розгортання, Databricks та AWS. Студенти також зрозуміють різницю між AWS EMR та AWS Glue, одним із найсвіжіших сервісів Spark AWS.

АУДІЄНТ:

Інженер даних, DevOps , Data Scientist
21 годин
Огляд
МЕТА:

Цей курс представить Apache Spark . Студенти дізнаються, як Spark вписується в екосистему Big Data та як використовувати Spark для аналізу даних. Курс охоплює Іскрову оболонку для інтерактивного аналізу даних, Іскрових інтерфейсів, Іскрових API, Spark SQL , Іскрового потоку та машинного навчання та graphX.

АУДІЄНТ:

Розробники / Аналітики даних
21 годин
Огляд
Python - мова програмування високого рівня, що славиться чітким синтаксисом та читальністю коду. Spark - це двигун обробки даних, який використовується для запитів, аналізу та перетворення великих даних. PySpark дозволяє користувачам взаємодіяти Spark з Python .

У цьому тренінгу під керівництвом інструкторів учасники навчаться використовувати Python та Spark разом для аналізу великих даних під час роботи над практичними вправами.

Після закінчення цього тренінгу учасники зможуть:

- Дізнайтеся, як використовувати Spark with Python для аналізу Big Data .
- Робота над вправами, що імітують реальні обставини світу.
- Використовуйте різні інструменти та методи для аналізу великих даних за допомогою PySpark .

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики
21 годин
Огляд
Scala - це скорочена версія Java для масштабного функціонального та об'єктно-орієнтованого програмування. Apache Spark Streaming - це розширений компонент API Spark для обробки великих наборів даних як потоків у режимі реального часу. Разом Spark Streaming та Scala дозволяють передавати великі дані.

Ця навчальна програма під керівництвом інструкторів (на місці чи на дистанційному рівні) спрямована на інженерів програмного забезпечення, які бажають передавати великі дані за допомогою Spark Streaming та Scala .

Після закінчення цього тренінгу учасники зможуть:

- Створіть програми Spark за допомогою мови програмування Scala .
- Використовуйте іскрову потоку для обробки безперервних потоків даних.
- Обробляйте потоки даних у режимі реального часу за допомогою Spark Streaming.

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
7 годин
Огляд
Spark SQL - це модуль Apache Spark для роботи зі структурованими та неструктурованими даними. Spark SQL надає інформацію про структуру даних, а також про обчислення, що виконуються. Ця інформація може бути використана для оптимізації. Дві загальні можливості використання Spark SQL :
- для виконання SQL запитів.
- для зчитування даних з існуючої установки Hive .

У цьому навчанні на практиці під керівництвом інструкторів (на місці або на віддаленому рівні) учасники навчаться аналізувати різні типи наборів даних за допомогою Spark SQL .

Після закінчення цього тренінгу учасники зможуть:

- Встановлення та налаштування Spark SQL .
- Виконайте аналіз даних за допомогою Spark SQL .
- Набір даних набору даних у різних форматах.
- Візуалізуйте дані та результати запитів.

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
35 годин
Огляд
MLlib - це бібліотека машинного навчання Spark. Його мета полягає в тому, щоб зробити практичне машинне навчання масштабованим і легким. Вона складається з загальних алгоритмів навчання та утиліт, включаючи класифікацію, регресію, кластеризацію, спільну фільтрацію, зменшення розмірності, а також примітиви оптимізації нижнього рівня та API API вищого рівня.

Він поділяється на два пакети:

-

spark.mllib містить оригінальний API, побудований поверх RDD.

-

spark.ml надає API вищого рівня, побудований на базі DataFrames для побудови конвеєрів ML.

Аудиторія

Цей курс спрямований на інженерів і розробників, які прагнуть використовувати вбудовану бібліотеку машин для Apache Spark
Weekend Apache Spark courses, Evening Apache Spark training, Spark boot camp, Spark instructor-led, Weekend Apache Spark training, Evening Spark courses, Spark coaching, Apache Spark instructor, Apache Spark trainer, Apache Spark training courses, Apache Spark classes, Spark on-site, Spark private courses, Spark one on one training

Знижки на курс

No course discounts for now.

Інформаційний бюлетень "Знижки на курси"

Ми поважаємо конфіденційність Ваших персональних даних. Ми зобов'язуємось не передавати Ваші дані іншим особам. Ви завжди можете змінити свої налаштування конфіденційності або повністю відмовитись від підписки.

Наші клієнти

is growing fast!

We are looking to expand our presence in Ukraine!

As a Business Development Manager you will:

  • expand business in Ukraine
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!