Навчальні курси Apache Spark

Навчальні курси Apache Spark

Місцеві, інструктор під керівництвом жити Apache свічки навчальних курсів демонструють через практичний практиці, як іскри вписується в велику екосистему даних, і як використовувати іскру для аналізу даних.

Apache Spark навчання доступне як "на місці навчання" або "дистанційне навчання жити". На місці навчання в прямому ефірі може здійснюватися на місцевому рівні в україні або в Неbleprog корпоративні навчальні центри в україні. Дистанційне навчання в прямому ефірі здійснюється шляхом інтерактивного, віддаленого робочого стола.

Nobleпрога-ваш місцевий навчальний провайдер

Machine Translated

Відгуки

★★★★★
★★★★★

Spark Підкатегорії

Spark Зміст курсу

Назва курсу
Тривалість
Огляд
Назва курсу
Тривалість
Огляд
21 годин
Python є масштабним, гнучким і широко використовуваним мовою програмування для науки про дані та машинного навчання. Spark - це двигун з обробки даних, який використовується для пошуку, аналізу та трансформації великих даних, в той час як Hadoop - це програмна бібліотека для масового зберігання та обробки даних.

Цей інструктор-під керівництвом, прямий тренінг (онлайн або на сайті) спрямований на розробників, які бажають використовувати і інтегрувати Spark, Hadoop, і Python для обробки, аналізу та трансформації великих і складних наборів даних.

Після закінчення тренінгу учасники зможуть:

Налаштуйте необхідне середовище для початку обробки великих даних за допомогою Spark, Hadoop, і Python. Поясніть характеристики, основні компоненти та архітектуру Спарка і Hadoop. Дізнайтеся, як інтегрувати Spark, Hadoop, і Python для обробки великих даних. Вивчайте інструменти в екосистемі Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka, і Flume). Створюйте спільні системи фільтрації, подібні до Netflix, YouTube, Amazon, Spotify і Google. Використовуйте Apache Mahout для скалювання алгоритмів машинного навчання.

Формат курсу

Інтерактивні лекції та дискусії. Багато випробувань і практики. Використання в робочому середовищі Live-Lab.

Курсові варіанти адаптації

Щоб отримати персоналізовану підготовку для цього курсу, будь ласка, зв'яжіться з нами, щоб організувати.
21 годин
Python є високоякісним мовою програмування, відомим за чіткий синтакс і читальність коду. Spark - це двигун для обробки даних, який використовується для пошуку, аналізу та перетворення великих даних. PySpark дозволяє користувачам інтерфейсувати Spark з Python.

У цьому тренінгу, який очолює інструктор, учасники дізнаються, як використовувати Python і Spark разом для аналізу великих даних, оскільки вони працюють на практичних тренуваннях.

Після закінчення тренінгу учасники зможуть:

Знайдіть, як використовувати Spark з Python для аналізу Big Data. Працюйте на тренуваннях, які імітують реальні випадки світу. Використовуйте різні інструменти та методи для аналізу великих даних PySpark.

Формат курсу

Часткова лекція, частина дискусії, заняття та важка практика
21 годин
МЕТА:

Цей курс представить Apache Spark . Студенти дізнаються, як Spark вписується в екосистему Big Data та як використовувати Spark для аналізу даних. Курс охоплює Іскрову оболонку для інтерактивного аналізу даних, Іскрових інтерфейсів, Іскрових API, Spark SQL , Іскрового потоку та машинного навчання та graphX.

АУДІЄНТ:

Розробники / Аналітики даних
21 годин
Hortonworks Data Platform (HDP) - це платформа підтримки Apache Hadoop з відкритим кодом, що забезпечує стабільну основу для розробки великих рішень для даних в екосистемі Apache Hadoop .

Цей тренінг під керівництвом інструкторів (на місці або на дистанційному рівні) представляє Hortonworks Data Platform (HDP) та прогулює учасників шляхом розгортання рішення Spark + Hadoop .

Після закінчення цього тренінгу учасники зможуть:

- Використовуйте Hortonworks для надійного запуску Hadoop у великих масштабах.
- Уніфікуйте можливості безпеки, управління та операційних можливостей Hadoop за допомогою гнучких аналітичних робочих процесів Spark.
- Використовуйте Hortonworks для дослідження, підтвердження, сертифікації та підтримки кожного з компонентів у проекті Spark.
- Обробляйте різні типи даних, включаючи структуровані, неструктуровані, в русі та в спокої.

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
14 годин
Magellan - це відкритий розповсюджений двигун для геокосмічної аналітики великих даних. Введений на вершині Apache Spark, він розширює Spark SQL і забезпечує відносну абстракцію для геопростірної аналітики.

Цей інструктор-під керівництвом, прямий тренінг вводить концепції та підходи для реалізації геопросторової аналітики і проходить учасників шляхом створення передбачувальної аналітичної програми, використовуючи Магелан на Spark.

Після закінчення тренінгу учасники зможуть:

Ефективно запитувати, розділяти і приєднувати геопростірні дані на масштабі Впровадження геопростірних даних в бізнес-інтелекту та прогнозних аналітичних додатках Використовуйте простірний контекст для розширення можливостей мобільних пристроїв, датчиків, журналів та носій

Формат курсу

Інтерактивні лекції та дискусії. Багато випробувань і практики. Використання в робочому середовищі Live-Lab.

Курсові варіанти адаптації

Щоб отримати персоналізовану підготовку для цього курсу, будь ласка, зв'яжіться з нами, щоб організувати.
7 годин
Alluxio є віртуальною системою розповсюдженого зберігання з відкритим кодом, яка об'єднує різноманітні системи зберігання і дозволяє додаткам взаємодіяти з даними при швидкості пам'яті. Використовується компаніями, такими як Intel, Baidu і Alibaba.

У цьому тренінгу, який очолює інструктор, учасники дізнаються, як використовувати Alluxio для мостування різних обчислювальних рамок з системами зберігання та ефективно керувати даними кількох петабайт, як вони проходять через створення додатку з Alluxio.

Після закінчення тренінгу учасники зможуть:

Розробка додатку з Alluxio Підключення великих систем даних та додатків при збереженні одного іменного простору Ефективно витягує вартість з великих даних у будь-якому форматі зберігання Підвищення ефективності робочого навантаження Розподіл і управління Alluxio самостійно або кластеризовано

аудиторія

Дані науковці Розробник Системний адміністратор

Формат курсу

Часткова лекція, частина дискусії, заняття та важка практика
7 годин
Spark SQL - це модуль Apache Spark для роботи зі структурованими та неструктурованими даними. Spark SQL надає інформацію про структуру даних, а також про обчислення, що виконуються. Ця інформація може бути використана для оптимізації. Дві загальні можливості використання Spark SQL :
- для виконання SQL запитів.
- для зчитування даних з існуючої установки Hive .

У цьому навчанні на практиці під керівництвом інструкторів (на місці або на віддаленому рівні) учасники навчаться аналізувати різні типи наборів даних за допомогою Spark SQL .

Після закінчення цього тренінгу учасники зможуть:

- Встановлення та налаштування Spark SQL .
- Виконайте аналіз даних за допомогою Spark SQL .
- Набір даних набору даних у різних форматах.
- Візуалізуйте дані та результати запитів.

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
21 годин
Stream Processing відноситься до Stream Processing в режимі реального часу "даних у русі", тобто виконання обчислень даних під час їх отримання. Такі дані читаються як безперервні потоки з джерел даних, таких як датчики подій, активність користувачів веб-сайту, фінансові торги, перетягування кредитних карт, потоки кліків тощо. Структури Stream Processing потоків здатні зчитувати великі обсяги вхідних даних і надавати цінну інформацію майже миттєво.

У цьому навчанні на практиці під керівництвом інструкторів (на місці або на дистанційному рівні) учасники навчаться налаштувати та інтегрувати різні рамки Stream Processing з існуючими системами зберігання великих даних та відповідними програмними програмами та мікросервісами.

Після закінчення цього тренінгу учасники зможуть:

- Встановіть та налаштуйте різні рамки Stream Processing , такі як Spark Streaming та Kafka Streaming.
- Розумійте та вибирайте найбільш підходящу основу для роботи.
- Обробляйте дані безперервно, одночасно та в режимі рекорду.
- Інтегруйте рішення Stream Processing даних з існуючими базами даних, сховищами даних, озерами даних тощо.
- Інтеграція найбільш підходящої бібліотеки обробки потоків з корпоративними програмами та мікросервісами.

Аудиторія

- Розробники
- Архітектори програмного забезпечення

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики

Примітки

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
21 годин
Аналітика великих даних включає процес вивчення великої кількості різноманітних наборів даних з метою виявлення кореляцій, прихованих зразків та інших корисних даних.

Промисловість охорони здоров'я має величезну кількість складних неоднорідних медичних та клінічних даних. Застосування аналітики великих даних щодо даних про охорону здоров'я представляє величезний потенціал для отримання розуміння щодо покращення надання медичної допомоги. Однак величезність цих наборів даних створює великі труднощі при аналізі та практичному застосуванні до клінічного середовища.

У цій навчальній програмі під керівництвом інструкторів (дистанційне навчання) учасники навчаться виконувати аналітику великих даних у галузі охорони здоров’я, переходячи через ряд практичних лабораторних вправ.

Після закінчення цього тренінгу учасники зможуть:

- Встановіть та налаштуйте інструменти для аналізу великих даних, такі як Hadoop MapReduce та Spark
- Розуміти характеристики медичних даних
- Застосовуйте методи великих даних для обробки медичних даних
- Вивчіть великі системи даних та алгоритми в контексті програм охорони здоров'я

Аудиторія

- Розробники
- Дані вчені

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики.

Примітка

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
21 годин
Крива навчання Apache Spark повільно зростає, для отримання першої віддачі потрібно багато зусиль. Цей курс має на меті перейти через першу складну частину. Після проходження цього курсу учасники зрозуміють основи Apache Spark , вони чітко розмежують RDD від DataFrame, вони вивчать API Python та Scala , зрозуміють виконавців та завдання тощо. хмарне розгортання, Databricks та AWS. Студенти також зрозуміють різницю між AWS EMR та AWS Glue, одним із найсвіжіших сервісів Spark AWS.

АУДІЄНТ:

Інженер даних, DevOps , Data Scientist
21 годин
Scala - це скорочена версія Java для масштабного функціонального та об'єктно-орієнтованого програмування. Apache Spark Streaming - це розширений компонент API Spark для обробки великих наборів даних як потоків у режимі реального часу. Разом Spark Streaming та Scala дозволяють передавати великі дані.

Ця навчальна програма під керівництвом інструкторів (на місці чи на дистанційному рівні) спрямована на інженерів програмного забезпечення, які бажають передавати великі дані за допомогою Spark Streaming та Scala .

Після закінчення цього тренінгу учасники зможуть:

- Створіть програми Spark за допомогою мови програмування Scala .
- Використовуйте іскрову потоку для обробки безперервних потоків даних.
- Обробляйте потоки даних у режимі реального часу за допомогою Spark Streaming.

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
14 годин
SMACK - це збірка програмного забезпечення платформи даних, а саме Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, і Apache Kafka. За допомогою SMACK stack користувачі можуть створювати та масштабувати платформи для обробки даних.

Цей інструктор-під керівництвом, прямий тренінг (онлайн або на сайті) спрямований на вчених даних, які хочуть використовувати SMACK stack для побудови платформ обробки даних для великих рішень даних.

Після закінчення тренінгу учасники зможуть:

Впровадження архітектури трубопроводу даних для обробки великих даних. Розробка кластерної інфраструктури з Apache Mesos і Docker. Аналіз даних за допомогою Spark і Scala. Управління неструктурованими даними за допомогою Apache Cassandra.

Формат курсу

Інтерактивні лекції та дискусії. Багато випробувань і практики. Використання в робочому середовищі Live-Lab.

Курсові варіанти адаптації

Щоб отримати персоналізовану підготовку для цього курсу, будь ласка, зв'яжіться з нами, щоб організувати.
21 годин
Apache Spark - аналітичний двигун, розроблений для розповсюдження даних через кластер з метою їх паралельної обробки. Вона містить модулі для стрімування, SQL, машинного навчання та графічного обробки.

Цей інструктор-під керівництвом, прямий тренінг (онлайн або на сайті) спрямований на інженерів, які бажають встановити Apache Spark систему для обробки дуже великих обсягів даних.

Після закінчення тренінгу учасники зможуть:

Завантажити та завантажити Apache Spark. Визначте різницю між Apache Spark і Hadoop MapReduce і коли використовувати який. Швидко читати в і аналізувати дуже великі набори даних. Інтеграція Apache Spark з іншими інструментами машинного навчання.

Формат курсу

Інтерактивні лекції та дискусії. Багато випробувань і практики. Використання в робочому середовищі Live-Lab.

Курсові варіанти адаптації

Щоб отримати персоналізовану підготовку для цього курсу, будь ласка, зв'яжіться з нами, щоб організувати.
21 годин
Apache Spark - розповсюджений процесор для аналізу дуже великих наборів даних. Він може обробляти дані в комплектах і в реальному часі, а також виконувати машинне навчання, рекламні запити та графічну обробку. .NET для Apache Spark є безкоштовним, відкритим кодом, і міжплатформованим сервісом для аналізу великих даних, який підтримує додатки, написані в C# або F#.

Цей інструктор-під керівництвом, прямий тренінг (онлайн або на сайті) спрямований на розробників, які бажають проводити велику аналіз даних, використовуючи Apache Spark у своїх додатках.NET.

Після закінчення тренінгу учасники зможуть:

Завантажити та встановити Apache Spark. Поясніть, як.NET реалізує Spark APIs, щоб вони могли бути доступні з.NET-прикладу. Розробка додатків для обробки даних за допомогою C# або F#, здатних обробляти набори даних, розмір яких вимірюється в терабайтах і педабайтах. Розробка функцій машинного навчання для програми.NET з використанням Apache Spark можливостей. Виконайте дослідницьку аналіз за допомогою SQL запитів на великих наборах даних.

Формат курсу

Інтерактивні лекції та дискусії. Багато випробувань і практики. Використання в робочому середовищі Live-Lab.

Курсові варіанти адаптації

Щоб отримати персоналізовану підготовку для цього курсу, будь ласка, зв'яжіться з нами, щоб організувати.
35 годин
Apache Hadoop - це популярна система обробки даних для обробки великих наборів даних на багатьох комп'ютерах.

Цей інструктор-під керівництвом, прямий тренінг (онлайн або на сайті) спрямований на системних адміністраторів, які хочуть дізнатися, як встановити, розмістити і керувати Hadoop кластерами в межах своєї організації.

Після закінчення тренінгу учасники зможуть:

Завантажити та встановити Apache Hadoop. Визначте чотири основні компоненти Hadoop екосистеми: HDFS, MapReduce, YARN і Hadoop Common. Використовуйте розповсюджену систему файлів (HDFS) для розширення кластера до сотень або тисяч вузлів. • Налаштуйте HDFS, щоб працювати як двигун зберігання для надійних розвантажень Spark. Налаштуйте Spark для доступу до альтернативних рішень зберігання, таких як Amazon S3 і NoSQL систем бази даних, таких як Redis, Elasticsearch, Couchbase, Aerospike, і т.д. Виконання адміністративних завдань, таких як надання, управління, моніторингу та забезпечення кластера Apache Hadoop.

Формат курсу

Інтерактивні лекції та дискусії. Багато випробувань і практики. Використання в робочому середовищі Live-Lab.

Курсові варіанти адаптації

Щоб отримати персоналізовану підготовку для цього курсу, будь ласка, зв'яжіться з нами, щоб організувати.
14 годин
Spark NLP є відкритим кодом бібліотека, побудована на Apache Spark, для природного обробки мови з Python, Java, і Scala. Він широко використовується для підприємницьких і промислових вертикалів, таких як охорона здоров'я, фінанси, науки про життя, і найму.

Цей інструктор-під керівництвом, прямий тренінг (онлайн або на сайті) спрямований на вчених даних і розробників, які бажають використовувати Spark NLP, побудовані на вершині Apache Spark, для розробки, реалізації та масштабування природних мовних текстів обробки моделей і трубопроводів.

Після закінчення тренінгу учасники зможуть:

Складіть необхідне середовище розвитку для початку будівництва НЛП трубопроводів з Spark NLP. Визначте характеристики, архітектуру та переваги використання Spark NLP. Використовуйте заздалегідь підготовлені моделі, доступні в Spark NLP для реалізації текстової обробки. Дізнайтеся, як побудувати, тренувати і розширювати моделі Spark NLP для проектів класу виробництва. Використовуйте класифікацію, інференцію та аналіз почуттів на реальних випадках використання (клінічні дані, уявлення про поведінку клієнта і т.д.)

Формат курсу

Інтерактивні лекції та дискусії. Багато випробувань і практики. Використання в робочому середовищі Live-Lab.

Курсові варіанти адаптації

Щоб отримати персоналізовану підготовку для цього курсу, будь ласка, зв'яжіться з нами, щоб організувати.
35 годин
MLlib - це бібліотека машинного навчання Spark. Його мета полягає в тому, щоб зробити практичне машинне навчання масштабованим і легким. Вона складається з загальних алгоритмів навчання та утиліт, включаючи класифікацію, регресію, кластеризацію, спільну фільтрацію, зменшення розмірності, а також примітиви оптимізації нижнього рівня та API API вищого рівня.

Він поділяється на два пакети:

-

spark.mllib містить оригінальний API, побудований поверх RDD.

-

spark.ml надає API вищого рівня, побудований на базі DataFrames для побудови конвеєрів ML.

Аудиторія

Цей курс спрямований на інженерів і розробників, які прагнуть використовувати вбудовану бібліотеку машин для Apache Spark
21 годин
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
28 годин
Велику кількість реальних проблем можна описати в термінах графів. Наприклад, веб-графік, графік соціальної мережі, мережевий графік поїзду та мовний графік. Ці графіки, як правило, надзвичайно великі; обробка їх вимагає спеціалізованого набору інструментів і процесів - ці інструменти та процеси можна називати Graph Computing (також відомі як Graph Analytics).

У цій інструкції під керівництвом тренерів, учасники дізнаються про технологічні пропозиції та підходи до реалізації для обробки даних графіка. Мета полягає в тому, щоб визначити об'єкти реального світу, їх характеристики та взаємозв'язки, потім моделювати ці відносини та обробляти їх як дані, використовуючи графічний підхід. Почнемо з широкого огляду та обмежених конкретними інструментами, коли ми просуваємо низку конкретних досліджень, практичних вправ і живих розробок.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте, як графічні дані зберігаються та переміщуються
- Виберіть найкращі рамки для заданого завдання (від графічних баз даних до пакетної обробки)
- Запровадьте Hadoop, Spark, GraphX ​​і Pregel, щоб провести графічне обчислення на багатьох машинах паралельно
- Перегляньте великі проблеми, пов'язані з даними в реальному масштабі, з точки зору графіків, процесів та переходів

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика

Last Updated:

Online Apache Spark courses, Weekend Apache Spark courses, Evening Spark training, Spark boot camp, Apache Spark instructor-led, Weekend Spark training, Evening Spark courses, Apache Spark coaching, Apache Spark instructor, Apache Spark trainer, Apache Spark training courses, Spark classes, Spark on-site, Spark private courses, Spark one on one training

Знижки на курс

Наразі знижок на курс немає.

Інформаційний бюлетень "Знижки на курси"

Ми поважаємо конфіденційність Ваших персональних даних. Ми зобов'язуємось не передавати Ваші дані іншим особам. Ви завжди можете змінити свої налаштування конфіденційності або повністю відмовитись від підписки.

Наші клієнти

is growing fast!

We are looking to expand our presence in Ukraine!

As a Business Development Manager you will:

  • expand business in Ukraine
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!

Цей сайт в інших країних / регіонах