курси Apache Spark

курси Apache Spark

Місцеві навчальні курси Apache Spark, які проводять інструктори, демонструють практичну практику, як Spark вписується в екосистему Big Data та як використовувати Spark для аналізу даних. Навчання Apache Spark доступно як "навчальне тренування на місці" або "дистанційне навчання в режимі реального часу". Навчання на місці може здійснюватися локально на приміщеннях клієнта в Україні україна або в корпоративних навчальних центрах NobleProg в Росії україна . Дистанційне навчання в режимі реального часу здійснюється за допомогою інтерактивного, віддаленого робочого столу. NobleProg - Ваш постачальник місцевих навчальних закладів

Testimonials

★★★★★
★★★★★

Apache Spark Subcategories

Apache Spark Course Outlines

CodeNameDurationOverview
sparkdevSpark for Developers21 hoursЦІЛЬ:

Цей курс представить Apache Spark. Студенти дізнаються, як Spark вписується в екосистему Big Data, і як використовувати Spark для аналізу даних. Курс охоплює Spark shell для інтерактивних аналізів даних, Spark внутрішніх, Spark API, Spark SQL, Spark потокове, і машинного навчання і graphX.

АУДИТОРІЯ:

Розробники / Аналітик даних
spmllibApache Spark MLlib35 hoursMLlib - це бібліотека для вивчення машин Spark (ML). Його мета - зробити практичне машинне навчання масштабованим і простим. Він складається з загальних алгоритмів навчання та утиліт, включаючи класифікацію, регресію, кластеризацію, спільну фільтрацію, зменшення розмірності, а також примітивні елементи оптимізації нижчого рівня та інтерфейси API для трубопроводів більш високого рівня.

Він ділиться на два пакети:

-

spark.mllib містить оригінальний API, побудований на вершині RDDs.

-

spark.ml забезпечує високорівневий API, побудований на вершині DataFrames для побудови ML конвеєрів.

Аудиторія

Цей курс спрямований на інженерів та розробників, які прагнуть використати вбудовану бібліотеку машин для Apache Spark
aitechArtificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP21 hoursThis course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
hdpHortonworks Data Platform (HDP) for Administrators21 hoursHortonworks Data Platform - це платформа підтримки для платформи Apache Hadoop з відкритим кодом, яка забезпечує стабільну основу для розробки великих рішень даних у екосистемі Apache Hadoop.

Цей навчальний тренінг, присвячений інструктору, вводить Hortonworks та йде учасникам шляхом розгортання рішення Spark + Hadoop.

До кінця цього тренінгу учасники зможуть:

- Використовуйте Hortonworks, щоб надійно запустити Hadoop у великих масштабах
- Об'єднайте можливості безпеки, управління та операцій Hadoop за допомогою оперативних аналітичних робочих процесів Spark.
- Використовуйте Hortonworks для вивчення, перевірки, сертифікації та підтримки кожного з компонентів проекту Spark
- Процес різні типи даних, в тому числі структурований, неструктурований, в русі та відпочинку.

Аудиторія

- Адміністратори Hadoop

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
magellanMagellan: Geospatial Analytics on Spark14 hoursMagellan - це розподілений двигун для роботи з відкритим кодом для геопросторової аналітики з великими даними. Впроваджено на вершині Apache Spark, він розширює Spark SQL і забезпечує реляційну абстракцію для геопросторової аналітики.

Під керівництвом інструктора, живого тренінгу, вводяться концепції та підходи для реалізації геоазіатської аналітики та учасників прогулянок шляхом створення прогностичного аналізу із застосуванням Magellan на Spark.

До кінця цього тренінгу учасники зможуть:

- Ефективно запитуйте, аналізуйте та об'єднуючи геопросторові набори даних в масштабі
- Реалізувати геопросторові дані в бізнес-аналізі та програмах інтелектуальної аналітики
- Використовуйте просторовий контекст, щоб розширити можливості мобільних пристроїв, датчиків, журналів та носіїв

Аудиторія

- Розробники додатків

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
alluxioAlluxio: Unifying Disparate Storage Systems7 hoursAlluxio - це система віртуальної розподіленої системи зберігання з відкритим кодом, яка об'єднує різноманітні системи зберігання даних та дозволяє програмам взаємодіяти з даними на швидкості пам'яті. Він використовується такими компаніями, як Intel, Baidu та Alibaba.

У цій інструкції під керівництвом живих тренінгів учасники навчаться використовувати Alluxio для монтажу різних обчислювальних систем із системами зберігання даних та ефективного управління даними з декількох петабайтних масштабів, оскільки вони проходять через створення додатка з Alluxio.

До кінця цього тренінгу учасники зможуть:

- Розробіть програму з Alluxio
- Підключіть великі системи та програми даних, зберігаючи при цьому одне простору імен
- Ефективно витягувати значення з великих даних у будь-якому форматі зберігання
- Покращення продуктивності робочого навантаження
- Розгортати та керувати Alluxio автономним або кластеризованим

Аудиторія

- Дані вченого
- Розробник
- Системний адміністратор

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
graphcomputingIntroduction to Graph Computing28 hoursВелику кількість реальних проблем можна описати в термінах графів. Наприклад, веб-графік, графік соціальної мережі, мережевий графік поїзду та мовний графік. Ці графіки, як правило, надзвичайно великі; обробка їх вимагає спеціалізованого набору інструментів і процесів - ці інструменти та процеси можна називати Graph Computing (також відомі як Graph Analytics).

У цій інструкції під керівництвом тренерів, учасники дізнаються про технологічні пропозиції та підходи до реалізації для обробки даних графіка. Мета полягає в тому, щоб визначити об'єкти реального світу, їх характеристики та взаємозв'язки, потім моделювати ці відносини та обробляти їх як дані, використовуючи графічний підхід. Почнемо з широкого огляду та обмежених конкретними інструментами, коли ми просуваємо низку конкретних досліджень, практичних вправ і живих розробок.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте, як графічні дані зберігаються та переміщуються
- Виберіть найкращі рамки для заданого завдання (від графічних баз даних до пакетної обробки)
- Запровадьте Hadoop, Spark, GraphX ​​і Pregel, щоб провести графічне обчислення на багатьох машинах паралельно
- Перегляньте великі проблеми, пов'язані з даними в реальному масштабі, з точки зору графіків, процесів та переходів

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
sparkpythonPython and Spark for Big Data (PySpark)21 hoursPython - це мова програмування високого рівня, відомий своїм зрозумілим синтаксисом та читаемостью коду. Іскра - це двигун обробки даних, який використовується для запиту, аналізу та перетворення великих даних. PySpark дозволяє користувачам інтерфейсу Spark з Python.

У цій навчальному посібнику, учасники навчаться, як використовувати Python та Spark разом для аналізу великих даних, коли вони працюють на практичних вправ.

До кінця цього тренінгу учасники зможуть:

- Дізнайтеся, як використовувати Spark з Python для аналізу Big Data
- Працюйте над вправ, що імітують реальні обставини
- Використовуйте різні інструменти та методи для великого аналізу даних за допомогою PySpark

Аудиторія

- Розробники
- ІТ-фахівці
- Дані вчених

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
sparksqlApache Spark SQL7 hoursSpark SQL - модуль Apache Spark для роботи з структурованими та неструктурованими даними. Spark SQL забезпечує інформацію про структуру даних, а також про виконання обчислень. Ця інформація може бути використана для виконання оптимізації. Два поширені способи використання Spark SQL:
- виконувати SQL запити.
- читати дані з існуючої установки вулика.

У цій інструкції під керівництвом, живе навчання (на місці або віддаленому), учасники навчаться аналізувати різні типи наборів даних, використовуючи Spark SQL.

До кінця цього тренінгу учасники зможуть:

- Встановити та налаштувати Spark SQL.
- Виконайте аналіз даних, використовуючи Spark SQL.
- Набори даних запитів у різних форматах.
- Візуалізувати дані та результати запитів.

Аудиторія

- Аналітик даних
- Дані вчених
- Інженери-дані

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика

Примітки

- Щоб просити індивідуальне навчання для цього курсу, зв'яжіться з нами, щоб організувати.
introtostreamprocessingA Practical Introduction to Stream Processing21 hoursПоточна обробка - це обробка даних "в русі" у реальному часі, тобто виконує обчислення в даних, що приймаються. Такі дані читаються як безперервні потоки з джерел даних, таких як події для датчиків, активність користувачів веб-сайтів, фінансові операції, промивання кредитними картками, потоки кліків і т. Д. Рамки обробки потоку здатні читати великі обсяги вхідних даних і практично миттєво представляти цінні знання.

У цій інструкції під керівництвом, живу навчальному закладу (на місці або віддаленому), учасники вивчать, як налаштувати та інтегрувати різні рамки потоку обробки з існуючими великими системами зберігання даних та відповідними програмними додатками та мікрослужбами.

До кінця цього тренінгу учасники зможуть:

- Встановіть та налаштуйте різні схеми обробки потоку, такі як Spark Streaming та Streaming Kafka
- Зрозумійте та оберіть найбільш відповідні рамки для роботи
- Процес даних безперервно, одночасно, і в рекордному порядку
- Інтеграція рішень обробки потоку з існуючими базами даних, сховищами даних, озерами даних тощо.
- Інтеграція найбільш підходящої потокової бібліотеки обробки з корпоративними додатками та мікросервісами

Аудиторія

- Розробники
- Архітектори програмного забезпечення

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика

Примітки

- Щоб просити індивідуальне навчання для цього курсу, зв'яжіться з нами, щоб організувати.
bigdataanahealthBig Data Analytics in Health21 hoursВелика аналітика даних включає в себе процес вивчення великої кількості різноманітних наборів даних, з метою виявлення кореляцій, прихованих візерунків та інших корисних відомостей.

Індустрія охорони здоров'я має величезну кількість складних різнорідних медичних та клінічних даних. Застосування великих аналітичних даних щодо даних про стан здоров'я надає величезний потенціал для отримання статистичних даних для покращення надання медичних послуг. Однак величезна кількість цих наборів дає великі проблеми при аналізі та практичному застосуванні до клінічного середовища.

У цьому навчанні під керівництвом інструктора, живе тренування (віддалене), учасники навчаться виконувати великі аналізи даних у сфері здоров'я, коли вони проходять через низку практичних навчань у прямому ефірі.

До кінця цього тренінгу учасники зможуть:

- Встановіть і настройте великі інструменти аналізу даних, такі як Hadoop MapReduce та Spark
- Зрозумійте характеристики медичних даних
- Застосовуйте великі методи передачі медичних даних
- Вивчення великих систем даних та алгоритмів у контексті охорони здоров'я

Аудиторія

- Розробники
- Дані вчених

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика.

Примітка

- Щоб просити індивідуальне навчання для цього курсу, зв'яжіться з нами, щоб організувати.
sparkcloudApache Spark in the Cloud21 hoursApache Spark's learning curve is slowly increasing at the begining, it needs a lot of effort to get the first return. This course aims to jump through the first tough part. After taking this course the participants will understand the basics of Apache Spark , they will clearly differentiate RDD from DataFrame, they will learn Python and Scala API, they will understand executors and tasks, etc. Also following the best practices, this course strongly focuses on cloud deployment, Databricks and AWS. The students will also understand the differences between AWS EMR and AWS Glue, one of the lastest Spark service of AWS.

AUDIENCE:

Data Engineer, DevOps, Data Scientist

Upcoming Apache Spark Courses

CourseCourse DateCourse Price [Remote / Classroom]
Introduction to Graph Computing - Kiev, Holosiyvskiy Park Mon, 2019-02-04 09:306000EUR / 7000EUR
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP - Kiev, Holosiyvskiy Park Mon, 2019-02-11 09:305250EUR / 6050EUR
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP - Kiev, Holosiyvskiy Park Wed, 2019-04-03 09:305250EUR / 6050EUR
Introduction to Graph Computing - Kiev, Holosiyvskiy Park Tue, 2019-04-09 09:306000EUR / 7000EUR
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP - Kiev, Holosiyvskiy Park Mon, 2019-05-27 09:305250EUR / 6050EUR
Weekend Apache Spark courses, Evening Apache Spark training, Apache Spark boot camp, Apache Spark instructor-led, Weekend Apache Spark training, Evening Apache Spark courses, Apache Spark coaching, Apache Spark instructor, Apache Spark trainer, Apache Spark training courses, Apache Spark classes, Apache Spark on-site, Apache Spark private courses, Apache Spark one on one training

Course Discounts

CourseVenueCourse DateCourse Price [Remote / Classroom]
Activiti for Business Process DesignersKiev, Holosiyvskiy Park Wed, 2018-12-12 09:304725EUR / 5525EUR
Business Process Modeling using BPMN and UMLKiev, Holosiyvskiy Park Tue, 2019-04-02 09:303150EUR / 3750EUR
Elasticsearch Advanced Administration, Monitoring and MaintenanceKiev, Holosiyvskiy Park Tue, 2019-04-02 09:303150EUR / 3750EUR
Introduction to Embedded ComputersKiev, Holosiyvskiy Park Wed, 2019-06-05 09:303150EUR / 3750EUR
Advanced Go ProgrammingKiev, Holosiyvskiy Park Mon, 2019-06-10 09:304725EUR / 5525EUR

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Some of our clients

is growing fast!

We are looking to expand our presence in Ukraine!

As a Business Development Manager you will:

  • expand business in Ukraine
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!