курси Big Data

курси Big Data

Місцеві, під керівництвом інструктора живуть великі курси навчання даних починаються з введення в елементарний концепції великих даних, а потім прогресу в мовах програмування і методологій, які використовуються для виконання аналізу даних. Засоби та інфраструктура для ввімкнення великих сховищ даних, розподілених переробки та масштабованості обговорюються, порівнюються і впроваджені в демонстраційних сесій.

Велика підготовка даних доступна як "на місці навчання" або "дистанційне навчання жити". На місці навчання в прямому ефірі може здійснюватися на місцевому рівні в україна або в Неbleprog корпоративні навчальні центри в україна. Дистанційне навчання в прямому ефірі здійснюється шляхом інтерактивного, віддаленого робочого стола.

Nobleпрога-ваш місцевий навчальний провайдер

Testimonials

★★★★★
★★★★★

Big Data Course Outlines

Title
Duration
Overview
Title
Duration
Overview
14 hours
Overview
Мета:

Навчитися працювати з SPSS на рівні незалежності

Адресати:

Аналітики, дослідники, вчені, студенти та всі ті, хто бажає придбати можливість використовувати пакет SPSS та вивчити популярні технології видобування даних.
28 hours
Overview
Моделювання сховища даних - це техніка моделювання баз даних, яка забезпечує багаторічне історичне зберігання даних, що походять з декількох джерел. Сховища даних зберігає одну версію фактів або "всі дані, весь час". Його гнучкий, масштабований, послідовний та адаптивний дизайн охоплює найкращі аспекти 3-ї нормальної форми (3NF) та схеми зірок.

У цій інструкції під керівництвом тренерів, учасники навчаться створювати Data Vault.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте архітектуру та концепції дизайну, що належать до Data Vault 2.0, та її взаємодію з Big Data, NoSQL та AI.
- Використовуйте методи збереження даних, щоб уможливити аудит, відстеження та перевірку історичних даних у сховищі даних
- Розробити послідовний та повторюваний процес ETL (витяг, перетворення, завантаження)
- Створення та розгортання високо масштабованих і повторюваних складів

Аудиторія

- Моделювачі даних
- Спеціаліст зі складування даних
- Спеціалісти з бізнес-аналітики
- Інженери-дані
- Адміністратори баз даних

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Python - це мова програмування високого рівня, відомий своїм зрозумілим синтаксисом та читаемостью коду. Іскра - це двигун обробки даних, який використовується для запиту, аналізу та перетворення великих даних. PySpark дозволяє користувачам інтерфейсу Spark з Python.

У цій навчальному посібнику, учасники навчаться, як використовувати Python та Spark разом для аналізу великих даних, коли вони працюють на практичних вправ.

До кінця цього тренінгу учасники зможуть:

- Дізнайтеся, як використовувати Spark з Python для аналізу Big Data
- Працюйте над вправ, що імітують реальні обставини
- Використовуйте різні інструменти та методи для великого аналізу даних за допомогою PySpark

Аудиторія

- Розробники
- ІТ-фахівці
- Дані вчених

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
35 hours
Overview
Прогрес у технологіях та збільшення обсягу інформації перетворюють те, як здійснюється правозастосування. Виклики, які представляють великі дані, майже такі ж складні, як обіцянка Big Data. Ефективне зберігання даних - одне з цих завдань; ефективно аналізуючи це інше.

У цій навчальному посібнику учасники вивчатимуть таку думку, з якою можна буде звертатися до технологій Big Data, оцінити їх вплив на існуючі процеси та політику та впроваджувати ці технології з метою виявлення злочинної діяльності та запобігання злочинності. Будуть вивчені практичні приклади з боку правоохоронних органів у всьому світі, щоб отримати уявлення про підходи, проблеми та результати їх впровадження.

До кінця цього тренінгу учасники зможуть:

- Об'єднайте технологію "Великі дані" із традиційними процесами збору даних, щоб об'єднати історію під час розслідування
- Реалізуйте великі рішення для зберігання та обробки даних для аналізу даних
- Підготуйте пропозицію щодо прийняття найбільш адекватних інструментів та процесів для забезпечення підходу до кримінального розслідування, керованого даними

Аудиторія

- Правоохоронці фахівці з технічної підготовки

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
14 hours
Overview
Для задоволення відповідності регуляторів, CSPs (постачальники послуг зв'язку) можуть підключитися до Big
Аналіз даних, який не тільки допомагає їм відповідати вимогам, але й у межах того самого
вони можуть збільшити рівень задоволеності клієнтів і, таким чином, зменшити обмін. Насправді з тих пір
відповідність пов'язана з якістю послуг, прив'язаною до контракту, будь-якої ініціативи щодо виконання вимог
відповідність, поліпшить "конкурентну перевагу" ССП. Тому важливо це
Регулятори повинні мати можливість консультувати / керувати комплектом аналітичної практики великих даних для ССП, яка буде
бути взаємовигідним між регуляторами та ЦСП.

2 курсу дня: 8 модулів, по 2 години кожний = 16 годин
28 hours
Overview
Велику кількість реальних проблем можна описати в термінах графів. Наприклад, веб-графік, графік соціальної мережі, мережевий графік поїзду та мовний графік. Ці графіки, як правило, надзвичайно великі; обробка їх вимагає спеціалізованого набору інструментів і процесів - ці інструменти та процеси можна називати Graph Computing (також відомі як Graph Analytics).

У цій інструкції під керівництвом тренерів, учасники дізнаються про технологічні пропозиції та підходи до реалізації для обробки даних графіка. Мета полягає в тому, щоб визначити об'єкти реального світу, їх характеристики та взаємозв'язки, потім моделювати ці відносини та обробляти їх як дані, використовуючи графічний підхід. Почнемо з широкого огляду та обмежених конкретними інструментами, коли ми просуваємо низку конкретних досліджень, практичних вправ і живих розробок.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте, як графічні дані зберігаються та переміщуються
- Виберіть найкращі рамки для заданого завдання (від графічних баз даних до пакетної обробки)
- Запровадьте Hadoop, Spark, GraphX ​​і Pregel, щоб провести графічне обчислення на багатьох машинах паралельно
- Перегляньте великі проблеми, пов'язані з даними в реальному масштабі, з точки зору графіків, процесів та переходів

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Інтелектуальна аналітика - це процес аналізу даних для прогнозування майбутнього. Цей процес використовує дані разом з обробкою даних, статистикою та методами машинного навчання для створення прогнозної моделі для прогнозування майбутніх подій.

У цій навчальній інструкції, учасники навчаться навчатися, як використовувати Matlab для побудови інтелектуальних моделей та застосувати їх до великих вибіркових наборів даних для прогнозування майбутніх подій на основі даних.

До кінця цього тренінгу учасники зможуть:

- Створіть інтелектуальні моделі для аналізу шаблонів історичних та транзакційних даних
- Використовуйте інтелектуальне моделювання для визначення ризиків та можливостей
- Побудуйте математичні моделі, які фіксують важливі тенденції
- Використовуйте дані з пристроїв та бізнес-систем, щоб зменшити витрати, заощадити час або скоротити витрати

Аудиторія

- Розробники
- Інженери
- Експерти домену

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
7 hours
Overview
Apache NiFi (Hortonworks DataFlow) є в режимі реального часу інтегрована логістика даних і проста платформа обробки подій, яка дозволяє рухатися, відстеження та автоматизації даних між системами. Вона написана з використанням потоку на основі програмування і надає веб-інтерфейс користувача для управління datafflow в режимі реального часу.

в цьому інструктор під керівництвом, жити навчання, учасники будуть вивчати основи потоку на основі програмування, як вони розробляють ряд демо-розширень, компонентів і процесорів з використанням Apache NiFi.

до кінця тренінгу учасники зможуть:

- розуміти nifi & #39; з архітектурою і потік даних концепцій.
- розробка розширень, що використовують NiFi та сторонні інтерфейси.
- звичай розвивати свої власні процесори Apache Nifi.
- ковтати і обробляти дані в реальному часі з різних і незвичайних форматів файлів і джерел даних.

Формат курсу

- Інтерактивна лекція та дискусія.
- багато вправ і практики.
- практичної реалізації в живій лабораторній обстановці.

курс параметри налаштування

- щоб запросити індивідуальну підготовку за цей курс, будь ласка, зв'яжіться з нами, щоб організувати.
21 hours
Overview
Apache NiFi (Hortonworks DataFlow) - це інтегрована логістика даних в реальному часі та проста платформа обробки подій, яка дозволяє переміщати, відстежувати та автоматизувати дані між системами. Він написаний з використанням потокового програмування та забезпечує веб-інтерфейс користувача для керування потоками даних у режимі реального часу.

У цій інструкції під керівництвом живих тренінгів учасники навчаться, як розпочати та керувати Apache NiFi в живій лабораторії.

До кінця цього тренінгу учасники зможуть:

- Встановити та налаштувати Apachi NiFi
- Джерело, перетворення та управління даними з різнорідних, розподілених джерел даних, включаючи бази даних та великі озера даних
- Автоматизація потоків даних
- Увімкнути потокову аналітику
- Застосовуйте різні підходи для прийому даних
- Трансформуйте великі дані та ділову статистику

Аудиторія

- Системні адміністратори
- Інженери-дані
- Розробники
- DevOps

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
14 hours
Overview
Apache SolrCloud - це розподілений двигун обробки даних, який полегшує пошук та індексування файлів у розподіленій мережі.

У цій інструкції під керівництвом тренерів, учасники навчаться створювати екземпляр SolrCloud на Amazon AWS.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте особливості SolCloud і як вони співвідносяться з такими, що належать до звичайних шаблонів-підлеглих
- Настроювання централізованого кластера SolCloud
- Автоматизація таких процесів, як спілкування з відсіками, додавання документів до відсіків тощо.
- Використовуйте Zookeeper спільно з SolrCloud для подальшої автоматизації процесів
- Використовуйте інтерфейс для керування звітами про помилки
- Завантаження балансу встановлення SolrCloud
- Налаштуйте SolrCloud для безперервної обробки та відмови

Аудиторія

- Solr Developers
- Менеджери проектів
- Системні адміністратори
- Пошук аналітиків

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
14 hours
Overview
Datameer - це платформа бізнес-аналітики та аналітики, побудована на Hadoop. Це дозволяє кінцевим користувачам легко знаходити, вивчати та корелювати великомасштабні, структуровані, напівструктуровані та неструктуровані дані у зручному для використання спосіб.

У цій інструкції під керівництвом живих тренінгів учасники навчаться використовувати Datameer для подолання крутих навчальних кривої Hadoop, коли вони проходять процедуру встановлення та аналізу ряду великих джерел даних.

До кінця цього тренінгу учасники зможуть:

- Створюйте, перевіряйте та інтерактивно вивчайте озеро даних підприємства
- Доступ до сховищ даних бізнес-аналітики, транзакційних баз даних та інших аналітичних магазинів
- Використовуйте користувальницький інтерфейс електронних таблиць, щоб створювати конвеєрні обробки даних від кінцевого до кінця
- Доступ до попередньо побудованих функцій для вивчення складних зв'язків даних
- Використовуйте майстри перетягування для візуалізації даних та створення інформаційних панелей
- Використовуйте таблиці, діаграми, графіки та карти, щоб аналізувати результати запитів

Аудиторія

- Аналітик даних

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
28 hours
Overview
MemSQL - це система управління базами даних у пам'яті, що зберігається в пам'яті, для хмарних і локальних. Це сховище даних у режимі реального часу, яке відразу дає змогу переглядати дані про живі та історичні дані.

У цьому навчанні під керівництвом інструктора, учасники вивчатимуть основні цілі MemSQL для розробки та адміністрування.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте основні поняття та характеристики MemSQL
- Встановити, конструювати, підтримувати та використовувати MemSQL
- Оптимізувати схеми в MemSQL
- Поліпшення запитів у MemSQL
- Тестовий показник у MemSQL
- Створюйте додатки даних у реальному часі за допомогою MemSQL

Аудиторія

- Розробники
- Адміністратори
- Операція інженерів

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
14 hours
Overview
Tigon - це платформа обробки потоків з відкритим вихідним кодом, в режимі реального часу, з низькою затримкою, високою пропускною спроможністю, натуральною оптоволоконною лінією, що стоїть на вершині HDFS та HBase за наполегливість. Прикладні програми Tigon використовують такі випадки, як виявлення та аналіз вторгнення в мережу, аналіз ринку соціальних мереж, аналітика місць розташування та рекомендації користувачам у реальному часі.

Під керівництвом інструктора, живого тренінгу, вводять підхід Тигона до поєднання режиму реального часу та пакетної обробки, оскільки він ходить учасників шляхом створення прикладу програми.

До кінця цього тренінгу учасники зможуть:

- Створюйте потужні поточні програми для обробки великих обсягів даних
- Опрацюйте джерела потоку, такі як Twitter і веб-серверів
- Використовуйте Tigon для швидкого приєднання, фільтрації та об'єднання потоків

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
14 hours
Overview
Apache Ignite є в пам'яті обчислювальної платформи, яка сидить між додатком і даними шару для підвищення швидкості, масштабу та доступності 。

в цьому інструктор під керівництвом, жити навчання, учасники дізнаються принципи наполегливої і чистої пам'яті в пам'ять, як вони крок через створення зразка в пам'яті обчислювальним проектом.

до кінця тренінгу учасники зможуть:

- використання Ignite для in-пам'яті, на диску наполегливість, а також чисто розподілені в пам'яті бази даних.
- досягнення збереження без синхронізації даних назад до реляційної бази даних.
- використовувати Ignite виконувати SQL і розподілених з'єднань.
- підвищення продуктивності шляхом переміщення даних ближче до процесора, використовуючи оперативну пам'ять як сховище.
- розповсюдження даних через кластер для досягнення горизонтальної масштабованості.
- інтеграція Ignite з СУБД, NoSQL, Hhaoop і машинного навчання процесорів.

Формат курсу

- Інтерактивна лекція та дискусія.
- багато вправ і практики.
- практичної реалізації в живій лабораторній обстановці.

курс параметри налаштування

- щоб запросити індивідуальну підготовку за цей курс, будь ласка, зв'яжіться з нами, щоб організувати.
14 hours
Overview
Vespa - це велика обробка та обслуговування двигунів з відкритим кодом, створено компанією Yahoo. Він використовується для відповіді на запити користувачів, надання рекомендацій та надання персонального вмісту та реклами в реальному часі.

Цей навчальний курс, навчальний тренінг для вчителів, представляє проблеми, пов'язані з наданням великомасштабних даних і проходженням учасників шляхом створення програми, яка може обчислювати відповіді на запити користувачів, над великими наборами даних в режимі реального часу.

До кінця цього тренінгу учасники зможуть:

- Використовуйте Vespa для швидкого обчислення даних (зберігання, пошуку, ранжування, упорядкування) при обслуговуванні під час очікування користувача
- Впроваджуйте Vespa в існуючі програми, що включають пошук функцій, рекомендації та персоналізацію
- Інтеграція та розгортання Vespa з існуючими великими системами даних, такими як Hadoop і Storm.

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Apache Apex - це нативна платформа YARN, яка об'єднує потік та пакетну обробку. Він обробляє великі дані в русі таким чином, що це масштабоване, функціональне, відмовостійке, стабільне, безпечне, розподілене і легко працююче.

Навчальний тренінг, присвячений інструктору, представляє уніфіковану архітектуру обробки потоків Apache Apex і проходить учасників шляхом створення розподіленої програми, що використовує Apex на Hadoop.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте поняття трубопровідної обробки даних, такі як з'єднувачі для джерел і раковин, загальні перетворення даних тощо.
- Створення, масштабування та оптимізація програми Apex
- Процес обробки даних у реальному часі надійно та з мінімальною затримкою
- Використовуйте Apex Core і бібліотеку Apex Malhar для швидкого розробки додатків
- Використовуйте Apex API для написання та повторного використання існуючого коду Java
- Інтеграція Apex в інші програми як процесор
- Налаштування, тестування та масштабування додатків Apex

Аудиторія

- Розробники
- Архітектори підприємств

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
7 hours
Overview
Alluxio - це система віртуальної розподіленої системи зберігання з відкритим кодом, яка об'єднує різноманітні системи зберігання даних та дозволяє програмам взаємодіяти з даними на швидкості пам'яті. Він використовується такими компаніями, як Intel, Baidu та Alibaba.

У цій інструкції під керівництвом живих тренінгів учасники навчаться використовувати Alluxio для монтажу різних обчислювальних систем із системами зберігання даних та ефективного управління даними з декількох петабайтних масштабів, оскільки вони проходять через створення додатка з Alluxio.

До кінця цього тренінгу учасники зможуть:

- Розробіть програму з Alluxio
- Підключіть великі системи та програми даних, зберігаючи при цьому одне простору імен
- Ефективно витягувати значення з великих даних у будь-якому форматі зберігання
- Покращення продуктивності робочого навантаження
- Розгортати та керувати Alluxio автономним або кластеризованим

Аудиторія

- Дані вченого
- Розробник
- Системний адміністратор

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
28 hours
Overview
Apache Flink є відкритим вихідним кодом рамки для масштабованих потоку і пакетної обробки даних.

цей інструктор під керівництвом, жива підготовка вводить принципи та підходи за розподіленим потоком і пакетної обробки даних, і ходить учасників через створення в режимі реального часу, передачі даних програми в Apache Flink.

до кінця тренінгу учасники зможуть:

- створити середовище для розробки програм аналізу даних.
- пакет, виконання та моніторинг Flink основі, відмовостійких, потокових даних додатків.
- управління різноманітними навантаження.
- виконувати передові аналітики з використанням Flink мл.
- створити багатовузловий кластер Flink.
- вимірювання та оптимізувати продуктивність.
- інтеграція з різними великими системами даних.
- порівняти Flink можливості з тими, інші великі рамки обробки даних.

Формат курсу

- частина лекції, частина обговорення, вправи і важка практичний практика
14 hours
Overview
Apache Samza - це нестандартна, асинхронна обчислювальна платформа з відкритим кодом для обробки потоку. Він використовує Apache Kafka для обміну повідомленнями та Apache Hadoop YARN для відмовостійкості, ізоляції процесорів, безпеки та управління ресурсами.

Цей навчальний курс, навчальний курс навчання, означає принципи створення систем обміну повідомленнями та розподіленої обробки потоку, а учасники ходитимуть шляхом створення зразка проекту Samza і виконання роботи.

До кінця цього тренінгу учасники зможуть:

- Використовуйте Samza, щоб спростити код, необхідний для отримання та отримання повідомлень.
- Відокремити обробку повідомлень від програми.
- Використовуйте Samza для реалізації асинхронних обчислень в режимі реального часу.
- Використовуйте обробку потоку, щоб забезпечити більш високий рівень абстракції над системами обміну повідомленнями.

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
14 hours
Overview
Apache Zeppelin - це веб-ноутбук для захоплення, вивчення, візуалізації та обміну даними Hadoop та Spark.

Навчальний тренінг, який проводиться інструктором, представляє концепції інтерактивних аналітичних даних та допомагає учасникам розгортати та використовувати Zeppelin в однокористувальному або багатокористувацькому середовищі.

До кінця цього тренінгу учасники зможуть:

- Встановіть і налаштуйте Zeppelin
- Розробка, організація, виконання та обмін даними в інтерфейсі на основі браузера
- Візуалізуйте результати, не звертаючись до командного рядка або деталей кластеру
- Виконайте та співпрацюйте над тривалими робочими процесами
- Працюйте з будь-яким числом плагінів мови / обробки даних-бекендалів, таких як Scala (з Apache Spark), Python (з Spark Spyware), Spark SQL, JDBC, Markdown і Shell.
- Інтеграція Zeppelin з іскоркою, Flink та картою зменшення
- Захистіть кілька примірників Zeppelin з Apache Shiro

Аудиторія

- Інженери-дані
- Аналітик даних
- Дані вчених
- Розробники програмного забезпечення

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
14 hours
Overview
Magellan - це розподілений двигун для роботи з відкритим кодом для геопросторової аналітики з великими даними. Впроваджено на вершині Apache Spark, він розширює Spark SQL і забезпечує реляційну абстракцію для геопросторової аналітики.

Під керівництвом інструктора, живого тренінгу, вводяться концепції та підходи для реалізації геоазіатської аналітики та учасників прогулянок шляхом створення прогностичного аналізу із застосуванням Magellan на Spark.

До кінця цього тренінгу учасники зможуть:

- Ефективно запитуйте, аналізуйте та об'єднуючи геопросторові набори даних в масштабі
- Реалізувати геопросторові дані в бізнес-аналізі та програмах інтелектуальної аналітики
- Використовуйте просторовий контекст, щоб розширити можливості мобільних пристроїв, датчиків, журналів та носіїв

Аудиторія

- Розробники додатків

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
28 hours
Overview
Hadoop - це популярна система обробки великих даних. Python - це мова програмування високого рівня, відомий своїм зрозумілим синтаксисом та читаемостью коду.

У цій інструкції під керівництвом живих тренінгів учасники навчаться працювати з Hadoop, MapReduce, Pig і Spark за допомогою Python, коли вони пройдуть кілька прикладів і використовують випадки.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте основні концепції Hadoop, MapReduce, Pig і Spark
- Використовуйте Python з розподіленою файловою системою Hadoop (HDFS), MapReduce, Pig і Spark
- Використовуйте Snakebite для програмного доступу до HDFS у Python
- Використовуйте mrjob, щоб написати завдання MapReduce у Python
- Напишіть програми Spark за допомогою Python
- Розширюйте функціональність свині за допомогою Python UDF
- Керуйте роботами MapReduce та скриптами Pig, використовуючи Luigi

Аудиторія

- Розробники
- ІТ-фахівці

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
28 hours
Overview
MonetDB - це база даних з відкритим кодом, яка стала піонером технологічного підходу "колона-магазин".

У цьому навчанні під керівництвом інструктора, учасники навчаться навчатися, як використовувати MonetDB і як отримати максимальну користь від неї.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте MonetDB та його функції
- Встановіть і запустіть MonetDB
- Досліджуйте та виконуйте різні функції та завдання в MonetDB
- Прискорення доставки свого проекту шляхом максимального використання можливостей MonetDB

Аудиторія

- Розробники
- Технічні експерти

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Інтеграція даних Pentaho - це інструмент інтеграції з відкритим кодом для визначення робочих місць та перетворень даних.

У цій інструкції під керівництвом живих тренінгів учасники навчаться користуватися потужними можливостями ETL для Pentaho Data Integration і багатим графічним інтерфейсом для керування цілим великим життєвим циклом даних, що дозволить максимально збільшити вартість даних організації.

До кінця цього тренінгу учасники зможуть:

- Створіть, перегляньте та запустіть основні перетворення даних, що містять кроки та хміль
- Налаштуйте та захистіть репозиторій Pentaho Enterprise
- Використовуйте різноманітні джерела даних та створюйте єдину, уніфіковану версію істини у форматі, готовому аналізі.
- Надайте результати для третіх частин додатків для подальшої обробки

Аудиторія

- Аналітик даних
- Розробники ETL

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 hours
Overview
Поточна обробка - це обробка даних "в русі" у реальному часі, тобто виконує обчислення в даних, що приймаються. Такі дані читаються як безперервні потоки з джерел даних, таких як події для датчиків, активність користувачів веб-сайтів, фінансові операції, промивання кредитними картками, потоки кліків і т. Д. Рамки обробки потоку здатні читати великі обсяги вхідних даних і практично миттєво представляти цінні знання.

У цій інструкції під керівництвом, живу навчальному закладу (на місці або віддаленому), учасники вивчать, як налаштувати та інтегрувати різні рамки потоку обробки з існуючими великими системами зберігання даних та відповідними програмними додатками та мікрослужбами.

До кінця цього тренінгу учасники зможуть:

- Встановіть та налаштуйте різні схеми обробки потоку, такі як Spark Streaming та Streaming Kafka
- Зрозумійте та оберіть найбільш відповідні рамки для роботи
- Процес даних безперервно, одночасно, і в рекордному порядку
- Інтеграція рішень обробки потоку з існуючими базами даних, сховищами даних, озерами даних тощо.
- Інтеграція найбільш підходящої потокової бібліотеки обробки з корпоративними додатками та мікросервісами

Аудиторія

- Розробники
- Архітектори програмного забезпечення

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика

Примітки

- Щоб просити індивідуальне навчання для цього курсу, зв'яжіться з нами, щоб організувати.
14 hours
Overview
цей інструктор під керівництвом, жити навчання (на місці або віддалених) спрямована на дані аналітиків і даних вчених, які бажають реалізувати більш просунуті методи аналізу даних для видобутку даних за допомогою Python.

до кінця тренінгу учасники зможуть:

- розуміють важливі області Data Mining, в тому числі об'єднання правил видобутку, аналіз тексту настроїв, автоматичне узагальнення тексту, і дані аномалії виявлення.
- порівняти і реалізувати різні стратегії для вирішення реальних проблем видобутку даних.
- зрозуміти і інтерпретувати результати.

Формат курсу

- Інтерактивна лекція та дискусія.
- багато вправ і практики.
- практичної реалізації в живій лабораторній обстановці.

курс параметри налаштування

- щоб запросити індивідуальну підготовку за цей курс, будь ласка, зв'яжіться з нами, щоб організувати.
21 hours
Overview
Apache Spark's learning curve is slowly increasing at the begining, it needs a lot of effort to get the first return. This course aims to jump through the first tough part. After taking this course the participants will understand the basics of Apache Spark , they will clearly differentiate RDD from DataFrame, they will learn Python and Scala API, they will understand executors and tasks, etc. Also following the best practices, this course strongly focuses on cloud deployment, Databricks and AWS. The students will also understand the differences between AWS EMR and AWS Glue, one of the lastest Spark service of AWS.

AUDIENCE:

Data Engineer, DevOps, Data Scientist
21 hours
Overview
Платформа Analytics KNIME є провідним варіантом відкритих джерел для інновацій, керованих даними, що допомагає вам виявити потенційне приховане у ваших даних, моє для свіжого розуміння або прогнозування нових ф'ючерсів. З понад 1000 модулями, сотнями готових до роботи прикладів, повного спектру інтегрованих інструментів та найширшого вибору передових алгоритмів, платформа KNUM Analytics - це ідеальний набір інструментів для будь-якого вченого та аналітика даних.

Цей курс для платформи Analytics KNIME є ідеальною можливістю для початківців, досвідчених користувачів та експертів KNIME, які будуть представлені в KNIME, щоб дізнатись, як ефективніше використовувати його та як створювати чіткі, всеосяжні звіти на основі робочих процесів KNIME
21 hours
Overview
Велика аналітика даних включає в себе процес вивчення великої кількості різноманітних наборів даних, з метою виявлення кореляцій, прихованих візерунків та інших корисних відомостей.

Індустрія охорони здоров'я має величезну кількість складних різнорідних медичних та клінічних даних. Застосування великих аналітичних даних щодо даних про стан здоров'я надає величезний потенціал для отримання статистичних даних для покращення надання медичних послуг. Однак величезна кількість цих наборів дає великі проблеми при аналізі та практичному застосуванні до клінічного середовища.

У цьому навчанні під керівництвом інструктора, живе тренування (віддалене), учасники навчаться виконувати великі аналізи даних у сфері здоров'я, коли вони проходять через низку практичних навчань у прямому ефірі.

До кінця цього тренінгу учасники зможуть:

- Встановіть і настройте великі інструменти аналізу даних, такі як Hadoop MapReduce та Spark
- Зрозумійте характеристики медичних даних
- Застосовуйте великі методи передачі медичних даних
- Вивчення великих систем даних та алгоритмів у контексті охорони здоров'я

Аудиторія

- Розробники
- Дані вчених

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика.

Примітка

- Щоб просити індивідуальне навчання для цього курсу, зв'яжіться з нами, щоб організувати.
14 hours
Overview
Apache Arrow - це структура обробки даних з пам'яттю з відкритим кодом. Він часто використовується разом з іншими інструментами обробки даних для доступу до розрізнених сховищ даних для аналізу. Він добре інтегрується з іншими технологіями, такими як бази даних GPU, бібліотеки та інструменти для машинного навчання, двигуни виконання та візуалізація даних.

У цій навчальній інструкції на місці, навчаючись, учасники навчаться інтегрувати Apache Arrow з різними системами Data Science для доступу до даних з різнорідних джерел даних.

До кінця цього тренінгу учасники зможуть:

- Встановіть та налаштуйте Apache Arrow у розподіленому кластері
- Використовуйте Apache Arrow для доступу до даних з різних джерел даних
- Використовуйте Apache Arrow, щоб уникнути необхідності конструювати та підтримувати складні трубопроводи ETL
- Аналізуйте дані в різних джерелах даних, не консолідуючи їх в централізований сховище

Аудиторія

- Дані вчених
- Інженери-дані

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика

Примітка

- Щоб просити індивідуальне навчання для цього курсу, зв'яжіться з нами, щоб організувати.

Upcoming Big Data Courses

Weekend Big Data courses, Evening Big Data training, Big Data boot camp, Big Data instructor-led, Weekend Big Data training, Evening Big Data courses, Big Data coaching, Big Data instructor, Big Data trainer, Big Data training courses, Big Data classes, Big Data on-site, Big Data private courses, Big Data one on one training

Course Discounts

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Some of our clients

is growing fast!

We are looking to expand our presence in Ukraine!

As a Business Development Manager you will:

  • expand business in Ukraine
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!