курси Big Data

курси Big Data

Місцеві, під керівництвом інструктора живуть великі курси навчання даних починаються з введення в елементарний концепції великих даних, а потім прогресу в мовах програмування і методологій, які використовуються для виконання аналізу даних. Засоби та інфраструктура для ввімкнення великих сховищ даних, розподілених переробки та масштабованості обговорюються, порівнюються і впроваджені в демонстраційних сесій.

Велика підготовка даних доступна як "на місці навчання" або "дистанційне навчання жити". На місці навчання в прямому ефірі може здійснюватися на місцевому рівні в україні або в Неbleprog корпоративні навчальні центри в україні. Дистанційне навчання в прямому ефірі здійснюється шляхом інтерактивного, віддаленого робочого стола.

Nobleпрога-ваш місцевий навчальний провайдер

Machine Translated

Відгуки

★★★★★
★★★★★

Big Data Зміст курсу

Назва курсу
Тривалість
Огляд
Назва курсу
Тривалість
Огляд
21 годин
Огляд
Apache Accumulo - це відсортований, розподілений ключ / значення, який забезпечує надійне, масштабоване зберігання та пошук даних. Він заснований на дизайні BigTable Go ogle і працює від Apache Hadoop , Apache Zookeeper та Apache Thrift .

Цей живий курс під керівництвом інструкторів охоплює принципи роботи, що стоять за Accumulo, і прогулює учасників шляхом розробки зразкового додатку на Apache Accumulo .

Формат курсу

- Частина лекції, частина обговорення, практична розробка та впровадження, періодичні тести, щоб оцінити розуміння
21 годин
Огляд
Відкриття знань у базах даних (KDD) - це процес виявлення корисних знань із колекції даних. Програми реального життя для цієї технології видобутку даних включають маркетинг, виявлення шахрайства, телекомунікації та виробництво.

У цьому живому курсі під керівництвом інструкторів ми знайомимося з процесами, що беруть участь у KDD, та проводимо ряд вправ для практичного впровадження цих процесів.

Аудиторія

- Аналітики даних або хтось зацікавлений у тому, щоб навчитися інтерпретувати дані для вирішення проблем

Формат курсу

- Після теоретичного обговорення KDD викладач представить реальні випадки, які вимагають застосування KDD для вирішення проблеми. Учасники підготують, підберуть та очистять набір зразків даних та використають свої попередні знання щодо даних, щоб запропонувати рішення на основі результатів своїх спостережень.
28 годин
Огляд
Mem SQL - це вбудована в пам'ять, розподілена система управління SQL даних SQL для хмарних та локальних систем. Це сховище даних у режимі реального часу, яке негайно надає уявлення з живих та історичних даних.

У цьому тренінгу під керівництвом інструкторів учасники вивчать основи Mem SQL для розробки та адміністрування.

Після закінчення цього тренінгу учасники зможуть:

- Зрозумійте ключові поняття та характеристики Mem SQL
- Встановлення, проектування, обслуговування та експлуатація Mem SQL
- Оптимізуйте схеми в Mem SQL
- Поліпшення запитів у Mem SQL
- Виконання тестів у Mem SQL
- Створюйте додатки даних у режимі реального часу за допомогою Mem SQL

Аудиторія

- Розробники
- Адміністратори
- Інженери з експлуатації

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики
21 годин
Огляд
Інтелектуальна аналітика - це процес аналізу даних для прогнозування майбутнього. Цей процес використовує дані разом з обробкою даних, статистикою та методами машинного навчання для створення прогнозної моделі для прогнозування майбутніх подій.

У цій навчальній інструкції, учасники навчаться навчатися, як використовувати Matlab для побудови інтелектуальних моделей та застосувати їх до великих вибіркових наборів даних для прогнозування майбутніх подій на основі даних.

До кінця цього тренінгу учасники зможуть:

- Створіть інтелектуальні моделі для аналізу шаблонів історичних та транзакційних даних
- Використовуйте інтелектуальне моделювання для визначення ризиків та можливостей
- Побудуйте математичні моделі, які фіксують важливі тенденції
- Використовуйте дані з пристроїв та бізнес-систем, щоб зменшити витрати, заощадити час або скоротити витрати

Аудиторія

- Розробники
- Інженери
- Експерти домену

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 годин
Огляд
MATLAB - це числове обчислювальне середовище та мова програмування, розроблена MathWorks.
7 годин
Огляд
У цьому тренінгу під керівництвом інструкторів учасники вивчатимуть основні концепції, що стоять за архітектурою MapR Stream, під час розробки програми потокового потоку в реальному часі.

Після закінчення цього тренінгу учасники зможуть створювати додатки для виробників та споживачів для обробки потокових даних у режимі реального часу.

Аудиторія

- Розробники
- Адміністратори

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики

Примітка

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
14 годин
Огляд
Magellan - це механізм розподіленого виконання з відкритим кодом для геопросторової аналітики великих даних. Реалізований поверх Apache Spark , він розширює Spark SQL і забезпечує реляційну абстракцію для геопросторової аналітики.

Цей тренінг під керівництвом викладачів знайомить із концепціями та підходами до впровадження геопросторової аналітики та прогулянок учасників шляхом створення програми прогнозного аналізу за допомогою Magellan on Spark.

Після закінчення цього тренінгу учасники зможуть:

- Ефективно запитувати, аналізувати та приєднуватися до геопросторових наборів даних у масштабі
- Впроваджуйте геопросторові дані в додатках бізнес-аналітики та прогнозування
- Використовуйте просторовий контекст для розширення можливостей мобільних пристроїв, датчиків, журналів та носіння

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
14 годин
Огляд
Apache Kylin - екстремальний, розподілений аналітичний движок для великих даних.

У цій навчальному тренінгу під керівництвом інструктора учасники навчаться використовувати Apache Kylin для створення сховища даних в реальному часі.

До кінця цього тренінгу учасники зможуть:

- Використовуйте поточні дані у режимі реального часу, використовуючи Kylin
- Використовуйте потужні функції Apache Kylin, включаючи підтримку схеми сніжинки, багатий інтерфейс SQL, іскріння та подвійний час затримки запиту

Примітка

- Ми використовуємо останню версію Kylin (на момент написання цієї статті, Apache Kylin v2.0)

Аудиторія

- Великі інженери даних
- Великі аналітики даних

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
7 годин
Огляд
Confluent KSQL is a stream processing framework built on top of Apache Kafka. It enables real-time data processing using SQL operations.

This instructor-led, live training (onsite or remote) is aimed at developers who wish to implement Apache Kafka stream processing without writing code.

By the end of this training, participants will be able to:

- Install and configure Confluent KSQL.
- Set up a stream processing pipeline using only SQL commands (no Java or Python coding).
- Carry out data filtering, transformations, aggregations, joins, windowing, and sessionization entirely in SQL.
- Design and deploy interactive, continuous queries for streaming ETL and real-time analytics.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
35 годин
Огляд
KNIME is a free and open-source data analytics, reporting and integration platform. KNIME integrates various components for machine learning and data mining through its modular data pipelining concept. A graphical user interface and use of JDBC allows assembly of nodes blending different data sources, including preprocessing (ETL: Extraction, Transformation, Loading), for modeling, data analysis and visualization without, or with only minimal, programming. To some extent as advanced analytics tool KNIME can be considered as a SAS alternative.

Since 2006, KNIME has been used in pharmaceutical research, it also used in other areas like CRM customer data analysis, business intelligence and financial data analysis.
21 годин
Огляд
Платформа KNIME Analytics - це провідний варіант з відкритим кодом для інновацій, керованих даними, що допомагає розкрити потенціал, прихований у ваших даних, шахта для отримання нових відомостей або прогнозувати нові майбутні. Платформа KNIME Analytics - це ідеальний набір інструментів для будь-якого науковця даних та бізнес-аналітиків, що KNIME понад 1000 модулів, сотні готових до запуску прикладів, широкий спектр інтегрованих інструментів та найширший вибір сучасних алгоритмів.

Цей курс для платформи KNIME Analytics - це ідеальна можливість для початківців, досвідчених користувачів та експертів KNIME ознайомитись з KNIME , навчитися її більш ефективно використовувати та як створити чіткі, всебічні звіти на основі робочих процесів KNIME
7 годин
Огляд
Kafka Streams - це клієнтська бібліотека для побудови додатків та мікросервісів, дані яких передаються до та з системи обміну повідомленнями Kafka. Традиційно Apache Kafka покладається на Apache Spark або Apache Storm для обробки даних між виробниками повідомлень та споживачами. Викликаючи API Kafka Streams з програми, дані можуть оброблятися безпосередньо в Kafka, минаючи необхідність відправки даних в окремий кластер для обробки.

У цьому тренінгу під керівництвом інструкторів учасники дізнаються, як інтегрувати Kafka Streams у набір зразків Java програм, які передають дані до Apache Kafka та передаються для обробки потоку.

Після закінчення цього тренінгу учасники зможуть:

- Розуміння особливостей та переваг Kafka Streams перед іншими структурами обробки потоків
- Обробляйте потокові дані безпосередньо в кластері Kafka
- Напишіть програму Java або Scala або мікросервіс, який інтегрується з Kafka та Kafka Streams
- Напишіть стислий код, який перетворює вхідні теми Kafka у вихідні теми Kafka
- Створіть, упакуйте та розгорніть програму

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики

Примітки

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись
28 годин
Огляд
MonetDB - це база даних з відкритим кодом, яка стала піонером технологічного підходу "колона-магазин".

У цьому навчанні під керівництвом інструктора, учасники навчаться навчатися, як використовувати MonetDB і як отримати максимальну користь від неї.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте MonetDB та його функції
- Встановіть і запустіть MonetDB
- Досліджуйте та виконуйте різні функції та завдання в MonetDB
- Прискорення доставки свого проекту шляхом максимального використання можливостей MonetDB

Аудиторія

- Розробники
- Технічні експерти

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
21 годин
Огляд
На відміну від інших технологій, IoT набагато складніший, що охоплює майже кожну галузь основних інженерно-механічних, електроніки, прошивки, проміжного програмного забезпечення, Cloud, Analytics і Mobile. Для кожного з його інженерних верств існують аспекти економіки, стандарти, нормативні акти та стан справ. Це на перший час, пропонується скромний курс для охоплення всіх цих критичних аспектів IoT Engineering.

Резюме

-

Розширений тренінг, що охоплює сучасний стан в Інтернеті речей

-

Скорочення частот в декількох областях технології для підвищення обізнаності про систему IoT та її компонентів і як це може допомогти компаніям та організаціям.

-

Live демонстрація застосунків IoT для демонстрації практичних розгортань IoT у різних галузях промисловості, таких як Industrial IoT, Smart Cities, Retail, Travel & Transportation та випадки використання пристроїв та справ

Цільова аудиторія

-

Менеджери, відповідальні за бізнес та операційні процеси у своїх відповідних організаціях, і хочуть знати, як застосувати ІТ, щоб зробити їх системи та процеси більш ефективними.

-

Підприємці та інвестори, які прагнуть побудувати нові підприємства та хочуть краще зрозуміти технологічний ландшафт IoT, щоб побачити, як вони можуть ефективно використати його.

Оцінки для Інтернет-речей або ринкової вартості ІТТ є величезними, оскільки за визначенням IoT є інтегрованим та розповсюдженим шаром пристроїв, сенсорів та обчислювальної потужності, які перекривають весь споживач, бізнес-бізнес та державні галузі. IoT призведе до збільшення кількості підключень: на сьогоднішній день - 1,9 мільярда пристроїв і до 2018 року - на 9 мільярдів. У цьому році вона буде приблизно рівною кількості смартфонів, смарт-телевізорів, планшетів, ноутбуків та комп'ютерів.

У споживчому просторі багато продуктів та послуг вже перейшли на IoT, включаючи кухонну та побутову техніку, паркування, RFID, освітлювальну та опалювальну продукцію, а також ряд додатків в Industrial Internet.

Проте основні технології IoT не є новим, оскільки спілкування M2M існувало з моменту народження Інтернету. Однак те, що змінилося за останні пару років, - це поява безлічі недорогих бездротових технологій, що додаються переважною адаптацією смартфонів і планшетів у кожному будинку. Вибуховий ріст мобільних пристроїв призвів до існуючого попиту на IoT.

Завдяки необмеженим можливостям у бізнесі IoT, велика кількість малих та середніх підприємців підскочила на перемогу з золотою спекою IoT. Також завдяки появі електронної техніки з відкритим кодом та платформи IoT, вартість розробки системи IoT та подальшого управління її значною продукцією стає все більш доступною. Існуючі власники електронних продуктів відчувають тиск на інтеграцію свого пристрою з Інтернет або мобільним додатком.

Цей тренінг призначений для технології та бізнес-аналізу нової галузі, з тим щоб ентузіасти / підприємці IoT могли зрозуміти основи технологій і бізнесу IoT.

Мета курсу

Основна мета курсу полягає у впровадженні нових технологічних варіантів, платформ та тематичних досліджень впровадження IoT в домашніх і міських автоматизації (інтелектуальні будинки та міста), промислового Інтернету, охорони здоров'я, уряду, мобільних стільникових та інших областях.

-

Базове введення всіх елементів платформи IoT-Mechanics, Electronics / sensor, бездротових і кабельних протоколів, інтеграції мобільних пристроїв, інтеграції мобільних пристроїв з підприємствами, Data-analytics та Total control plane

-

Бездротові протоколи M2M для IoT-WiFi, ZigBee / Zwave, Bluetooth, ANT +: коли і де використовувати який?

-

Мобільний / робочий / веб-додаток - для реєстрації, отримання та керування даними - наявна платформа для отримання даних M2M для IoT - Xively, Omega та NovoTech та ін

-

Питання безпеки та рішення безпеки для IoT

-

Платформа з відкритим вихідним кодом / комерційною електронікою для IoT-Raspberry Pi, Arduino, ArmMbedLPC тощо

-

Хмарна платформа з відкритим вихідним кодом / комерційним підприємством для додатків AWS-IoT, Azure -IOT, Watson-IOT хмара на додаток до інших незначних IoT хмар

-

Дослідження бізнесу та технології деяких загальних пристроїв IOT, таких як домашня автоматизація, сигналізація диму, автомобілі, військові, домашнє здоров'я тощо.
21 годин
Огляд
Stream Processing відноситься до Stream Processing в режимі реального часу "даних у русі", тобто виконання обчислень даних під час їх отримання. Такі дані читаються як безперервні потоки з джерел даних, таких як датчики подій, активність користувачів веб-сайту, фінансові торги, перетягування кредитних карт, потоки кліків тощо. Структури Stream Processing потоків здатні зчитувати великі обсяги вхідних даних і надавати цінну інформацію майже миттєво.

У цьому навчанні на практиці під керівництвом інструкторів (на місці або на дистанційному рівні) учасники навчаться налаштувати та інтегрувати різні рамки Stream Processing з існуючими системами зберігання великих даних та відповідними програмними програмами та мікросервісами.

Після закінчення цього тренінгу учасники зможуть:

- Встановіть та налаштуйте різні рамки Stream Processing , такі як Spark Streaming та Kafka Streaming.
- Розумійте та вибирайте найбільш підходящу основу для роботи.
- Обробляйте дані безперервно, одночасно та в режимі рекорду.
- Інтегруйте рішення Stream Processing даних з існуючими базами даних, сховищами даних, озерами даних тощо.
- Інтеграція найбільш підходящої бібліотеки обробки потоків з корпоративними програмами та мікросервісами.

Аудиторія

- Розробники
- Архітектори програмного забезпечення

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики

Примітки

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
14 годин
Огляд
Аудиторія

- Розробники

Формат курсу

- Лекції, практичні заняття, невеликі тести на шляху до розуміння розуміння
21 годин
Огляд
Cloudera Impala - це двигун SQL-запитів з масивно паралельною обробкою (MPP) із відкритим кодом для кластерів Apache Hadoop.

Impala дає користувачам змогу видавати запити з низькою затримкою SQL на дані, що зберігаються в розподіленої файлової системи Hadoop та Apache Hbase, не вимагаючи руху даних або перетворення.

Аудиторія

Цей курс спрямований на аналітики та вчені даних, які виконують аналіз даних, що зберігаються в Hadoop через Business Intelligence або SQL-інструменти.

Після цього курсу делегати зможуть

- Витягніть важливу інформацію з кластерів Hadoop з Impala.
- Напишіть спеціальні програми для полегшення бізнес-інтелекту в Impalt SQL Dialect.
- Виправлення неполадок.
7 годин
Огляд
Цей курс висвітлює, як використовувати мову SQL Hive (AKA: Hive HQL, SQL на Hive , Hive QL) для людей, які витягують дані з Hive
21 годин
Огляд
Hortonworks Data Platform (HDP) - це платформа підтримки Apache Hadoop з відкритим кодом, що забезпечує стабільну основу для розробки великих рішень для даних в екосистемі Apache Hadoop .

Цей тренінг під керівництвом інструкторів (на місці або на дистанційному рівні) представляє Hortonworks Data Platform (HDP) та прогулює учасників шляхом розгортання рішення Spark + Hadoop .

Після закінчення цього тренінгу учасники зможуть:

- Використовуйте Hortonworks для надійного запуску Hadoop у великих масштабах.
- Уніфікуйте можливості безпеки, управління та операційних можливостей Hadoop за допомогою гнучких аналітичних робочих процесів Spark.
- Використовуйте Hortonworks для дослідження, підтвердження, сертифікації та підтримки кожного з компонентів у проекті Spark.
- Обробляйте різні типи даних, включаючи структуровані, неструктуровані, в русі та в спокої.

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
21 годин
Огляд
Цей курс представляє HBase - магазин No SQL на вершині Hadoop . Курс призначений для розробників, які будуть використовувати HBase для розробки додатків, а також адміністраторів, які будуть керувати кластерами HBase.

Ми будемо йти розробником через архітектуру HBase, моделювання даних і розробку додатків на HBase. Також буде обговорено використання MapReduce з HBase, а також деякі теми адміністрування, пов'язані з оптимізацією продуктивності. Курс дуже практичний з великою кількістю лабораторних вправ.

Тривалість : 3 дні

Аудиторія : розробники та адміністратори
28 годин
Огляд
Hadoop - це популярна система обробки великих даних. Python - це мова програмування високого рівня, відомий своїм зрозумілим синтаксисом та читаемостью коду.

У цій інструкції під керівництвом живих тренінгів учасники навчаться працювати з Hadoop, MapReduce, Pig і Spark за допомогою Python, коли вони пройдуть кілька прикладів і використовують випадки.

До кінця цього тренінгу учасники зможуть:

- Зрозумійте основні концепції Hadoop, MapReduce, Pig і Spark
- Використовуйте Python з розподіленою файловою системою Hadoop (HDFS), MapReduce, Pig і Spark
- Використовуйте Snakebite для програмного доступу до HDFS у Python
- Використовуйте mrjob, щоб написати завдання MapReduce у Python
- Напишіть програми Spark за допомогою Python
- Розширюйте функціональність свині за допомогою Python UDF
- Керуйте роботами MapReduce та скриптами Pig, використовуючи Luigi

Аудиторія

- Розробники
- ІТ-фахівці

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
28 годин
Огляд
Аудиторія:

Цей курс покликаний демістифікувати технології великих даних / hadoop і показати, що це не важко зрозуміти.
14 годин
Огляд
Оскільки все більше і більше програмних і ІТ-проектів мігрують з локальної обробки та керування даними в розподілену обробку та зберігання великих даних, Менеджери проектів виявляють необхідність вдосконалювати свої знання та навички, щоб зрозуміти концепції та практику, що стосуються проектів та можливостей Big Data.

Цей курс ознайомить менеджера проектів з найпопулярнішою системою обробки великих даних: Hadoop.

У цьому тренінгу під керівництвом інструкторів учасники вивчатимуть основні компоненти екосистеми Hadoop та способи використання цих технологій для вирішення великомасштабних проблем. У процесі вивчення цих основ учасники також покращуть свою здатність спілкуватися з розробниками та розробниками цих систем, а також вченими даних та аналітиками, якими задіяні багато ІТ-проектів.

Аудиторія

- Менеджери проектів, які бажають впроваджувати Hadoop в існуючу інфраструктуру розвитку або ІТ
- Менеджери проектів, які потребують спілкування з міжфункціональними групами, до складу яких входять великі інженери даних, вчені даних та бізнес-аналітики

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
7 годин
Огляд
This instructor-led, live training (onsite or remote) is aimed at technical persons who wish to learn how to implement a machine learning strategy while maximizing the use of big data.

By the end of this training, participants will:

- Understand the evolution and trends for machine learning.
- Know how machine learning is being used across different industries.
- Become familiar with the tools, skills and services available to implement machine learning within an organization.
- Understand how machine learning can be used to enhance data mining and analysis.
- Learn what a data middle backend is, and how it is being used by businesses.
- Understand the role that big data and intelligent applications are playing across industries.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
21 годин
Огляд
Apache NiFi (Hortonworks DataFlow) - це інтегрована логістика даних у режимі реального часу та проста платформа для обробки подій, яка дозволяє переміщувати, відстежувати та автоматизувати дані між системами. Він написаний за допомогою потокового програмування та забезпечує веб-інтерфейс для управління потоками даних у режимі реального часу.

У цьому навчанні на Apache NiFi під керівництвом інструкторів (на місці або на віддаленому рівні) учасники навчаться розгортати Apache NiFi та керувати Apache NiFi у прямому лабораторному середовищі.

Після закінчення цього тренінгу учасники зможуть:

- Встановлення та налаштування Apachi NiFi.
- Джерело, перетворення та управління даними з різних, розподілених джерел даних, включаючи бази даних та великі озера даних.
- Автоматизація потоків даних.
- Увімкнути потокову аналітику.
- Застосовуйте різні підходи до прийому даних.
- Перетворіть Big Data та перегляньте інформацію про бізнес.

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, будь ласка, зв'яжіться з нами, щоб домовитись.
14 годин
Огляд
Teradata - популярна система Management реляційними Database для створення великих масштабних програм зберігання даних. Teradata досягає цього шляхом паралелізму.

Ця навчальна програма під керівництвом інструкторів (на місці або на віддаленому рівні) спрямована на розробників програм та інженерів, які бажають освоїти більш досконалі користування базою даних Teradata .

Після закінчення цього тренінгу учасники зможуть:

- Керуйте простором Teradata .
- Захист та розповсюдження даних у Teradata .
- Прочитайте пояснення плану.
- Поліпшення рівня SQL .
- Використовуйте основні утиліти Teradata .

Формат курсу

- Інтерактивна лекція та дискусія.
- Багато вправ і вправ.
- Ручна реалізація в умовах лабораторії.

Параметри налаштування курсу

- Щоб подати заявку на індивідуальне навчання для цього курсу, зв'яжіться з нами, щоб домовитись.
35 годин
Огляд
MLlib - це бібліотека машинного навчання Spark. Його мета полягає в тому, щоб зробити практичне машинне навчання масштабованим і легким. Вона складається з загальних алгоритмів навчання та утиліт, включаючи класифікацію, регресію, кластеризацію, спільну фільтрацію, зменшення розмірності, а також примітиви оптимізації нижнього рівня та API API вищого рівня.

Він поділяється на два пакети:

-

spark.mllib містить оригінальний API, побудований поверх RDD.

-

spark.ml надає API вищого рівня, побудований на базі DataFrames для побудови конвеєрів ML.

Аудиторія

Цей курс спрямований на інженерів і розробників, які прагнуть використовувати вбудовану бібліотеку машин для Apache Spark
14 годин
Огляд
Apache Zeppelin - веб-ноутбук для захоплення, вивчення, візуалізації та обміну даними на основі Hadoop та Spark.

Цей тренінг під керівництвом інструкторів знайомить із концепціями інтерактивної аналітики даних та прогулює учасників шляхом розгортання та використання Zeppelin в середовищі для одного користувача або для багатьох користувачів.

Після закінчення цього тренінгу учасники зможуть:

- Встановіть і налаштуйте Zeppelin
- Розробка, організація, виконання та обмін даними в інтерфейсі на основі браузера
- Візуалізуйте результати, не посилаючись на командний рядок чи дані кластера
- Виконувати та співпрацювати на довгих робочих процесах
- Працюйте з будь-якою з кількох мов / програмних обробних даних, таких як Scala (з Apache Spark ), Python (з Apache Spark ), Spark SQL , JDBC, Markdown та Shell.
- Інтеграція Zeppelin з Spark, Flink та зменшення карт
- Захистіть багатокористувацькі екземпляри Zeppelin за допомогою Apache Shiro

Аудиторія

- Інженери даних
- Аналітики даних
- Дані вчених
- Розробники програмного забезпечення

Формат курсу

- Частина лекції, частина дискусії, вправи та важкі практичні практики
14 годин
Огляд
Vespa - це велика обробка та обслуговування двигунів з відкритим кодом, створено компанією Yahoo. Він використовується для відповіді на запити користувачів, надання рекомендацій та надання персонального вмісту та реклами в реальному часі.

Цей навчальний курс, навчальний тренінг для вчителів, представляє проблеми, пов'язані з наданням великомасштабних даних і проходженням учасників шляхом створення програми, яка може обчислювати відповіді на запити користувачів, над великими наборами даних в режимі реального часу.

До кінця цього тренінгу учасники зможуть:

- Використовуйте Vespa для швидкого обчислення даних (зберігання, пошуку, ранжування, упорядкування) при обслуговуванні під час очікування користувача
- Впроваджуйте Vespa в існуючі програми, що включають пошук функцій, рекомендації та персоналізацію
- Інтеграція та розгортання Vespa з існуючими великими системами даних, такими як Hadoop і Storm.

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
14 годин
Огляд
Tigon - це платформа обробки потоків з відкритим вихідним кодом, в режимі реального часу, з низькою затримкою, високою пропускною спроможністю, натуральною оптоволоконною лінією, що стоїть на вершині HDFS та HBase за наполегливість. Прикладні програми Tigon використовують такі випадки, як виявлення та аналіз вторгнення в мережу, аналіз ринку соціальних мереж, аналітика місць розташування та рекомендації користувачам у реальному часі.

Під керівництвом інструктора, живого тренінгу, вводять підхід Тигона до поєднання режиму реального часу та пакетної обробки, оскільки він ходить учасників шляхом створення прикладу програми.

До кінця цього тренінгу учасники зможуть:

- Створюйте потужні поточні програми для обробки великих обсягів даних
- Опрацюйте джерела потоку, такі як Twitter і веб-серверів
- Використовуйте Tigon для швидкого приєднання, фільтрації та об'єднання потоків

Аудиторія

- Розробники

Формат курсу

- Частина лекції, частина дискусії, вправи та важка практика
Weekend Big Data courses, Evening Big Data training, Big Data boot camp, Big Data instructor-led, Weekend Big Data training, Evening Big Data courses, Big Data coaching, Big Data instructor, Big Data trainer, Big Data training courses, Big Data classes, Big Data on-site, Big Data private courses, Big Data one on one training

Знижки на курс

No course discounts for now.

Інформаційний бюлетень "Знижки на курси"

Ми поважаємо конфіденційність Ваших персональних даних. Ми зобов'язуємось не передавати Ваші дані іншим особам. Ви завжди можете змінити свої налаштування конфіденційності або повністю відмовитись від підписки.

Наші клієнти

is growing fast!

We are looking to expand our presence in Ukraine!

As a Business Development Manager you will:

  • expand business in Ukraine
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!