Big Data дайджест # 0

Останнім часом про Big Data не чув тільки ледачий. У нашій компанії EPAM Systems накопичилося багато досвіду, пов'язаного з обробкою великих обсягів даних, і, зрозуміло , періодично ми ділимося ним як з новачками , так і з досвідченими колегами.

Ця добірка посилань розділена на 2 частини: для початківців і для просунутих . Сподіваюся, зібрані матеріали будуть для вас корисними та цікавими . Я планую випускати дайджест раз на місяць. Задати питання , запропонувати тему чи поділитися своїми посиланнями ви можете в коментарях.

Для початківців

Лекція Андрія Себрант , директора з маркетингу сервісів, Яндекс
що таке насправді Big Data- як кулінарні уподобання впливають на ймовірність вдалого знайомства , що спільного між плювком і записом у церковноприходської книзі і чим все це схоже на пошук Яндекса ? Доступне пояснення основних принципів , розраховане на широку аудиторію . Що означає термін Big Data ?
На цей, здавалося б, просте питання відповіли понад 40 експертів з різних галузей і сфер бізнесу: від медіа та fashion -індустрії, до медицини і автомобілебудування. Повірте, їхні відповіді вас здивують ( добірка цитат на англ.) Як бути з великими даними?
Якщо накопичена вами інформація дає вам відчуття комфорту і успіху , то , швидше за все , ваша інтерпретація цієї інформації невірна. У цій напрочуд зворушливою лекції Сюзан Етлінгер пояснює, чому при отриманні все більших і більших обсягів інформації нам необхідно поглибити свої навички критичного мислення . І про те, як нелегко перейти від підрахунку речей до їх осмислення .
Презентація англійською , з російськими субтитрами .

Для просунутих

Quick Answers From Large Data - невеликий практикум з Tempe
Tempe - інтерактивна система для вивчення великих наборів даних. Цей інструмент допомагає з великою швидкістю проаналізувати великі набори даних і полегшує розуміння цих самих даних. ( Відео- практикум англійською ) . An Explanation of the Hadoop Ecosystem
Більшість людей вважають , що Hadoop - це і є великі дані . Насправді ж Big Data існували раніше , і як і раніше можуть існувати без Hadoop . З цієї статті ви дізнаєтеся про інші проекти , крім різних модулів Hadoop , які також можуть виконувати необхідні функції .
Стаття - introduction англійською . Hadoop Distributions - Cloudera vs Hortonworks vs MapR vs Intel
У цьому відео представлений огляд різних рішень Hadoop, таких як Cloudera , Hortonworks , MapR і Intel, а також загальні відомості про Hadoop ecosystem .
Відео- лекція англійською . Курс « Process Mining : Data science in Action »
Process mining(глибинний аналіз процесів) - це відсутню ланку між model - based process analysis ( аналізом процесів , що проводяться на основі моделей ) і data - oriented analysis (інформаційно -орієнтований аналіз). Цей курс розширить ваше уявлення про data science (наука про дані ) , і допоможе застосувати ці знання для аналізу та покращення процесів у будь-яких доменах бізнесу.
Усі матеріали курсу, в тому числі практичні завдання, - англійською. Курс « Intro to Hadoop and MapReduce : How to Process Big Data »
Проект Apache ™ Hadoop® розробляє програмне забезпечення з відкритим вихідним кодом для надійної , масштабованої , розподіленої обчислювальної техніки. Цей курс допоможе вам дізнатися основні принципи, що лежать в основі розробки, і на їх базі написати власні програми, які допоможуть вирішувати актуальні для вас проблеми.
Всі матеріали курсу англійською . Блоги технологічних лідерів Big Data :
- Microsoft
- Oracle
- Amazon

Опубліковано: 17/01/15 @ 10:33
Розділ Різне

Рекомендуємо:

17 лютого, Київ - Курси з Android і iOS від Web Academy
20 лютого - Онлайн курс "PRO РОБОТІВ " ( MOOC Robotics )
QA дайджест # 3 : кар'єра тестувальника , ігрові патерни , відповіді на питання зі співбесід
#ITeaTalks : Стас Матвієнко ( Settle ) - « Найдешевші успішні українські стартапи вже переїхали в США »
20 січня, Київ - Курс "Основи бізнес аналізу"