Let's speak about AI: міні-інтерв'ю зі спікерами AI Ukraine'16

Друзі, до конференції AI Ukraine'16 залишився один місяць, і ми підготували міні-інтерв'ю сзг спікерами.

Впевнені, що досвід та рекомендації кращих експертів у сфері AI будуть корисні кожному з вас.

Сергій Шельпук , Head of Data Science Office, Eleks

1. Розкажіть про перші кроки у вашій професії: як починалася ваша кар'єра в сфері ШІ? Чий приклад або досвід допоміг вам у роботі?
Для мене все почалося в серпні 2011 року, коли Стенфордський університет вирішив викласти в публічний доступ три курси: Machine Learning, Artificial Intelligence і Introduction to Databases. Вони захопили мене цілком і повністю. Показали, наскільки цікавою і корисною для розв'язання практичних завдань може бути математика — щось, що було зовсім не очевидним після навчання в КПІ. Бачити, як написана тобою програма сама вчиться робити щось, що ти їй не пояснював, що не зміг би пояснити, навіть якщо б захотів, було захоплююче. Відчуття магії.
Потім були MOOC, навчання на ІІ програмі в Стенфорді і, зрештою, створення Data Science Group в SoftServe. Ми були першими серед українських ІТ компаній, у нас не було перед очима досвіду або прикладу, на який ми могли б спиратися. У чомусь допомагав Інтернет, але здебільшого ми вчилися робити бізнес з ШІ самі, з допомогою здорового глузду, методом проб і помилок.

2. Розкажіть про найцікавішою Data Science задачі, яку вам доводилося вирішувати (наукової або практичної).
Дуже складно вибрати — вони всі були цікавими і кожна сама цікава по-своєму.
Був наш перший проект, ми шукали аномалії на рентгенівських знімках. Це був 2013 рік, у нас не було досвіду, і сама задача не мала відомих рішень. Тим не менш, ми змогли отримати хороший результат за допомогою модного нині підходу deep learning.
Був пошук схожих пацієнтів на вибірці в 30 мільйонів, кожен з яких описувався 350 тис. бінарних ознак. Може здатися, що це Big Data завдання для кластерів і Spark, але наше рішення працювало на звичайному офісному ноутбуці, видавало результат за 100 мілісекунд і споживало 20 Мб ОЗУ. Це був цікавий досвід застосування data mining, про який часто забувають на тлі популярного нині machine learning.
І була система автоматичного керування потужностями серверів і віртуальних машин. Дуже цікава з технічної точки зору задача та її розв'язок з застосуванням reinforcement learning, який сьогодні дуже рідко можна зустріти в продакшен системах. Кілька тижнів тому Google оголосив, що вони змогли зменшити витрати на електрику за допомогою технології DeepMind. Ми робили точно таке ж рішення з 2013 року.

3. Уявіть 2030 рік, — яким він буде? Які можливості для людства можуть з'явитися завдяки розвитку ШІ вже через 10-15 років?
Дуже складно загадувати. Все міняється занадто швидко, робити прогнози в нинішньому світі — тільки засмічувати інформаційний простір :-)
Варто також пам'ятати, що з моменту появи терміну в 1950-х ІІ переживав мінімум два сплеску інтересу, після чого слід було розчарування. За галуззю на довгий час закріпилася стійка репутація "overpromises and underdelivery", академічні кола жартували, що наукові статті в галузі ШІ годяться тільки на розпалювання багать, а статті про нейронні мережі взагалі відмовлялися друкувати.
Приємно бачити, що ІЇ знову на підйомі, але в той же час — занадто оптимістичні прогнози і занадто великі очікування збільшують ризик нового розчарування.

4. Зараз в різних колах серйозно обговорюється питання небезпеки штучного інтелекту, адже кінематограф нещадно експлуатує цю тему. Проводиться аналогія з "Термінатором", для якого людство — загроза. Наскільки ці побоювання обгрунтовані, на вашу думку?
Розквіт ІЇ можна порівняти з індустріальними технологіями XIX століття — ми розробляємо інструменти, які можуть зробити людину більш ефективним і більш продуктивним. Які професії можуть зникати, нові можуть з'являтися, але як парова турбіна не вбила людину, так не вб'ють і ІІ технології.

5. Порекомендуйте для наших учасників матеріали, які виявилися цінними для вас: книга/веб-ресурс.
1. On Intelligence by Jeff Hawkins
2. Mining of Massive Datasets by Anand Rajaraman and Jeffrey Ullman
3. Deep Learning by Ian Goodfellow, Yoshua Bengio and Aaron Courville

Мар'яна Романишин, Technical Lead, Computational Linguist at Grammarly

1. Розкажіть про перші кроки у вашій професії: як починалася ваша кар'єра в сфері ШІ? Чий приклад або досвід допоміг вам у роботі?
Я вперше дізналася про комп'ютерній ютерну лінгвістику в 2010 році. Тоді, на п'ятому курси, нам пощастило вчитися у Андрея Романюка, який розробив курс із комп'ютерною комп'ютерної лінгвістики для прикладних лінгвістів "Львівської політехніки". Я закохалася в предмет, витратила літо на ті, щоб засвоїти основи опрацювання природної мови та опанувати Python, а тоді написала прототип семантичного аналізу на диплом. Я вдячна Андрієві Романюку за те, що мене надихнув та скерував, і шкодую, що він більше не викладає комп'ютерній ютерну лінгвістику.
Далі було дуже багато самонавчання, перша робота, аспірантура, знайомство з машинним навчанням, друга робота, ще кілька курсів на Корсері, конференції, тоді Ґреммерлі, і вісь я в Берліні на конференції ACL — спілкуюся з К. Меннінгом та Д. Джурафскі, за матеріалами яких я й опановувала професію.

2. Розкажіть про найцікавішою Data Science задачі, яку вам доводилося вирішувати (наукової або практичної).
Я не можу пригадати нецікавих комплінгвістичних проектів. Усі проекти, в яких я брала участь, були цікавими, нестандартними та дуже різноманітними за набором технологій, який вони використовували. Це і морфологічний аналіз, і синтаксичний аналіз, і аналіз тональності тексту, і додатки для дистанційного вивчення іноземних мов, і виправлення помилок, і добування сутностей, фактів, подій тощо. Кожна з цих завдань складається з безлічі підзадач, і робота комп'ютерного лінгвіста полягає в тому, щоб формалізувати таке непередбачуване явище, як природна мова. Пригадую, як працювала над виправленням відсутнього артикля (вже в Ґреммерлі). Мені тоді два тижню не було ні видно, ні чути, поки я шукала рішення, яке б спрацювало найкраще.
Природна мова — це унікальне явище. Технології для її опрацювання постійно розвиваються, а кількість завдань лиш зростанні.

3. Уявіть 2030 рік, — яким він буде? Які можливості для людства можуть з'явитися завдяки розвитку ШІ вже через 10-15 років?
Уявляти певно не буду, зате можу порушити кілька питань для роздумів.
Наприклад, за останні два роки набув популярності термін Neural: Neural Machine Translation, Neural Syntactic Parsing, Neural Error Correction і т. д. Результати дуже гарні, однак є й багато критики навколо цього модного слівця, тож я точно стежитиму за розвитком методів глибинного навчання для завдань комп'ютерній комп'ютерної лінгвістики. Цікаво, чи вистрілить цей напрямок, змітаючи все навколо? Чи, можливо, проміні, і його замінять інші модні слівця?
За останні роки багато було зроблено в напрямі створення соціальних роботів, на кшталт Jibo. Цікаво, чи стануть такі роботи звичним явищем через 15 років?
Машинний переклад, аналіз тональності, виправлення помилок, звісно, просунуться. Питання лиш у тому, чи досягнуть рівня людини?

4. Зараз в різних колах серйозно обговорюється питання небезпеки штучного інтелекту, адже кінематограф нещадно експлуатує цю тему. Проводиться аналогія з "Термінатором", для якого людство — загроза. Наскільки ці побоювання обгрунтовані, на вашу думку?
Так, я чула, що Ілон Маск і компанія працюють над запобіжними заходами. Я загрози для людства поки що не бачу. Штучному інтелекту наразі бракує глузду та знань про навколишній світ. Спроби додати йому цих знань через створення баз знань на цей момент дуже обмежені, адже формалізувати світ навколо не так просто. А для машинного та глибокого навчання потрібно надзвичайно багато даних. Я не певна, що всього інтернету вистачить.

5. Порекомендуйте для наших учасників матеріали, які виявилися цінними для вас: книга/веб-ресурс.
Як показав досвід попередніх років, авдиторія AI Ukraine дуже різноманітна. Для різноманітної авдиторії пораджу різноманітні матеріали. З того, що спадає на думку:
1. Для тих, хто хоче займатися комп'ютерною лінгвістикою, але не знає, з якого боку підійти:
— Natural Language Processing with Python by Steven Bird (для зовсім початківців)
— Speech and Language Processing by Daniel Jurafsky and James H. Martin (класика)
— Foundations of Statistical Natural Language Processing by Christopher Manning (класика)
— Coursera: Natural Language Processing (by Daniel Jurafsky and Christofer Manning, Stanford), Introduction to Natural Language Processing (by Dragomir Radev, Michigan), Natural Language Processing (by Michael Collins, Columbia)
— курси з машинного навчання та глибинного навчання на Coursera та Udacity
— Антологія ACL
2. Для тих, хто будує власну команду і хоче, щоб всі процеси були на місці:
— Site Reliability Engineering by Google
3. Для жінок в IT, які чогось боятися:
— See Jane Lead by Lois Frankel
— Nice Girls don't Get The Corner Office by Lois Frankel

Ярослав Недашковський , System Architect at SoftElegance

1. Розкажіть про перші кроки у вашій професії: як починалася ваша кар'єра в сфері ШІ?
Перші кроки в роботі з даними були зроблені ще під час написання дипломної роботи, де я займався аналізом сейсмічних даних з нафтових родовищ.

2. Розкажіть про найцікавішою Data Science задачі, яку вам доводилося вирішувати (наукової або практичної).
Мене найбільше цікавить завдання пов'язані з предективным аналізом. Зараз як раз вирішуємо таку головоломку, пов'язану з обладнанням для інтенсифікації видобутку нафти.

3. Уявіть 2030 рік, — яким він буде? Які можливості для людства можуть з'явитися завдяки розвитку ШІ вже через 10-15 років?
Це медицина — можливо, ми зможемо забути про деякі невиліковні хвороби і створити прилад, який зможе при народженні людини передбачати в якій області йому краще розвиватися. І так звана четверта індустріальна революція буде в завершальній стадії. З "простих няшек" — поява інтелектуальних помічників, які дуже сильно спрощують наше життя.

4. Зараз в різних колах серйозно обговорюється питання небезпеки штучного інтелекту, адже кінематограф нещадно експлуатує цю тему. Проводиться аналогія з "Термінатором", для якого людство — загроза. Наскільки ці побоювання обгрунтовані, на вашу думку?
Я думаю, що це все це надумані проблеми, пов'язані з великим хайпи біля ІІ. Мені слабо віриться в можливість створення подібної копії мозку людини в "залізному вигляді". Найбільше проблем може бути пов'язане зі скороченням робочих місць у результаті тотальної автоматизації, і з перенавчанням людей виникають нові професії.

5. Порекомендуйте для наших учасників матеріали, які виявилися цінними для вас: книга/веб-ресурс.
Зараз читаю "Mining of Massive Datasets" — www.mmds.org . Рекомендую. Допомагає весь час вчитися, постійно розширювати свій кругозір.

Інтерв'ю з іншими спікерами читайте на нашій сторінці в Facebook

Опубліковано: 11/09/16 @ 05:13
Розділ Інтерв'ю

Рекомендуємо:

27 вересня, Львів — Запрошуємо отримати спеціальність «Програміст Java»
Java дайджест #28: Kotlin — мова місяця
15 вересня, Київ — Запрошуємо пройти курс PHP з Працевлаштуванням
Інтерв'ю – Віталій Виноградов, автор блогу vinograd.io/blog
3 жовтня — 4 листопаду, Чернігів — WEB Boot Camp у Чернігові — підготовка до позиції WEB Developer в Дивувати Commerce