Comments 16
А насколько инструментарий на Питоне применим для практических задач? Как у него с производительностью и интеграцией с GPU?
Много success stories про использование есть.

Большинство инструментов аналитики, обучения и прочего в Python базируются на numpy, а numpy почти полностью написан на C.
Есть биндинги к системам анализа, который могут работать кластерами — например для Spark — PySpark
Интеграция с GPU тоже есть — через CUDA или NumbaPRO.
Есть куча библиотек для Deep Learning, например, Caffe

Идеи по использованию мобильных архитектур в кластере: Jira, новость от Databricks

Вас не смутила подпись [Just in case you didn’t realize – it’s April 1st!]?
Для практической задачи обучения ML — вполне, ровно как и для визуализации работы алгоритма, например, при пошаговой обработке в интерфейсе Jupyter.
Для практической задачи модификации или адаптации алгоритма — вполне.

Для задач обработки крупных массивов либо окончательной подстройки коэффициентов на конкретном наборе данных — наверное, не очень, но это уже вопрос качества написания кода и применения нативных расширений, например, Cython и MKL для компиляции кода на C.
Дык зависит от размера ваших данных — не все задачи ML требуют терабайтов данных.
На курсере недавно на русском курс начался, теги: шад/вшэ, python.
https://www.coursera.org/learn/vvedenie-mashinnoe-obuchenie
Похоже отзывов по последнему пока нет. Записался, прохожу первый курс: экстремумы функций, производные первого и второго порядка, питон/блокнот — вот это вот всё. Вроде бы можно ускориться, но если одновременно с несколькими другими, то труднаа )

Да, а на «Введение» на всякий случай перезаписался, но вряд ли продолжу.
На мой взгляд, в курсе «Введение в машинное обучение» не хватает только лабораторных работ — чтоб тебе еще показали, как пользоваться библиотеками. А то так действительно курс распадается на 2 части, не особо связанные друг с другом. Из плюсов выделил бы финальный проект. И задача интересная, и для многих это быстрое погружение в соревнования Kaggle.
А то что теоретический материал «суховат»… ну да, у Andrew Ng все увлекательней, но там где, он 5 минут рассказывает, что такое производная (и 2 раза повторяет, что вы эксперт в ML), хочется давно уже просто формулу увидеть. Если ставить себе задачу действительно разбираться в машинном обучении — надо уметь воспринимать и такую подачу материала, как у Воронцова.
На мой взгляд, неплохой вариант приступить к практике (помимо Kaggle) — это попроходить интерактивные тьюториалы типа Dataquest и Datacamp. А стратегия становления классным специалистом в области Data Science неплохо описана тут.
Only those users with full accounts are able to leave comments. Log in, please.
Information
Founded

March 26, 1900

Location

Россия

Website

en.itmo.ru

Employees

Неизвестно

Registered

19 October 2015