VSnake notes: Apache Spark, Scalable Machine Learning

2015-08-03

Apache Spark, Scalable Machine Learning

It's a pun, isn't it? Apache Spark powered by Scala and course name is «Scalable Machine Learning».

Фуух, бобер, выдыхай.

Сегодня закончил курс «BerkeleyX: CS190.1x Scalable Machine Learning» на edX.

Еле успел закончить пятую лабу. С учетом того, что начал я с опозданием на две недели а закончил вовремя с отметкой «А», я смело могу взять с полки пирожок.

Потом сделаю серию постов, подробно расскажу про учебный материал. Сейчас вкратце.

Этот курс, CS190.1x, можно рассматривать как хорошее дополнение к Stanford University «Machine Learning», Coursera. Я про него писал.

Здесь нет такого внимания к теоретическим основам, упор больше делается на практику применения Apache Spark (распределенные вычисления) в задачах машинного обучения. Хотя про логистическую регрессию в Беркли растолковали более подробно, нежели в Стэнфорде.

Все лабы делаются на специально подготовленной виртмашине (VirtualBox), поднимаемой учеником через Vagrant.

Весь код в лабораторках пишется в веб-браузере, через IPython Notebook, заряженный в виртмашину. Apache Spark дергается через PySpark.

Активно эксплуатируется MapReduce для обработки и обсчета данных.

Вся математика заключается в манипуляции векторами и матрицами.

В общем, никакого рокетсаенс, после Стенфордского курса. Зато практика работы с распределенными вычислениями по теме ML.

Круто, рекомендую.

original post http://vasnake.blogspot.com/2015/08/apache-spark-scalable-machine-learning.html

Tools

VSnake notes

2015-08-03

Apache Spark, Scalable Machine Learning

Комментариев нет:

Отправить комментарий

Архив блога

Ярлыки

Обо мне

Links