subject

Coursera: Прикладные задачи анализа данных

 with  Вадим Стрижов, Виктор Кантор, Евгений Рябенко, Евгений Соколов and Эмели Драль
Методы машинного обучения — будь то алгоритмы классификации или регрессии, методы кластеризации или алгоритмы понижения размерности — применяются к подготовленным данным с вычисленными признаками для решения уже сформулированной задачи. Однако специалисты по анализу данных редко оказываются в такой идеальной ситуации. Обычно перед ними ставят задачи, которые нуждаются в уточнении формулировки, выборе метрики качества и протокола тестирования итоговой модели. Данные, с которыми нужно работать, часто представлены в непригодном виде: они зашумлены, содержат ошибки и выбросы, хранятся в неудобном формате и т. д.

В этом курсе мы разберем прикладные задачи из различных областей анализа данных: анализ текста и информационный поиск, коллаборативная фильтрация и рекомендательные системы, бизнес-аналитика, прогнозирование временных рядов. На их примере вы узнаете, как извлекать признаки из разнородных данных, какие при этом возникают проблемы и как их решать. Вы научитесь сводить задачу заказчика к формальной постановке задачи машинного обучения и поймёте, как проверять качество построенной модели на исторических данных и в онлайн-эксперименте. На каждой задаче мы изучим плюсы и минусы пройденных алгоритмов машинного обучения.

Прослушав этот курс, вы познакомитесь с распространенными типами прикладных задач и будете понимать схемы их решения.

Syllabus

Бизнес-задачи
На этой неделе мы разберём две крупные задачи, часто возникающие в бизнес-аналитике. Первая связана с прогнозированием временных рядов; задачи такого типа часто возникают, когда необходимо оценить значение показателя в будущем, основываясь на истории его изменения в прошлом. Такими показателями могут быть спрос на товар, аудитория рекламного баннера, цена акций и т.д. Вторя задача — это анализ поведения пользователей. Класс задач, связанных с анализом пользовательских данных, неизбежно появляется практически в любой сфере бизнеса, подразумевающей работу с клиентами. Как правило, это такие задачи, как привлечение пользователей, работа с аудиторией, прогнозирование оттока и удержание клиентов.

Анализ медиа
Вторая неделя посвящена вопросам компьютерного зрения. Мы обсудим базовые методы обработки изображений и поговорим про такие задачи, как классификация изображений, распознавание лиц, детекция объектов и семантическая сегментация. Благодаря развитию глубоких нейронных сетей, за последние несколько лет во всех этих задачах достигнут огромный прогресс. Вы узнаете, как на практике пользоваться нейросетевыми библиотеками, и научитесь быстро собирать и размечать большие коллекции изображений.

Анализ текстов
Данная неделя посвящена работе с особым видом данных — текстами. Тексты встречаются во многих задачах, и при этом свести их к стандартной матрице с объектами и признаками не так просто. В этом модуле мы изучим основы работы с текстовыми данными, способы генерации признаков на их основе, поговорим о нейросетевых подходах (в частности, word2vec и рекуррентные сети). Также мы обсудим несколько конкретных прикладных задач анализа текстов, среди которых будут анализ тональности и аннотирование.

Рекомендации и ранжирование
На этой неделе вы познакомитесь с задачами, в которых нужно оценивать "интересность" различных объектов для пользователя - задачей ранжирования, актуальной при построении поиска, и задачей построения рекомендательных систем, возникающей при необходимости посоветовать пользователю некоторый контент (фильмы, музыку, статьи) или товары в интернет-магазине.

1 Student
review
Cost Free Online Course (Audit)
Pace Upcoming
Provider Coursera
Language Russian
Certificates Paid Certificate Available
Calendar 4 weeks long
Sign up for free? Learn how
+ Add to My Courses
Learn Data Analysis udacity.com

Learn to become a Data Analyst. Job offer guaranteed or get a full refund.

Advertisement
Become a Data Scientist datacamp.com

Learn Python & R at your own pace. Start now for free!

Advertisement
FAQ View All
What are MOOCs?
MOOCs stand for Massive Open Online Courses. These are free online courses from universities around the world (eg. Stanford Harvard MIT) offered to anyone with an internet connection.
How do I register?
To register for a course, click on "Go to Class" button on the course page. This will take you to the providers website where you can register for the course.
How do these MOOCs or free online courses work?
MOOCs are designed for an online audience, teaching primarily through short (5-20 min.) pre recorded video lectures, that you watch on weekly schedule when convenient for you.  They also have student discussion forums, homework/assignments, and online quizzes or exams.

1 review for Coursera's Прикладные задачи анализа данных

Write a review
11 months ago
profile picture
Alex Ivanov audited this course.
Was this review helpful to you? YES | NO