Machine Learning&texts

ML&texts

О мастерской

Друзья.
Сегодня поисковые системы, чат-боты, вычисление эмоций и фейк-news давно потеряли статус фантазий. Это реальные вещи,построенные на хитрых и относительно нехитрых технологиях. С их помощью компьютер учится понимать человеческий язык. Вычисление контекста, семантический анализ, машинный перевод - все эти хайповые и востребованные направления мира IT и анализа данных, составляют часть большой и прекрасной сферы Natural Language Processing (Автоматической обработки естественного языка). Именно с ней и будем вас знакомить мы - мастерская Ml&texts.

И все это - на берегу Волги, где свежий воздух, палатки, вкусная еда, вечерние костры, теплая атмосфера и душевные компании.

Так что, приехать к нам, в ML&texts на Летнюю школу - отличный способ провести с пользой и отдыхом последние пару недель июля. Будет много работы, готовьтесь:).

На ML&texts вы сможете:

  • познакомиться с современными методами обработки текстов;
  • послушать топовых IT-специалистов, которые занимаются крутыми и необычными задачами;
  • узнать про сложные алгоритмы машинного обучения без углубления в продвинутую математику;
  • приобрести практический опыт, создав сложную и полезную программу на языке Python -- голосового помощника или чат-бота;
  • понять, причем здесь классическая лингвистика.

Кого ищем:

  1. вам 18 +;
  2. вы не боитесь дикой природы и не страшитесь двухнедельной жизни в палатке;
  3. вы умеете работать в команде;
  4. вы с уважением относитесь к другим людям и личному пространству других людей;
  5. вы обладаете базовыми навыками программирования Python или R. В понятие “базовые знания” входят:

  6. знание циклов и условных операторов;

  7. умение написать свою функцию;
  8. понимание таких терминов, как namespace, scopes, environmental variable;
  9. понимание устройства классов;
  10. работа со строками и регулярными выражениями;
  11. знать что такое pipeline в машинном обучении, знакомство с базовыми методами визуализации (matplotlib), понимание принципов работы классификаторов, кластеризаторов;

P.S.

Будет здорово, если вы освежите знания по МатАнализу и Линейной Алгебре. А именно, вам пригодится понимание, что такое матрицы, скалярное умножение, косинусное расстояние между векторами, производная, частная производная и производная сложной функции.

P.P.S.

Основной язык, который будет использоваться на школе -- Python.

Кого мы не ждем:

  1. вы хотите узнать про нейролингвистическое программирование (тоже NLP);
  2. вам тяжело жить на природе в палатке;
  3. вам тяжело находить общий язык с другими людьми. Поверьте, это может стать серьезной проблемой;
  4. вы не любите / не умеете жить по распорядку;
  5. вы не готовы изучить Python до уровня написания скриптов.

Про что вы будете слушать:

  • Основы предобработки текста;
  • Предпосылки компьютерной лингвистики и специальные темы лингвистики;
  • Морфанализ;
  • Классификация и кластеризация текстов, тематическое моделирование;
  • Дистрибутивная семантика и word-embeddings;
  • Языковые модели;
  • Машинный перевод и трансформеры;
  • Графовые модели обработки текста;
  • Клиническая лингвистика;
  • Извлечение именованных сущностей;
  • Распознание текста из аудио;
  • Диалоговые системы;

Чему вы научитесь:

  • составлять pipeline для анализа текста на естественном языке.
  • подготавливать корпус текстов для анализа.
  • строить собственные языковые модели.
  • выбирать подходящую модель и алгоритм для вашей задачи.
  • освоите на практике то, о чем вам будут рассказывать лекторы.

Чувакин Сергей директор

http://vk.com/sergechuvakin

skype: chuvakin001

telegram: @sergechuvakin

8-962-858-85-58
Заковоротная Евгения коодинатор

http://vk.com/pozyvnoyjeka

telegram: @eugegenius


Елизавета Кожанова координатор

http://vk.com/gunguard

telegram: @gunguard


Мария Маслова куратор

http://vk.com/hesitantshade

telegram: @arstotrix


Где ещё в Интернете
http://vk.com/lsh_mltexts
instagram: @ml_and_texts



Партнёры

Благотворительный фонд "Подсолнух" Фонд оказывает помощь детям с аутоиммунными заболеваниями. Контактное лицо: Керима Керимова, kerima.kerimova@fondpodsolnuh.ru
ddecision.ai Стартап, внедряющий языковые технологии. Контактное лицо: Екатерина Артемова, e.artemova@ddecisions.ai

Основная программа

1) Особенности программирования на Python и R
1.1) Введение в NLP: что это такое, какие задачи решает, зачем это бизнесу и науке
2) Предпосылки компьютерной лингвистики
3) Обработка сырых текстов
4) Морфанализ
5) Классификация текстов: рубрикаторы, анализ тональности
6) Продвинутое тематическое моделирование
7) Приглашение в глубокое обучение, основные библиотеки и приницпы
8) Семантическое представление слов и документов
9) Обработка текстов в Китайском языке
10) Графовое представление текстов
11) Языковые модели
12) Машинный перевод, трансформеры
13) Основы лингвистики
14) Клиническая лингвистика
15) Изввлечение именнованных сущностей
16) Распознание текста из аудио (speech recognition)
17) Анализ текстов в фармакалогии и медицине
18) Задание для самостоятельного применения новых навыков
19) диалоговые системы
20) специальные темы

Даты проведения

2-4 циклы: с 16 июля по 31 июля

Возрастные ограничения
от 18 лет
Кого ищут
Филологи-инженеры, умеющие крутить водопроводные гайки