ML&texts

О мастерской

Друзья.
Сегодня поисковые системы, чат-боты, вычисление эмоций и фейк-news давно потеряли статус фантазий. Это реальные вещи,построенные на хитрых и относительно нехитрых технологиях. С их помощью компьютер учится понимать человеческий язык. Вычисление контекста, семантический анализ, машинный перевод — все эти хайповые и востребованные направления мира IT и анализа данных, составляют часть большой и прекрасной сферы Natural Language Processing (Автоматической обработки естественного языка). Именно с ней и будем вас знакомить мы — мастерская Ml&texts.

И все это — на берегу Волги, где свежий воздух, палатки, вкусная еда, вечерние костры, теплая атмосфера и душевные компании.

Так что, приехать к нам, в ML&texts на Летнюю школу — отличный способ провести с пользой и отдыхом последние пару недель июля. Будет много работы, готовьтесь:).

На ML&texts вы сможете:

  • познакомиться с современными методами обработки текстов;
  • узнать про сложные алгоритмы машинного обучения без углубления в продвинутую математику;
  • приобрести практический опыт, создав сложную и полезную программу на языке Python;
  • помочь нашим партнерам в решениее реальных задач.
  • понять, причем здесь классическая лингвистика.

Кого ищем:

  1. вам 18 +;
  2. вы не боитесь дикой природы и не страшитесь двухнедельной жизни в палатке;
  3. вы умеете работать в команде;
  4. вы с уважением относитесь к другим людям и личному пространству других людей;
  5. вы обладаете базовыми навыками программирования Python. В понятие “базовые знания” входят:

    • знание циклов и условных операторов;

    • умение написать свою функцию;

    • понимание устройства классов;

    • работа со строками и регулярными выражениями;

    • знать что такое pipeline в машинном обучении, знакомство с базовыми методами визуализации, понимание принципов работы классификаторов, кластеризаторов;

P.S.

Будет здорово, если вы освежите знания по МатАнализу и Линейной Алгебре. А именно, вам пригодится понимание, что такое матрицы, скалярное умножение, косинусное расстояние между векторами, производная, частная производная и производная сложной функции. Кроме этого, если python для вас новый язык, то освежите свои знания здесь или здесь или здесь.

P.P.S.

Основной язык, который будет использоваться на школе — Python.

Кого мы не ждем:

  1. вы хотите узнать про нейролингвистическое программирование (тоже NLP);
  2. вам тяжело жить на природе в палатке;
  3. вам тяжело находить общий язык с другими людьми. Поверьте, это может стать серьезной проблемой;
  4. вы не любите / не умеете жить по распорядку;
  5. вы не готовы изучить Python до уровня написания скриптов.

Про что вы будете слушать:

  • Основы предобработки текста;
  • Предпосылки компьютерной лингвистики и специальные темы лингвистики;
  • Морфанализ;
  • Классификация и кластеризация текстов, тематическое моделирование;
  • Дистрибутивная семантика и word-embeddings;
  • Языковые модели;
  • Машинный перевод и трансформеры;
  • Графовые модели обработки текста;
  • Клиническая лингвистика;
  • Извлечение именованных сущностей;
  • Диалоговые системы;

Чему вы научитесь:

  • составлять pipeline для анализа текста на естественном языке.
  • подготавливать корпус текстов для анализа.
  • выбирать подходящую модель и алгоритм для вашей задачи.
  • освоите на практике то, о чем вам будут рассказывать лекторы.

    А ниже можете послушать наш подкаст:

Почта по всем вопросам


Чувакин Сергей директор

http://vk.com/sergechuvakin

skype: chuvakin001

telegram: @sergechuvakin

8-962-858-85-58
Заковоротная Евгения координатор

http://vk.com/pozyvnoyjeka

telegram: @eugegenius


Елизавета Кожанова координатор

http://vk.com/gunguard

telegram: @gunguard


Мария Маслова куратор

http://vk.com/hesitantshade

telegram: @arstotrix


Почта по всем вопросам

Где ещё в Интернете
http://vk.com/lsh_mltexts
instagram: @ml_and_texts



Партнёры

Новая Газета Независимое журналисткое издание

Основная программа

1) Общее введение: Python, ML, NLP
2) Предпосылки компьютерной лингвистики
3) Обработка сырых текстов
4) Морфанализ
5) Классификация текстов
6) Введение в глубокое обучение
7) Семантическое представление слов и документов
8) Языковые модели
9) Машинный перевод
10) Трансформеры
11) Лингвистические темы
12) Клиническая лингвистика
13) Изввлечение именнованных сущностей
14) Диалоговые системы
15) Хакатон

Даты проведения

3-5 циклы: с 20 июля по 4 августа

Возрастные ограничения
от 18 лет
Кого ищут
Филологи-инженеры, умеющие крутить водопроводные гайки