ML&texts
Пандемия коронавируса
Летняя школа меняет сроки и форматы проведения в 2020 году. Оргкомитет ЛШ принял решение перенести проведение сезона частично на конец лета, частично в онлайн и частично на следующий год.
Мы ещё не решили что будем делать, следите за нашими новостями и обновлениями на сайте и в социальных сетях.
О мастерской
Друзья.
Сегодня поисковые системы, чат-боты, вычисление эмоций и фейк-news давно потеряли статус фантазий. Это реальные вещи,построенные на хитрых и относительно нехитрых технологиях. С их помощью компьютер учится понимать человеческий язык. Вычисление контекста, семантический анализ, машинный перевод — все эти хайповые и востребованные направления мира IT и анализа данных, составляют часть большой и прекрасной сферы Natural Language Processing (Автоматической обработки естественного языка). Именно с ней и будем вас знакомить мы — мастерская Ml&texts.
И все это — на берегу Волги, где свежий воздух, палатки, вкусная еда, вечерние костры, теплая атмосфера и душевные компании.
Так что, приехать к нам, в ML&texts на Летнюю школу — отличный способ провести с пользой и отдыхом последние пару недель июля. Будет много работы, готовьтесь:).
На ML&texts вы сможете:
- познакомиться с современными методами обработки текстов;
- послушать топовых IT-специалистов, которые занимаются крутыми и необычными задачами;
- узнать про сложные алгоритмы машинного обучения без углубления в продвинутую математику;
- приобрести практический опыт, создав сложную и полезную программу на языке Python — голосового помощника или чат-бота;
- понять, причем здесь классическая лингвистика.
Кого ищем:
- вам 18 +;
- вы не боитесь дикой природы и не страшитесь двухнедельной жизни в палатке;
- вы умеете работать в команде;
- вы с уважением относитесь к другим людям и личному пространству других людей;
-
вы обладаете базовыми навыками программирования Python или R. В понятие “базовые знания” входят:
-
знание циклов и условных операторов;
- умение написать свою функцию;
- понимание таких терминов, как namespace, scopes, environmental variable;
- понимание устройства классов;
- работа со строками и регулярными выражениями;
- знать что такое pipeline в машинном обучении, знакомство с базовыми методами визуализации (matplotlib), понимание принципов работы классификаторов, кластеризаторов;
P.S.
Будет здорово, если вы освежите знания по МатАнализу и Линейной Алгебре. А именно, вам пригодится понимание, что такое матрицы, скалярное умножение, косинусное расстояние между векторами, производная, частная производная и производная сложной функции.
Кроме этого, если python для вас новый язык, то освежите свои знания здесь или здесь или здесь.
P.P.S.
Основной язык, который будет использоваться на школе — Python.
Кого мы не ждем:
- вы хотите узнать про нейролингвистическое программирование (тоже NLP);
- вам тяжело жить на природе в палатке;
- вам тяжело находить общий язык с другими людьми. Поверьте, это может стать серьезной проблемой;
- вы не любите / не умеете жить по распорядку;
- вы не готовы изучить Python до уровня написания скриптов.
Про что вы будете слушать:
- Основы предобработки текста;
- Предпосылки компьютерной лингвистики и специальные темы лингвистики;
- Морфанализ;
- Классификация и кластеризация текстов, тематическое моделирование;
- Дистрибутивная семантика и word-embeddings;
- Языковые модели;
- Машинный перевод и трансформеры;
- Графовые модели обработки текста;
- Клиническая лингвистика;
- Извлечение именованных сущностей;
- Распознание текста из аудио;
- Диалоговые системы;
Чему вы научитесь:
- составлять pipeline для анализа текста на естественном языке.
- подготавливать корпус текстов для анализа.
- строить собственные языковые модели.
- выбирать подходящую модель и алгоритм для вашей задачи.
- освоите на практике то, о чем вам будут рассказывать лекторы.
А ниже можете послушать наш подкаст: