Лекция №4 "Генерация и отбор признаков"
Четвертое занятие на курсе «Нейронные сети и их применение в научных исследованиях» для восьмого потока обучения. Преподаватель: Никита Беляков Дата: 30.10.2024 00:00 Заставка 01:12 Проблемы при работе с реальными данными 06:31 Дисбаланс классов 14:39 Обнаружение аномалий 21:11 Кластеризация 22:35 Алгоритм K-Means 26:08 Алгоритм DBSCAN 30:57 Кодирование признаков 32:59 Типы признаков 36:27 Преобразования признаков 59:42 Разведочный анализ данных 01:00:12 Описательные статистики 01:03:27 Взаимодействие признаков 01:18:18 Анализ категориальных признаков 01:11:50 Генерация признаков 01:14:26 Baseline 01:18:34 Генерация признаков, полученных при помощи другой модели 01:27:09 Отбор признаков 01:27:16 Зачем отбирать признаки 01:28:13 Полный перебор 01:29:04 Одномерный отбор признаков 01:34:22 Отбор признаков на основе моделей 01:39:15 Randomization/Permutation 01:42:29 Boruta 01:46:35 Жадный отбор признаков 01:53:18 Рекомендации по отбору признаков 01:54:33 Задача понижения размерности 01:55:59 Manifold assumption 01:57:07 PCA (Метод главных компонент) 02:09:55 Kernel PCA (нелинейный) метод главных компонент 02:12:23 t-SNE (t-distributed Stochastic Neighbor Embedding) 02:18:11 UMAP Материалы лекции: Открыть в Colab: https://colab.research.google.com/drive/1vy0LIhb-0nLH4mErFmElm7Q615ylpMWB Открыть в HTML-формате: https://msu.ai/feature_engineering_notebook_new Сайт: https://msu.ai VK: https://vk.com/msu_ai Telegram: https://t.me/msu_ai_channel Лекция на Rutube: Лекция в VK видео: #MSU_AI#Фонд_Интеллект