Обязанности: EDA датасета MovieLens 100K, анализ распределения рейтингов, топ фильмы и жанры, визуализация user-item матрицы, исследование cold-start проблемы, Jupyter ноутбук с выводами. Навыки: Python, pandas, matplotlib, seaborn, Jupyter.
Открытые роли
6 ролей ждут участников
Обязанности: скачивание и структурирование датасета, написание Dataset-класса PyTorch, реализация train/val/test split со стратификацией, data augmentation пайплайн. Навыки: Python, PyTorch Dataset, torchvision, pandas.
Обязанности: мульти-стадийный Dockerfile для оптимизации размера образа, GitHub Actions (flake8, pytest, docker build), версионирование модели через DVC или HuggingFace Hub. Навыки: Docker, GitHub Actions, DVC, bash.
Computer Vision-инженер
Классификатор изображений с Transfer LearningОбязанности: fine-tuning EfficientNet-B0 (timm) на датасете Flowers Recognition, настройка аугментаций (albumentations), анализ confusion matrix, экспорт модели в ONNX, базовая Grad-CAM визуализация. Навыки: Python, PyTorch, timm, albumentations, ONNX.
Обязанности: загрузка и настройка модели ruT5 (IlyaGusev/rut5_base_sum_gazeta), эксперименты с параметрами генерации (beam search, temperature, top-k/p), оценка качества через ROUGE-1/2/L метрики. Навыки: Python, HuggingFace Transformers, seq2seq, ROUGE.
Обязанности: обучение ruBERT через HuggingFace Transformers, настройка датапайплайна, подбор гиперпараметров, оценка F1/confusion matrix, экспорт модели. Навыки: Python, PyTorch, HuggingFace, pandas, sklearn.