Обязанности: EDA датасета MovieLens 100K, анализ распределения рейтингов, топ фильмы и жанры, визуализация user-item матрицы, исследование cold-start проблемы, Jupyter ноутбук с выводами. Навыки: Python, pandas, matplotlib, seaborn, Jupyter.
Открытые роли
4 ролей ждут участников
Computer Vision-инженер
Классификатор изображений с Transfer LearningОбязанности: fine-tuning EfficientNet-B0 (timm) на датасете Flowers Recognition, настройка аугментаций (albumentations), анализ confusion matrix, экспорт модели в ONNX, базовая Grad-CAM визуализация. Навыки: Python, PyTorch, timm, albumentations, ONNX.
Data Scientist
Детектор токсичных комментариевОбязанности: EDA датасета Russian Toxic Comments, предобработка текста (очистка, нормализация), аугментация (back-translation, synonym replacement), визуализация распределений. Навыки: Python, pandas, matplotlib, seaborn, nltk.
Обязанности: fine-tuning BERT/ruDistilBERT на бинарную классификацию токсичности, работа с дисбалансом классов (oversampling, class_weight), оценка F1-macro, ROC-AUC, анализ ошибок модели. Навыки: Python, HuggingFace Transformers, sklearn, imbalanced-learn.