Обязанности: Dockerfile, GitHub Actions (lint, pytest, docker build), кэширование весов модели в образе, health-check endpoint, мониторинг latency. Навыки: Docker, GitHub Actions, bash, CI/CD.
Открытые роли
12 ролей ждут участников
Обязанности: разметка дополнительных примеров по инструкции BIO, контроль качества аннотаций (inter-annotator agreement), подготовка аннотационных гайдлайнов для команды. Навыки: понимание NER задачи, внимательность, базовый Python для проверки разметки.
Обязанности: fine-tune bert-base-multilingual-cased через HuggingFace Trainer на NER задачу с BIO разметкой, вычисление seqeval метрик (precision/recall/F1 per entity), анализ ошибок модели. Навыки: Python, HuggingFace Transformers, token classification, seqeval.
Обязанности: EDA датасета MovieLens 100K, анализ распределения рейтингов, топ фильмы и жанры, визуализация user-item матрицы, исследование cold-start проблемы, Jupyter ноутбук с выводами. Навыки: Python, pandas, matplotlib, seaborn, Jupyter.
Обязанности: реализация SVD коллаборативной фильтрации через библиотеку Surprise, TF-IDF контентной фильтрации, оценка RMSE/MAE/Precision@K, анализ cold-start проблемы и стратегий решения. Навыки: Python, Surprise, scikit-learn, pandas, numpy.
Обязанности: скачивание и структурирование датасета, написание Dataset-класса PyTorch, реализация train/val/test split со стратификацией, data augmentation пайплайн. Навыки: Python, PyTorch Dataset, torchvision, pandas.
Обязанности: мульти-стадийный Dockerfile для оптимизации размера образа, GitHub Actions (flake8, pytest, docker build), версионирование модели через DVC или HuggingFace Hub. Навыки: Docker, GitHub Actions, DVC, bash.
Обязанности: Dockerfile с кэшированием весов модели при сборке, GitHub Actions пайплайн (lint, test, build), оптимизация холодного старта приложения. Навыки: Docker, GitHub Actions, bash, Python.
Data Scientist
Детектор токсичных комментариевОбязанности: EDA датасета Russian Toxic Comments, предобработка текста (очистка, нормализация), аугментация (back-translation, synonym replacement), визуализация распределений. Навыки: Python, pandas, matplotlib, seaborn, nltk.
Обязанности: fine-tuning BERT/ruDistilBERT на бинарную классификацию токсичности, работа с дисбалансом классов (oversampling, class_weight), оценка F1-macro, ROC-AUC, анализ ошибок модели. Навыки: Python, HuggingFace Transformers, sklearn, imbalanced-learn.
Технический писатель
Классификатор тональности отзывовОбязанности: написание README с инструкцией по запуску, Jupyter ноутбук с EDA и объяснением архитектуры модели, документация API через Swagger/OpenAPI. Навыки: Markdown, Jupyter, техническое письмо, базовый Python.
Обязанности: написание Dockerfile для ML-сервиса, настройка GitHub Actions (lint, test, docker build & push), оркестрация деплоя, мониторинг latency и error rate. Навыки: Docker, GitHub Actions, CI/CD, bash scripting.