Обязанности: fine-tune bert-base-multilingual-cased через HuggingFace Trainer на NER задачу с BIO разметкой, вычисление seqeval метрик (precision/recall/F1 per entity), анализ ошибок модели. Навыки: Python, HuggingFace Transformers, token classification, seqeval.
Открытые роли
6 ролей ждут участников
Обязанности: скачивание и структурирование датасета, написание Dataset-класса PyTorch, реализация train/val/test split со стратификацией, data augmentation пайплайн. Навыки: Python, PyTorch Dataset, torchvision, pandas.
Frontend-разработчик (Streamlit)
Классификатор изображений с Transfer LearningОбязанности: Streamlit-приложение с drag&drop загрузкой изображения, отображение топ-5 предсказаний с вероятностями и Grad-CAM тепловой картой. Навыки: Python, Streamlit, PIL/OpenCV.
Computer Vision-инженер
Классификатор изображений с Transfer LearningОбязанности: fine-tuning EfficientNet-B0 (timm) на датасете Flowers Recognition, настройка аугментаций (albumentations), анализ confusion matrix, экспорт модели в ONNX, базовая Grad-CAM визуализация. Навыки: Python, PyTorch, timm, albumentations, ONNX.
Data Scientist
Детектор токсичных комментариевОбязанности: EDA датасета Russian Toxic Comments, предобработка текста (очистка, нормализация), аугментация (back-translation, synonym replacement), визуализация распределений. Навыки: Python, pandas, matplotlib, seaborn, nltk.
Обязанности: обучение ruBERT через HuggingFace Transformers, настройка датапайплайна, подбор гиперпараметров, оценка F1/confusion matrix, экспорт модели. Навыки: Python, PyTorch, HuggingFace, pandas, sklearn.