Обязанности: скачивание и структурирование датасета, написание Dataset-класса PyTorch, реализация train/val/test split со стратификацией, data augmentation пайплайн. Навыки: Python, PyTorch Dataset, torchvision, pandas.
Поделиться:Telegram
3 ролей ждут участников
Обязанности: скачивание и структурирование датасета, написание Dataset-класса PyTorch, реализация train/val/test split со стратификацией, data augmentation пайплайн. Навыки: Python, PyTorch Dataset, torchvision, pandas.
Обязанности: EDA датасета Russian Toxic Comments, предобработка текста (очистка, нормализация), аугментация (back-translation, synonym replacement), визуализация распределений. Навыки: Python, pandas, matplotlib, seaborn, nltk.
Обязанности: fine-tuning BERT/ruDistilBERT на бинарную классификацию токсичности, работа с дисбалансом классов (oversampling, class_weight), оценка F1-macro, ROC-AUC, анализ ошибок модели. Навыки: Python, HuggingFace Transformers, sklearn, imbalanced-learn.