Обязанности: разметка дополнительных примеров по инструкции BIO, контроль качества аннотаций (inter-annotator agreement), подготовка аннотационных гайдлайнов для команды. Навыки: понимание NER задачи, внимательность, базовый Python для проверки разметки.
Открытые роли
4 ролей ждут участников
annotationastrobackendci-cdclassificationcomputer-visiondata-analysisdata-engineeringdata-labelingdockerdocumentationdvcedafastapifigmafrontendgithub-actionsgradiohuggingfacejavascriptjupytermarkdownmlopsnernlpopencvpandaspythonpytorchrecommender-systemsrest-apiscikit-learnstreamlitsummarizationt5timmtypescriptuser interfacevisualizationweb designсбросить
Поделиться:Telegram
Frontend-разработчик (Gradio)
Детектор токсичных комментариевОбязанности: разработка Gradio-интерфейса для демо-режима модели, создание примеров для тестирования, обёртка модели в удобный UI, базовая стилизация. Навыки: Python, Gradio, базовый HTML/CSS.
Поделиться:Telegram
Data Scientist
Детектор токсичных комментариевОбязанности: EDA датасета Russian Toxic Comments, предобработка текста (очистка, нормализация), аугментация (back-translation, synonym replacement), визуализация распределений. Навыки: Python, pandas, matplotlib, seaborn, nltk.
Поделиться:Telegram
Обязанности: fine-tuning BERT/ruDistilBERT на бинарную классификацию токсичности, работа с дисбалансом классов (oversampling, class_weight), оценка F1-macro, ROC-AUC, анализ ошибок модели. Навыки: Python, HuggingFace Transformers, sklearn, imbalanced-learn.
Поделиться:Telegram