Обязанности: EDA датасета MovieLens 100K, анализ распределения рейтингов, топ фильмы и жанры, визуализация user-item матрицы, исследование cold-start проблемы, Jupyter ноутбук с выводами. Навыки: Python, pandas, matplotlib, seaborn, Jupyter.
Открытые роли
4 ролей ждут участников
annotationastrobackendci-cdclassificationcomputer-visiondata-analysisdata-engineeringdata-labelingdockerdocumentationdvcedafastapifigmafrontendgithub-actionsgradiohuggingfacejavascriptjupytermarkdownmlopsnernlpopencvpandaspythonpytorchrecommender-systemsrest-apiscikit-learnstreamlitsummarizationt5timmtypescriptuser interfacevisualizationweb designсбросить
Поделиться:Telegram
Обязанности: реализация SVD коллаборативной фильтрации через библиотеку Surprise, TF-IDF контентной фильтрации, оценка RMSE/MAE/Precision@K, анализ cold-start проблемы и стратегий решения. Навыки: Python, Surprise, scikit-learn, pandas, numpy.
Поделиться:Telegram
Обязанности: скачивание и структурирование датасета, написание Dataset-класса PyTorch, реализация train/val/test split со стратификацией, data augmentation пайплайн. Навыки: Python, PyTorch Dataset, torchvision, pandas.
Поделиться:Telegram
Data Scientist
Детектор токсичных комментариевОбязанности: EDA датасета Russian Toxic Comments, предобработка текста (очистка, нормализация), аугментация (back-translation, synonym replacement), визуализация распределений. Навыки: Python, pandas, matplotlib, seaborn, nltk.
Поделиться:Telegram