Frontend Developer
NoteGenProject support and configuration, maintaining code purity and correcting security errors
18 ролей ждут участников
Project support and configuration, maintaining code purity and correcting security errors
Обязанности: FastAPI-сервис для NER инференса, структурированный JSON ответ с сущностями и offset, batch inference endpoint, тесты с pytest. Навыки: Python, FastAPI, Pydantic, pytest.
Обязанности: разметка дополнительных примеров по инструкции BIO, контроль качества аннотаций (inter-annotator agreement), подготовка аннотационных гайдлайнов для команды. Навыки: понимание NER задачи, внимательность, базовый Python для проверки разметки.
Обязанности: fine-tune bert-base-multilingual-cased через HuggingFace Trainer на NER задачу с BIO разметкой, вычисление seqeval метрик (precision/recall/F1 per entity), анализ ошибок модели. Навыки: Python, HuggingFace Transformers, token classification, seqeval.
Обязанности: EDA датасета MovieLens 100K, анализ распределения рейтингов, топ фильмы и жанры, визуализация user-item матрицы, исследование cold-start проблемы, Jupyter ноутбук с выводами. Навыки: Python, pandas, matplotlib, seaborn, Jupyter.
Обязанности: FastAPI endpoints для получения рекомендаций по user_id и item_id, кэширование предсказаний через functools.lru_cache, Pydantic схемы, swagger документация. Навыки: Python, FastAPI, Pydantic, REST API, кэширование.
Обязанности: реализация SVD коллаборативной фильтрации через библиотеку Surprise, TF-IDF контентной фильтрации, оценка RMSE/MAE/Precision@K, анализ cold-start проблемы и стратегий решения. Навыки: Python, Surprise, scikit-learn, pandas, numpy.
Обязанности: скачивание и структурирование датасета, написание Dataset-класса PyTorch, реализация train/val/test split со стратификацией, data augmentation пайплайн. Навыки: Python, PyTorch Dataset, torchvision, pandas.
Обязанности: Streamlit-приложение с drag&drop загрузкой изображения, отображение топ-5 предсказаний с вероятностями и Grad-CAM тепловой картой. Навыки: Python, Streamlit, PIL/OpenCV.
Обязанности: fine-tuning EfficientNet-B0 (timm) на датасете Flowers Recognition, настройка аугментаций (albumentations), анализ confusion matrix, экспорт модели в ONNX, базовая Grad-CAM визуализация. Навыки: Python, PyTorch, timm, albumentations, ONNX.
Обязанности: создание Streamlit-приложения с текстовым вводом и кнопкой суммаризации, отображение результата, обработка ошибок и edge cases, деплой на Streamlit Cloud или Docker. Навыки: Python, Streamlit, базовый UX/UI.
Обязанности: загрузка и настройка модели ruT5 (IlyaGusev/rut5_base_sum_gazeta), эксперименты с параметрами генерации (beam search, temperature, top-k/p), оценка качества через ROUGE-1/2/L метрики. Навыки: Python, HuggingFace Transformers, seq2seq, ROUGE.
Обязанности: разработка Gradio-интерфейса для демо-режима модели, создание примеров для тестирования, обёртка модели в удобный UI, базовая стилизация. Навыки: Python, Gradio, базовый HTML/CSS.
Обязанности: EDA датасета Russian Toxic Comments, предобработка текста (очистка, нормализация), аугментация (back-translation, synonym replacement), визуализация распределений. Навыки: Python, pandas, matplotlib, seaborn, nltk.
Обязанности: fine-tuning BERT/ruDistilBERT на бинарную классификацию токсичности, работа с дисбалансом классов (oversampling, class_weight), оценка F1-macro, ROC-AUC, анализ ошибок модели. Навыки: Python, HuggingFace Transformers, sklearn, imbalanced-learn.
Обязанности: разработка REST API-сервиса для инференса модели, схемы данных Pydantic, эндпоинты predict/health, unit-тесты с pytest. Навыки: Python, FastAPI, Pydantic, pytest, REST API.
Обязанности: обучение ruBERT через HuggingFace Transformers, настройка датапайплайна, подбор гиперпараметров, оценка F1/confusion matrix, экспорт модели. Навыки: Python, PyTorch, HuggingFace, pandas, sklearn.
responsible for developing, extending, and maintaining the implementation