Классификатор тональности отзывов
Описание
Учебный ML-проект: классификация тональности отзывов покупателей на русском языке (позитив / негатив / нейтраль). В основе — датасет русскоязычных отзывов с Kaggle (Russian Product Reviews). Обучаем ruBERT через HuggingFace Transformers, оборачиваем модель в FastAPI-сервис, деплоим через Docker. GitHub Actions гоняет линтер, тесты и сборку Docker-образа при каждом пуше. Идеальный стартовый NLP-пет-проект: реальные данные, современный стек, работающий CI/CD.
Роли (4)
ML-инженер
открытаОбязанности: обучение ruBERT через HuggingFace Transformers, настройка датапайплайна, подбор гиперпараметров, оценка F1/confusion matrix, экспорт модели. Навыки: Python, PyTorch, HuggingFace, pandas, sklearn.
Backend-разработчик (FastAPI)
открытаОбязанности: разработка REST API-сервиса для инференса модели, схемы данных Pydantic, эндпоинты predict/health, unit-тесты с pytest. Навыки: Python, FastAPI, Pydantic, pytest, REST API.
MLOps-инженер
открытаОбязанности: написание Dockerfile для ML-сервиса, настройка GitHub Actions (lint, test, docker build & push), оркестрация деплоя, мониторинг latency и error rate. Навыки: Docker, GitHub Actions, CI/CD, bash scripting.
Технический писатель
открытаОбязанности: написание README с инструкцией по запуску, Jupyter ноутбук с EDA и объяснением архитектуры модели, документация API через Swagger/OpenAPI. Навыки: Markdown, Jupyter, техническое письмо, базовый Python.
Участники (0)
Пока только создатель.
Апдейты (0)
Апдейтов ещё нет.
Комментарии (0)
Войдите, чтобы оставить комментарий