Tuyển dụng MLOPS ENGINEER (AI Infrastructure)
Tuyển dụng MLOps Engineer tại Trivita AI, phụ trách hạ tầng AI, triển khai LLM, tối ưu GPU và xây dựng pipeline MLOps.

Mô tả công việc
- Triển khai và vận hành các hệ thống phục vụ LLM (vLLM, TGI, Triton), tối ưu inference bằng các kỹ thuật như PagedAttention, quantization
- Xây dựng và quản lý hạ tầng GPU, triển khai cấu hình NVIDIA MIG để tối ưu tài nguyên
- Thiết kế và phát triển pipeline CI/CD cho machine learning, bao gồm testing, deployment và versioning model
- Xây dựng hệ thống monitoring cho GPU, latency, throughput và model drift
- Thiết kế cơ chế auto-scaling cho workload AI trên Kubernetes
- Phối hợp với Backend Developer và AI Researcher để tích hợp model vào hệ thống sản phẩm
Yêu cầu kỹ thuật
- Thành thạo Docker và Kubernetes (bao gồm GPU operator và scheduling)
- Hiểu rõ kiến trúc GPU NVIDIA và có kinh nghiệm với MIG
- Thành thạo Python và shell scripting
- Có kinh nghiệm với framework ML như PyTorch hoặc TensorFlow
- Kinh nghiệm với các công cụ MLOps (Kubeflow, MLflow, Weights & Biases)
- Có kinh nghiệm với cloud (AWS, GCP)
- Có kiến thức backend (Java hoặc Go) là lợi thế
Yêu cầu kinh nghiệm
- Tối thiểu 3 năm kinh nghiệm trong MLOps, DevOps hoặc SRE
- Có kinh nghiệm vận hành hệ thống AI/ML production
- Tốt nghiệp ngành Khoa học máy tính, Công nghệ thông tin hoặc liên quan
Quyền lợi
- Làm việc với hệ thống AI và hạ tầng GPU hiện đại
- Tham gia bảo hiểm xã hội trên full lương
- Được trang bị MacBook và tài nguyên GPU
- Môi trường làm việc hiện đại
- Có các tiện ích như hồ bơi, phòng gym, bàn bóng bàn
Thông tin liên hệ
- Địa điểm: Số 01, đường số 104, khu phố 3, phường Bình Trưng, Thành phố Hồ Chí Minh
- Điện thoại: 0909797699
- Email: hr@trivita.ai