From 5c050b2443fd5a2ca62580d0ec77f2da68be6d34 Mon Sep 17 00:00:00 2001 From: spham Date: Sun, 14 Sep 2025 00:00:44 +0200 Subject: [PATCH] wip --- README.md | 2 +- docs/01_architecture.md | 72 +++++++++++++++++++++-------------------- 2 files changed, 38 insertions(+), 36 deletions(-) diff --git a/README.md b/README.md index 255adb9..945a3ee 100644 --- a/README.md +++ b/README.md @@ -1,6 +1,6 @@ # Infrastructure IA Production-Ready avec Hetzner -> πŸš€ Stack complΓ¨te pour dΓ©ployer une infrastructure IA/ML sur Hetzner avec GitLab CI/CD et Ansible +> πŸš€ Stack complΓ¨te pour dΓ©ployer une infrastructure IA/ML sur Hetzner avec GitLab CI/CD, Terraform et Ansible [![Infrastructure Tests](https://img.shields.io/badge/pipeline-passing-brightgreen.svg)](https://img.shields.io/badge/tests-95%25-brightgreen) [![Cost Efficiency](https://img.shields.io/badge/Cost%20vs%20AWS-12x%20cheaper-green)](#-coΓ»ts-rΓ©els) diff --git a/docs/01_architecture.md b/docs/01_architecture.md index 671a64c..ba1db59 100644 --- a/docs/01_architecture.md +++ b/docs/01_architecture.md @@ -6,41 +6,43 @@ This document describes the architecture of the AI Infrastructure running on Het ## High-Level Architecture -``` -β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” -β”‚ Internet β”‚ -β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ - β”‚ - β”Œβ”€β”€β”€β”€β”€β”€β”€β–Όβ”€β”€β”€β”€β”€β”€β”€β” - β”‚ CloudFlare β”‚ (Optional CDN/DDoS protection) - β”‚ Proxy β”‚ - β””β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”˜ - β”‚ -β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β–Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” -β”‚ Hetzner Cloud β”‚ -β”‚ β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”‚ -β”‚ β”‚ HAProxy LB β”‚ β”‚ API Gateway β”‚ β”‚ Monitoring β”‚ β”‚ -β”‚ β”‚ (cx31) β”‚ β”‚ (cx31) β”‚ β”‚ (cx21) β”‚ β”‚ -β”‚ β”‚ 8CPU/32GB β”‚ β”‚ 8CPU/32GB β”‚ β”‚ 4CPU/16GB β”‚ β”‚ -β”‚ β”‚ €22.68/month β”‚ β”‚ €22.68/month β”‚ β”‚ €11.76/mo β”‚ β”‚ -β”‚ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β”‚ -β”‚ β”‚ β”‚ β”‚ β”‚ -β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”˜ - β”‚ β”‚ β”‚ - β”Œβ”€β”€β”€β”€β”€β–Όβ”€β”€β”€β”€β”€β” β”Œβ”€β”€β”€β”€β–Όβ”€β”€β”€β”€β” β”Œβ”€β”€β”€β”€β”€β–Όβ”€β”€β”€β”€β”€β” - β”‚ β”‚ β”‚ β”‚ β”‚ β”‚ - β”‚ GEX44 β”‚ β”‚ GEX44 β”‚ β”‚ GEX44 β”‚ - β”‚ #1 β”‚ β”‚ #2 β”‚ β”‚ #3 β”‚ - β”‚ β”‚ β”‚ β”‚ β”‚ β”‚ - β”‚ vLLM API β”‚ β”‚vLLM API β”‚ β”‚ vLLM API β”‚ - β”‚Mixtral-8x7β”‚ β”‚Llama-70Bβ”‚ β”‚CodeLlama β”‚ - │€184/month β”‚ │€184/mo β”‚ │€184/month β”‚ - β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ - β”‚ β”‚ β”‚ - β”Œβ”€β”€β”€β”€β–Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β–Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β–Όβ”€β”€β”€β”€β” - β”‚ Hetzner Private Network β”‚ - β”‚ (10.0.0.0/16 - VXLAN overlay) β”‚ - β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ +```mermaid +graph TB + Internet[Internet] + CF[CloudFlare Proxy
Optional CDN/DDoS protection] + + subgraph Cloud[Hetzner Cloud] + LB[HAProxy LB
cx31 - 8CPU/32GB
€22.68/month] + GW[API Gateway
cx31 - 8CPU/32GB
€22.68/month] + MON[Monitoring
cx21 - 4CPU/16GB
€11.76/month] + end + + subgraph Dedicated[Hetzner Dedicated Servers] + GEX1[GEX44 #1
vLLM API
Mixtral-8x7B
€184/month] + GEX2[GEX44 #2
vLLM API
Llama-70B
€184/month] + GEX3[GEX44 #3
vLLM API
CodeLlama
€184/month] + end + + PrivateNet[Hetzner Private Network
10.0.0.0/16 - VXLAN overlay] + + Internet --> CF + CF --> LB + LB --> GEX1 + LB --> GEX2 + LB --> GEX3 + GW --> GEX1 + GW --> GEX2 + GW --> GEX3 + MON --> GEX1 + MON --> GEX2 + MON --> GEX3 + + GEX1 -.-> PrivateNet + GEX2 -.-> PrivateNet + GEX3 -.-> PrivateNet + LB -.-> PrivateNet + GW -.-> PrivateNet + MON -.-> PrivateNet ``` ## Component Details