wip
This commit is contained in:
parent
c523abc8b4
commit
5c050b2443
@ -1,6 +1,6 @@
|
||||
# Infrastructure IA Production-Ready avec Hetzner
|
||||
|
||||
> 🚀 Stack complète pour déployer une infrastructure IA/ML sur Hetzner avec GitLab CI/CD et Ansible
|
||||
> 🚀 Stack complète pour déployer une infrastructure IA/ML sur Hetzner avec GitLab CI/CD, Terraform et Ansible
|
||||
|
||||
[](https://img.shields.io/badge/tests-95%25-brightgreen)
|
||||
[](#-coûts-réels)
|
||||
|
||||
@ -6,41 +6,43 @@ This document describes the architecture of the AI Infrastructure running on Het
|
||||
|
||||
## High-Level Architecture
|
||||
|
||||
```
|
||||
┌─────────────────────────────────────────────────────────────────┐
|
||||
│ Internet │
|
||||
└─────────────────────┬───────────────────────────────────────────┘
|
||||
│
|
||||
┌───────▼───────┐
|
||||
│ CloudFlare │ (Optional CDN/DDoS protection)
|
||||
│ Proxy │
|
||||
└───────┬───────┘
|
||||
│
|
||||
┌─────────────────────▼───────────────────────────────────────────┐
|
||||
│ Hetzner Cloud │
|
||||
│ ┌─────────────────┐ ┌─────────────────┐ ┌──────────────┐ │
|
||||
│ │ HAProxy LB │ │ API Gateway │ │ Monitoring │ │
|
||||
│ │ (cx31) │ │ (cx31) │ │ (cx21) │ │
|
||||
│ │ 8CPU/32GB │ │ 8CPU/32GB │ │ 4CPU/16GB │ │
|
||||
│ │ €22.68/month │ │ €22.68/month │ │ €11.76/mo │ │
|
||||
│ └─────────────────┘ └─────────────────┘ └──────────────┘ │
|
||||
│ │ │ │ │
|
||||
└──────────────┼───────────────────┼──────────────────────┼───────┘
|
||||
│ │ │
|
||||
┌─────▼─────┐ ┌────▼────┐ ┌─────▼─────┐
|
||||
│ │ │ │ │ │
|
||||
│ GEX44 │ │ GEX44 │ │ GEX44 │
|
||||
│ #1 │ │ #2 │ │ #3 │
|
||||
│ │ │ │ │ │
|
||||
│ vLLM API │ │vLLM API │ │ vLLM API │
|
||||
│Mixtral-8x7│ │Llama-70B│ │CodeLlama │
|
||||
│€184/month │ │€184/mo │ │€184/month │
|
||||
└───────────┘ └─────────┘ └───────────┘
|
||||
│ │ │
|
||||
┌────▼────────────────────▼─────────────────────▼────┐
|
||||
│ Hetzner Private Network │
|
||||
│ (10.0.0.0/16 - VXLAN overlay) │
|
||||
└─────────────────────────────────────────────────────┘
|
||||
```mermaid
|
||||
graph TB
|
||||
Internet[Internet]
|
||||
CF[CloudFlare Proxy<br/>Optional CDN/DDoS protection]
|
||||
|
||||
subgraph Cloud[Hetzner Cloud]
|
||||
LB[HAProxy LB<br/>cx31 - 8CPU/32GB<br/>€22.68/month]
|
||||
GW[API Gateway<br/>cx31 - 8CPU/32GB<br/>€22.68/month]
|
||||
MON[Monitoring<br/>cx21 - 4CPU/16GB<br/>€11.76/month]
|
||||
end
|
||||
|
||||
subgraph Dedicated[Hetzner Dedicated Servers]
|
||||
GEX1[GEX44 #1<br/>vLLM API<br/>Mixtral-8x7B<br/>€184/month]
|
||||
GEX2[GEX44 #2<br/>vLLM API<br/>Llama-70B<br/>€184/month]
|
||||
GEX3[GEX44 #3<br/>vLLM API<br/>CodeLlama<br/>€184/month]
|
||||
end
|
||||
|
||||
PrivateNet[Hetzner Private Network<br/>10.0.0.0/16 - VXLAN overlay]
|
||||
|
||||
Internet --> CF
|
||||
CF --> LB
|
||||
LB --> GEX1
|
||||
LB --> GEX2
|
||||
LB --> GEX3
|
||||
GW --> GEX1
|
||||
GW --> GEX2
|
||||
GW --> GEX3
|
||||
MON --> GEX1
|
||||
MON --> GEX2
|
||||
MON --> GEX3
|
||||
|
||||
GEX1 -.-> PrivateNet
|
||||
GEX2 -.-> PrivateNet
|
||||
GEX3 -.-> PrivateNet
|
||||
LB -.-> PrivateNet
|
||||
GW -.-> PrivateNet
|
||||
MON -.-> PrivateNet
|
||||
```
|
||||
|
||||
## Component Details
|
||||
|
||||
Loading…
x
Reference in New Issue
Block a user