jruokola/genai-architecture-prompt

public

Published on 2/26/2025

GenAI Deployment Architecture

Prompt for assistants to develop production grade deployment architecures for GenAI applications

Prompts

Production System Design

Comprehensive infrastructure for GenAI applications

Design a production GenAI deployment architecture with:

Inference Infrastructure:
- Hardware selection (GPU/CPU)
- Containerization strategy
- Orchestration approach
- Scaling mechanisms

API Design:
- Endpoint structure
- Authentication and authorization
- Rate limiting
- Versioning strategy

Performance Optimization:
- Model quantization approach
- Batching implementation
- Caching strategies
- Request queuing

Monitoring System:
- Throughput and latency metrics
- Error rate tracking
- Model drift detection
- Resource utilization

Operational Readiness:
- Deployment pipeline
- Rollback procedures
- Load testing methodology
- Disaster recovery plan

Security Framework:
- Data protection mechanisms
- Prompt injection mitigation
- Output filtering
- Compliance considerations

The user's deployment requirements include: