Un Playground per LLM da zero
- Raccolta e pulizia dati (RefinedWeb, FineWeb, Common Crawl)
- Tokenizzazione, architettura Transformer (GPT, Qwen, DeepSeek, Gemma)
- Generazione: greedy, beam, top-k, top-p
- Post-training: SFT, RLHF, PPO, reward model
- Valutazione: benchmark, leaderboard, human eval