Salvatore Sanfilippo rivoluziona l’AI ed io sono gasato (DS4 spiegato)
Simone Rizzo • 30.7K views • 1d ago
Description
Entra nella mia Accademia AI:https://www.rizzoaiacademy.com/
Vuoi sviluppare soluzioni AI avanzate: https://inferentia.xyz
IG: https://www.instagram.com/simorizzo_ai/
Salvatore Sanfilippo (antirez), il creatore di Redis, ha pubblicato DS4, un inference engine completamente nuovo pensato per eseguire DeepSeek 4 Flash in locale.
Repository (Lascia una Stella!):
https://github.com/antirez/ds4
Segui Salvatore su YT:
https://www.youtube.com/@antirez/videos
In questo video non facciamo una semplice demo: analizziamo come funziona internamente, le scelte architetturali, le ottimizzazioni che permettono di sfruttare al massimo l'hardware Apple Silicon e perché questo progetto potrebbe influenzare il futuro dell'inferenza locale.
Parliamo di:
- perché DS4 non vuole essere un'alternativa generica a llama.cpp
- KV Cache su SSD e gestione del contesto
- quantizzazione e ottimizzazioni specifiche per DeepSeek
- Metal, memoria unificata e performance
- filosofia progettuale di antirez
- perché questo progetto è importante per tutta la community AI open source
00:00 - Introduzione a Salvatore Sanfilippo (Antirez) e Darf Star
01:13 - Cos'è Darf Star e come ottimizza DeepSeek V4
03:33 - Il problema della memoria e i limiti dei modelli AI nei PC
09:04 - La quantizzazione dinamica e intelligente
11:12 - L'architettura Mixture of Experts (MoE) di DeepSeek
14:18 - Quantizzazione empirica basata sui dati
16:50 - Superare i limiti di RAM con l'SSD Streaming
21:50 - Gestione del contesto di input e salvataggio delle sessioni
23:04 - Le reali performance di Darf Star (Benchmark)
24:31 - Inferenza distribuita con più computer collegati
26:09 - Conclusioni, supporto al progetto e saluti
AI deepseek llm