Kako instalirati DeepSeek-R1 na Linux server
DeepSeek-R1 je moćan model veštačke inteligencije otvorenog koda, dizajniran i optimizovan za složeno rezonovanje, kodiranje, matematiku i rešavanje problema. Izgrađen je na arhitekturi Mixture of Experts (MoE) i dinamički dodeljuje resurse različitim podmodelima koji se nazivaju stručnjaci. Ovaj pristup održava visoke performanse i poboljšava njegovu efikasnost. DeepSeek-R1 je idealan za istraživače i preduzeća koja žele da pronađu ravnotežu između optimizacije resursa i skalabilnosti.
Preduslovi
- Najmanje 16 GB RAM-a za manje modele (1,5B-7B).
- Za veće modele, najmanje 32 GB RAM-a.
- Najmanje 50 GB slobodnog prostora za manje modele i do 1 TB za veće verzije.
- (Opciono) NVIDIA GPU sa CUDA podrškom za ubrzane rezultate.
Zašto koristiti DeepSeek
Glavni razlozi za korišćenje DeepSeek-R1 uključuju:
- Efikasnost – MoE arhitektura minimizira korišćenje resursa. Idealna je za zadatke visokog protoka.
- Otvoreni kod – DeepSeek-R1 je slobodno dostupan za prilagođavanje i komercijalnu upotrebu.
- Svestranost – Model se ističe u kodiranju, matematici i zadacima rešavanja problema,
- Skalabilnost – Dostupan je kako za male, tako i za one ozbiljne serverske konfiguracije.
Arhitektura DeepSeek-R1 je njegova glavna karakteristika i ono što ga razlikuje od tradicionalnih modela , kao što su GPT-4, LLLaMA i slični.
Tradicionalni LLM-ovi koriste monolitne transformatore , što znači da su svi parametri aktivni za svaki upit. Čak i jednostavni zadaci postaju neefikasni jer zahtevaju veliku računarsku snagu i potrošnju memorije.
Arhitektura Ministarstva prosvete osporava ovaj pristup korišćenjem:
- Eksperti – Podmreže obučene za različite specijalizovane zadatke.
- Dinamička selekcija – Umesto aktiviranja celog modela za svaki upit, bira se najprikladniji „ekspert“ za zadatak.
- Redukcija parametara – Primenom redukcije parametara, DeepSeek-R1 dovodi do brže obrade i smanjenog korišćenja resursa.
Arhitektura ima za cilj da poboljša performanse upita i potrošnju resursa, a da pritom ostane tačna.
Kako instalirati DeepSeek-R1 na VPS server
Dole navedeni koraci pokazuju kako da instalirate DeepSeek-R1 na vaš VPS server. Proces uključuje podešavanje Ollama-e, preuzimanje modela i njegovo pokretanje. Takođe napisali smo i savete za optimizaciju performansi DeepSeek-a koji mogu pomoći u njegovom boljem funkcionisanju.
Potrebni resursi zavise od modela koji planirate da koristite. Tabela ispod prikazuje zahteve za prostor na disku, VRAM (GPU) i RAM (CPU) memoriju za svaki model:
| Model | Veličina modela | Prostor na disku | VRAM (GPU) | RAM (CPU) | Najbolje za |
|---|---|---|---|---|---|
| DeepSeek-R1-Distill-Qwen-1.5B | 1.5b | 1.1GB | ~3.5GB | ~7GB | Lični projekti i lagani zadaci. |
| DeepSeek-R1-Distill-Qwen-7B | 7b | 4.7GB | ~16GB | ~32GB | Razvoj veštačke inteligencije manjeg obima. |
| DeepSeek-R1-Distill-Llama-8B | 8b | 4.9GB | ~18GB | ~36GB | Umereno kodiranje i istraživanje. |
| DeepSeek-R1-Distill-Qwen-14B | 14b | 9GB | ~32GB | ~64GB | Napredno rešavanje problema. |
| DeepSeek-R1-Distill-Qwen-32B | 32b | 20GB | ~74 GB | ~148GB | AI radna opterećenja na enterprise nivou |
| DeepSeek-R1-Distill-Llama-70B | 70b | 43GB | ~161GB | ~322GB | AI aplikacije velikog obima |
| DeepSeek-R1 | 671b | 404GB | ~1342GB | ~2684GB | Klasteri sa više GPU jedinica i AI zahtevi visokih performansi |
671b je jedini nedestilovani DeepSeek-R1 model. Ostali modeli su destilovani radi boljih performansi na jednostavnijem serverskim konfiguracijama.
Za modele iznad 7b, razmotrite upotrebu sledećeg:
Grafičke kartice – NVIDIA modeli sa najmanje 24-40GB VRAM-a obezbediće glađe performanse.
Skladištenje – Koristite NVMe SSD diskove da biste sprečili sporo vreme učitavanja odgovora.
CPU – Izaberite CPU-ove sa većim brojem jezgara (kao što je Intel Xeon novijih generacija ) da biste mogli da obradite velike zahteve.
Kako instalirati Ollama
Olama je lagani framework koji pojednostavljuje instaliranje i korišćenje različitih LLM-ova. Da biste ga instalirali na Linux-u, otvorite terminal i pokrenite komandu:
curl -fsSL https://ollama.com/install.sh | sh

Nakon instalacije videćete poruku iznad, ovo znači da je Ollama uspešno instalirana.
Sada je potrebno da preuzmete tj. pulujete model DeepSeek-a pomoću Ollama, a to ćete uraditi sledećom komandom:
ollama pull deepseek-r1:[veličina]
Mi smo izabrali najmanju veličinu za potrebe ove instrukcije.
Nakon što se model preuzeo, u terminalu ćete videti sledeće:

Sada nakon što je model preuzet, možete pokrenuti isti komandom:
ollama run deepseek-r1:[size]

Možete poslati /? za pomoć u korišćenju, a da biste izašli koristite /bye.
Optimizacija performansi
Da biste poboljšali performanse, razmotrite sledeće stvari za optimizaciju:
- Detaljno logovanje. Dodajte argument –verbose da biste prikazali vreme odgovora i evaluacije. Na primer:
ollama run --verbose deepseek-r1:[model]
Kao što možete videti ispod, toliko je vremena trebalo sa dva vCPU-a da dobijemo odgovor na pitanje ko je on.

Upravo zbog ovoga savetujemo naše GPU VPS servere, jer će grafička kartica mnogo brže obraditi zahtev od CPU-a.
Kako podesiti web interfejs za DeepSeek-R1
Iznad ste mogli da vidite kako funkcioniše DeepSeek iz kozole, ali to je malo teže za korišćenje, a web interfejs pruža intuitivan i pristupačan način interakcije sa modelom. Web interfejs omogućava slanje poruka, pregled odgovora i prilagođavanje interakcija putem web pretraživača.
Za početak je potrebno da instaliramo Docker na server, te pokrećemo sledeće komande:
apt update
curl -fsSL https://get.docker.com | sh
Sada je potrebno da preuzmete šablon kontejnera za WebUI i Ollama koja će raditi takođe u kontejneru i to ćete uraditi sledećom komandom:
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

Kako pristupiti WebUI-ju
Da biste pristupili WebUI-ju, potrebno je da u pretraživaču odete na sledeću adresu:
http://IP-VAŠEG-SERVERA:3000
Kada se otvori ova stranica kliknite na Get started


Unesite podatke za vašeg korisnika i klikom na Create Admin Account ćete kreirati nalog i bićete automatski ulogovani.

Kada pristupite, videćete početnu stranicu, a da biste instalirali određeni model DeepSeek-a na vaš VPS server, potrebno je da kliknete na Select a model, a zatim upišite model koji želite preuzeti i kliknite na Pull deepseek-r1:1.5b from Ollama.com, te će preuzimanje početi.

Grafički će biti prikazan i sam proces preuzimanja, kao što možete videti

Nakon preuzimanja, model će biti izabran automatski, te ćete biti u mogućnosti da odmah počnete sa radom.

Možete videti kako on počinje da uči, te kada bude stvarno razumeo neku zanimljivost, on će je odmah predočiti u vidu odgovora.
Zaključak
U ovoj instrukciji ste mogli da naučite kako se podešava i testira DeepSeek-R1 na VPS serveru. Ovo je moćan model veštačke inteligencije koji se lako podešava pomoću Ollama-e. Takođe smo pokazali kako se podešava interaktivni korisnički web interfejs pomoću OpenWebUI-ja.
