01 · O nás
Plnostavový AI lab pre firmy, ktoré chcú výsledky.
brch je nezávislý tím výskumníkov a inžinierov. Berieme zodpovednosť za celý pipeline — od dát po server, ktorý práve teraz tíško robí svoju prácu.
02 · Prístup
Veríme, že najlepšie AI je nudné AI.
Predvídateľné. Merateľné. Lacné na prevádzku. Vie vysvetliť, čo robí, a nezlyhá v nedeľu večer iným spôsobom, ako zlyhalo v pondelok ráno.
Demá sú jednoduché. Produkčné AI je ťažké. Spája v sebe pravdepodobnostné modely, deterministický kód a ľudské očakávania — a všetky tri treba ovládať naraz.
Preto pracujeme v malom tíme s malým počtom projektov. Menej meetingov, viac kódu, viac evaluácie, viac trpezlivosti.
03 · Služby
Čo robíme.
Šesť oblastí, ktorým sa venujeme. Najradšej naraz, ale berieme aj jednotlivé.
AI produktové inžinierstvo.
Web aj natívne aplikácie postavené okolo modelu. Eval slučky, agentové workflow, retry & fallback stratégie.
Fine-tuning a evaluácia.
LoRA, full FT, distilácia. Eval benchmarky šité na vašu doménu.
GPU servery a inferenčný stack.
vLLM, llama.cpp, TGI. Vlastné aj cloudové. Observability, autoscaling, on-call.
Dátové pipeliny a RAG.
ETL, indexovanie, embedding stratégie, hybrid search, reranking, vyhodnotenie pamäte.
Guardrails a bezpečnosť.
Klasifikátory, red-teaming, prompt injection, audit logy. Tak, aby išli k regulátorovi bez prepisovania.
Technické poradenstvo.
Architektúra, audity, druhý názor pre interné tímy. Aj na pol úväzku, aj raz mesačne.
04 · Postup
Ako pracujeme.
Krátke meetingy, dlhé záväzky. Týždenné iterácie s eval metrikami, ktoré sa dajú obhájiť.
-
Rozhovor
Hodina alebo dve. Bez záväzkov. Zistíme, či sme pre váš problém správni.
-
Týždenné iterácie
Buildujeme v krátkych slučkách. Každý týždeň nasadená verzia, čerstvé eval metriky a jeden krátky catch-up.
-
Prevádzka
Po štarte zostávame. Monitoring, on-call, postupné zlepšovanie. Nie odovzdanie do prázdna.
05 · Nástroje
S čím staviame.
Zrelé. Dobre zdokumentované. Takmer nudné.
- PyTorch
- OpenAI
- Anthropic
- Ollama
- vLLM
- llama.cpp
- DSPy
- PostgreSQL
- Qdrant
- TypeScript
- Python
- Go
- LiteLLM
- FastAPI
- Redis
- AWS
- GCP
- Azure