Një chatbot biznesi nuk duhet të "shpikë" përgjigje. Ne ndërtojmë asistentë AI që përgjigjen vetëm nga dokumentet tuaja reale — manualet, politikat, çmimoret, FAQ-të — përmes RAG (retrieval-augmented generation). Asistenti gjen pjesët relevante, i citon, dhe kur nuk është i sigurt ose kërkesa kalon kufijtë, ia kalon bisedën një operatori njeri. E njëjta logjikë shërben në web, në WhatsApp ose brenda mjeteve tuaja të brendshme.
Përgjigje të bazuara te dokumentet tuaja (RAG)
Zemra e një asistenti të besueshëm është bazimi (grounding): modeli nuk përgjigjet nga "kujtesa" e tij, por nga dokumentet tuaja. I ndajmë dokumentet në copa, i kthejmë në vektorë dhe i ruajmë; në kohën e pyetjes kërkojmë copat më të afërta dhe ia japim modelit si kontekst. Nëse konteksti nuk e mbulon pyetjen, asistenti e thotë qartë në vend që të trillojë.
const queryVec = await embed(pyetja)
const copa = await vectorDb.search(queryVec, { topK: 5 })
// Pa kontekst të mjaftueshëm → mos trillo, kalo te njeriu
if (copa.length === 0 || copa[0].score < PRAGU) {
return eskalimTeNjeriu(pyetja)
}
const konteksti = copa
.map((c, i) => `[${i + 1}] ${c.text} (burimi: ${c.source})`)
.join('\n\n')
return model.generate({
system: 'Përgjigju VETËM nga konteksti. Cito burimin [n]. Nëse mungon, thuaj se s\'e di.',
prompt: `Konteksti:\n${konteksti}\n\nPyetja: ${pyetja}`,
})Citimet nuk janë vetëm zbukurim: ato e bëjnë përgjigjen të verifikueshme nga përdoruesi dhe nga ekipi juaj, dhe ulin ndjeshëm gabimet. Kur dokumentet ndryshojnë — p.sh. përditësohet një çmim ose një politikë — riindeksimi mban asistentin gjithmonë në linjë me të vërtetën aktuale.
Kanale, kufij sigurie dhe kalimi te njeriu
Të njëjtin asistent e lidhim me kanalet ku janë klientët tuaj — widget në web, WhatsApp Business ose mjetet e brendshme — pa rishkruar logjikën. Mbi këtë vendosim kufijtë (guardrails) që përcaktojnë çfarë lejohet, dhe rregullat e eskalimit kur biseda duhet të kalojë te një agjent njeri.
- Kanale: widget web, WhatsApp Business, ose brenda CRM/help-desk-ut ekzistues.
- Guardrails: temat e lejuara, ndalimi i këshillave jashtë fushës, filtra për gjuhë abuzive.
- Kalim te njeriu: kur besimi është i ulët, kur klienti e kërkon, ose për tema të ndjeshme (ankesa, çështje ligjore).
- Privatësia: minimizim dhe redaktim i të dhënave personale para se të dalin nga sistemi juaj.
- Vlerësime (evals): një grup pyetjesh reale me përgjigje të pritura, që i matim para çdo lëshimi.
Kalimi te njeriu projektohet që të jetë i butë: asistenti përmbledh bisedën, bashkëngjit kontekstin dhe burimet që gjeti, dhe ia dorëzon operatorit me një klik — pa e detyruar klientin të përsërisë gjithçka nga fillimi.
Raste përdorimi konkrete
Asistent shërbimi për klientët (RAG)
Përgjigjet 24/7 mbi FAQ-të, politikat e kthimit dhe statusin e porosive duke u bazuar te dokumentet tuaja, dhe kalon te një operator njeri për rastet komplekse ose të ndjeshme.
Integrim AI →Asistent i brendshëm i njohurive
Ekipi pyet me gjuhë të natyrshme mbi manualet, procedurat dhe dokumentacionin e brendshëm — me citime — në vend që të kërkojë nëpër dosje dhe email-e.
Si ndërtohet një zgjidhje me AI →