← Semua ageneval + keamanan
AI Audit
Audit otomatis yang menilai build RAG/LLM Anda pada metrik yang penting dan me-red-team cara-cara ia bisa gagal di produksi.
Apa yang dilakukannya
- Menilai faithfulness, answer relevancy, context precision & recall
- Me-red-team jailbreak, prompt injection, dan kebocoran PII
- Memetakan temuan ke OWASP LLM Top 10 dan RAGAS
- Menghasilkan verdict gerbang yang langsung bisa dipasang ke CI