Catatan dari produksi
RAGRetrievalReranking

Hybrid retrieval + reranking, dijelaskan

Vektor dense menangkap makna; sparse (BM25) menangkap istilah persis. Sebagian besar pertanyaan produksi butuh keduanya — itulah mengapa hybrid mengungguli salah satunya saja pada korpus nyata.

Mengapa menambah reranker

Retrieval berorientasi recall — jaring lebar. Reranker cross-encoder lalu menilai ulang kandidat teratas dengan presisi jauh lebih tinggi. Biasanya akurasi termurah yang bisa dibeli.

Anggarkan latensi: ambil k≈50, rerank ke 5–8 teratas yang benar-benar dikirim ke model. Ukur context precision sebelum dan sesudah.