RAG=Vector db+LLM

現在生成式 AI 很常聽到 RAG 或是 Vector DB,但說明的圖都很複雜。
後來找到一張圖,很好的說明 RAG 怎麼在運作的。
VectorDB 其實就是有著海量知識庫的DB,裡面的知識都已經切片成一段一段。
當有查詢時,會將prompt進到 Vector DB 裡,撈出文字相似性高的知識片段。
最後將查詢的prompt 結合剛剛撈出的知識片段,組合成新的 prompt 送給 LLM 進行生成文字。

圖片來源:https://medium.com/@cch.chichieh/rag實作教學-langchain-llama2-創造你的個人llm-d6838febf8c4