Overview
Überblick zu Data Pools, RAG und Quellenanbindung
Data Pools (RAG)
Data Pools sind die Basis für Retrieval-Augmented Generation (RAG) in meinGPT.
Dabei werden Inhalte aus angebundenen Quellen indexiert und Deinem Assistenten als Wissen zur Verfügung gestellt.
Für private und On-Premise-Quellen siehe auch: On-Premise Connections.
Wann Data Pools sinnvoll sind
- Du willst viele Dokumente zentral verwalten
- Du brauchst wiederverwendbares Wissen für mehrere Assistenten
- Du willst Zugriffe über Quellen und Syncs steuern
Quellen (Sources)
Alle unterstützten Quellen findest Du hier:
Typische Quellen:
- SharePoint / OneDrive
- Google Drive
- Confluence
- Amazon S3
- SMB / WebDAV
- Lokale Filesysteme
Custom Data Preparation Pipelines
Ein eigenes Muster mit S3-Übergabepunkt für Drittsysteme findest Du hier: