Generative KI -Systeme erfordern erhebliche Rechen-, Speicher- und Speicherressourcen.Während die KI das Potenzial hat, transformative Durchbrüche in den Branchen zu fördern, ist ihr Einsatz häufig mit hohen Kosten ausgestattet.RAG ist eine entscheidende Phase in der KI-Entwicklung, die große Sprachmodelle (LLMs) raffiniert, indem sie Anwendungs- oder Unternehmensspezifische Daten nutzen.
Im Kern von RAG befindet sich eine Vektor-Datenbank, die domänenspezifische Daten in Feature-Vektoren sammelt und umwandelt.Rag basiert auch auf ANNS -Algorithmen, um Vektoren zu identifizieren, die das Modell durch Bewertung der Ähnlichkeit zwischen akkumulierten und Zielvektoren verbessern.Um effektiv zu sein, muss Lag die relevantesten Informationen schnell abrufen.Traditionell wurden ANNS-Algorithmen in DRAM eingesetzt, um die erforderliche Hochgeschwindigkeitsleistung zu erzielen.
Die Kioxia AISAQ-Technologie liefert eine skalierbare und effiziente ANNS-Lösung, mit der Datensätze im Bereich Milliarden im Bereich minimaler Speicherverbrauch und schnelle Index-Switching-Funktionen umgehen können.