Live Chat Software by Kayako |
Nutzung des KI-Modells GLM-OCRGepostet von Christoph Joos, zuletzt bearbeitet von Christoph Joos an 23 März 2026 10:54
|
|||||||
Das Vision-Language-Model GLM-OCR bei weber.cloud nutzenWas genau ist GLM-OCR überhaupt?Basierend auf dem leistungsstarken GLM-4V-Modell, revolutioniert GLM-OCR die Texterkennung. Anstatt nur einzelne Zeichen abzulesen, versteht die KI die logische Struktur und den Kontext ganzer Dokumente. Das Ergebnis ist eine hochpräzise, strukturierte Datenerfassung aus Quellen wie Rechnungen, Verträgen oder PDFs, die sich direkt für automatisierte Workflows nutzen lässt. Was sind typische Anwendungsfälle von GLM-OCR?Dieses Modell kommt insbesondere dann zum Einsatz, wenn Dokumente verstanden und Informationen aus komplexen, mehrseitigen oder variierenden Dokumentstrukturen strukturiert gewonnen werden sollen. Beispiel hierfür wären:
Wie kann ich mit GLM-OCR bei weber.cloud starten?Bei weber.cloud können Sie das KI-Modell GLM-OCR kostenlos 1 Monat lang testen. Registrieren Sie sich einfach hier: Für GLM-OCR registrieren Sie können sich folgendermaßen registrieren:
Wie komme ich an meine Zugangsdaten und den API-Schlüssel?Nach der erfolgreichen Registrierung werden Sie auf unser Kundenportal umgeleitet und erhalten sofort und automatisiert Ihren Zugang. Sie ereichen unser Kundenportal immer über den Login auf unsere weber.cloud Website oder direkt unter: weber.cloud Kundenportal In den Details des Services "Managed AI Models" erhalten Sie Zugriff auf:
Wie nutze ich GLM-OCR über die OpenAI API-Schnittstelle?Es ist wichtig zu wissen, dass GLM-OCR keine Fragen beantworten kann. Es liest Ihr Dokument ein und liefert Ihnen den textuellen Inhalt zurück. API-Endpunkt:v1/chat/completions Request (das Bild als base64 String mitgeben):
Response (Antwort des Modells):
Prompt Szenarios1.Dokumenten ParsingDabei haben Sie genau 3 Einstellmöglichkeiten:
Beispiel DokumentErgebnis für Text Recognition:
Ergebnis für Table Recognition (als HTML oder Markdown):
Ergebnis für Formula Recognition (als LaTeX):
2. InformationsextraktionDabei muss Ihr Prompt einem strikten JSON Format folgen um strukturierte Daten aus dem Dokument zu extrahieren. Ziel ist es, dass Sie definieren welche Informationen genau Sie als Ergebnis haben wollen. Strukturaufbau
Beispielhafter Aufbau des Requests
Da es sich hier um JSON in JSON handelt, muss ihr 2tes JSON entsprechend escaped werden. Als Ergebnis erhalten Sie ein ausgefülltes JSON, das Ihrer zuvor definierten Struktur entspricht. Wo kann ich noch mehr über GLM-OCR erfahren? | |||||||
|
|
|||||||
