AWS, Bedrock

AWS Bedrock Data Automation: KI verarbeitet 3.000 Seiten automatisch

12.06.2026 - 20:15:20 | boerse-global.de

Amazon Web Services stellt skalierbare KI-Pipeline für Dokumente vor. Microsoft und Open-Source-Tools beschleunigen den Wandel in der Arbeitswelt.

AWS und Microsoft treiben KI-Dokumentenverarbeitung massiv voran
AWS - Digital pipes transforming documents into structured data, with glowing lines connecting to abstract AWS and Microsoft cloud logos. 12.06.2026 - Bild: über boerse-global.de

Neue Systeme verarbeiten Tausende Seiten automatisch – und verändern die Arbeitswelt grundlegend.

Künstliche Intelligenz kann bald nicht nur Dokumente lesen, sondern ganze Arbeitsabläufe steuern. Amazon Web Services (AWS) hat heute eine intelligente Dokumentenverarbeitungs-Pipeline vorgestellt, die auf Amazon Bedrock Data Automation (BDA) basiert. Das System extrahiert Texte, Tabellen und Diagramme aus PDF- und DOCX-Dateien und leitet daraus selbstständig komplexe Prozesse ein.

Milliarden Seiten im Visier

Anzeige: Wer täglich hunderte Seiten manuell verarbeitet, spart mit einer automatisierten Pipeline enorm Zeit und Geld. Der Praxisleitfaden zeigt in 5 konkreten Schritten, wie Sie mit AWS Bedrock und Open-Source-Tools Ihre Dokumenten-Workflows revolutionieren – inklusive Kostenvergleich. Praxisleitfaden jetzt kostenlos anfordern

Die neue AWS-Lösung ist für den Masseneinsatz konzipiert. Pro Anfrage verarbeitet das System bis zu 3.000 Seiten oder 500 Megabyte Daten. Die Pipeline kombiniert Dokumenten-Uploads mit einer semantischen Wissensdatenbank. KI-Agenten können so auf Basis der extrahierten Daten eigenständig Antworten koordinieren und Workflows anstoßen. AWS bietet sowohl Standard- als auch kundenspezifische Ausgabeformate an.

Nur einen Tag zuvor, am 11. Juni, hatte Microsoft seine Work IQ-Infrastruktur detailliert beschrieben. Diese Intelligenzschicht durchforstet Microsoft-365-Daten – E-Mails, Chats, Besprechungen und SharePoint-Inhalte – und liefert kontextreiche Antworten für Copilot und andere KI-Assistenten. Work IQ ist kein eigenständiges Programm, sondern eine tenantübergreifende Infrastruktur aus Daten-, Speicher- und Inferenzebenen.

Open Source senkt Kosten drastisch

Parallel dazu gewinnen Open-Source-Werkzeuge an Bedeutung. Microsofts MarkItDown, eine Python-Bibliothek, wandelt unstrukturierte Dateien wie Excel-Tabellen, PowerPoint-Präsentationen und PDFs in sauberes Markdown um. Erste Anwender berichten von bis zu 70 Prozent weniger KI-Token-Verbrauch – ein enormer Kostenvorteil gegenüber der direkten PDF-Verarbeitung.

Ebenfalls am 11. Juni erschien OfficeAgent.NET 0.1. Die Bibliothek erlaubt KI-Agenten, Änderungen an Word-Dokumenten als JSON-basierten Plan zu beschreiben – inklusive Prüfung, Suche, Vorschau und Freigabe. Der Dokumentenparser MinerU erreichte zeitgleich eine neue Version mit einem Dual-Engine-OCR-Ansatz, der komplexe Dokumente für Retrieval-Augmented-Generation-Workflows (RAG) aufbereitet.

Produktivitätssuiten werden intelligent

Die großen Softwareanbieter ziehen nach. Collabora Online Writer 25.04.8 (erschienen am 10. Juni) ermöglicht einen verlustfreien Markdown-Rundflug: Nutzer exportieren Dokumente für KI-Übersetzungen oder Tonfall-Anpassungen und importieren sie ohne Formatierungsverluste zurück.

Google aktualisierte am selben Tag seine NotebookLM-Plattform. Die neue Version enthält Gemini 3.5 und die sogenannte „Antigravity"-Technologie – eine sichere Cloud-Umgebung zur Code-Ausführung. Interne Benchmarks zeigen eine Erfolgsquote von 69,9 Prozent bei der logischen Analyse großer Dokumente und 78,2 Prozent bei webbasierter Recherche.

Speziallösungen für Industrie und Steuerberatung

Besonders präzise arbeiten KI-Systeme in Nischenbereichen. Das Unternehmen octonomy erreichte laut einer Tolly-Group-Studie eine 96-prozentige Genauigkeit bei der Interpretation von Fertigungsdokumentationen und Schaltplänen. Das rund 130 Mitarbeiter starke Startup hat bisher über 25 Millionen Euro eingesammelt.

Im Rechts- und Finanzsektor kündigte Soraban am 11. Juni das Tool „Prepare" an. Es erstellt automatisch Arbeitspapiere für Steuerkanzleien, indem es Quellen organisiert und offene Punkte formuliert – sobald Mandanten Dokumente hochladen. Nach dem Training über sechs Steuersaisons in Hunderten von Kanzleien soll im Sommer 2026 die Beta-Phase starten.

Anzeige: Fehleranfällige Datenextraktion aus PDFs und Tabellen kostet Ihr Team wertvolle Arbeitszeit. Mit der richtigen KI-Pipeline senken Sie Fehlerquoten und beschleunigen Prozesse. Der Leitfaden liefert eine Schritt-für-Schritt-Anleitung für Steuer- und Rechtsabteilungen – basierend auf aktuellen AWS- und Open-Source-Lösungen. KI-Workflow-Leitfaden jetzt sichern

Vom Chat zum Geschäftsprozess

Einen Schritt weiter geht Pipefy. Das Unternehmen launchte am 11. Juni seine „Process-as-Tool"-Lösung. Große Sprachmodelle wie Claude und Gemini können damit direkt Geschäftsprozesse ausführen – etwa Genehmigungen einholen oder Eskalationen auslösen. Es ist eine der ersten Unternehmensimplementierungen des Model Context Protocol (MCP), das die Lücke zwischen KI-Konversation und formalen Geschäftsabläufen schließt.

Die Entwicklung zeigt: Der Wettlauf um die intelligenteste Dokumentenverarbeitung hat gerade erst begonnen. Wer am Ende die Nase vorn hat, entscheidet nicht nur über Effizienzgewinne, sondern über die Zukunft ganzer Branchen.

de | wissenschaft | 69529640 |