menu
CZ
EN DE CZ

36_thumbnail.png

Zjednodušení procesů správy dokumentů je v dnešní digitální době klíčové pro zvýšení efektivity a produktivity. Využití pokročilých technologií, jako jsou optické rozpoznávání znaků (OCR) a zpracování přirozeného jazyka (NLP), může výrazně automatizovat a zlepšit zpracování velkého množství textových dat, zejména v odvětvích pracujících s rozsáhlým množstvím dokumentů.

Vytvořili jsme pokročilý systém, který využívá sílu OCR, NLP a technik hlubokého učení ke zjednodušení zpracování a analýze dokumentů ve formátu PDF. Náš systém nabízí komplexní funkce pro klasifikaci dokumentů, extrakci informací a logické dělení.

Náš systém využívá vyškolený model Mask R-CNN k detekci prvků dokumentu, jako jsou záhlaví, zápatí a podpisy, bez ohledu na formát, rozvržení, písmo nebo jazyk. Extrakce informací je pak usnadněna pomocí technik OCR a NLP, zachycujících klíčové detaily, jako jsou typ objektu, rok, poskytovatel služeb, výrobce, název společnosti a typ obsahu. Tento proces zajišťuje robustní klasifikaci a identifikaci dokumentů.

Vyškolili jsme
2
různé modely počítačového vidění pro třídění a porozumění technickým dokumentům
Seřazeno a anotováno
698
dokumentů v BIM360Docs
Každý vyškolen na více než
10 000
stran technických dokumentů, včetně výkresů

 

Pro zajištění přesného třídění dokumentů náš systém pomocí technik OCR, NLP a počítačového vidění inteligentně určuje, zda se po sobě jdoucí stránky vztahují k tomu samému dokumentu. Toto logické dělení zajišťuje přesnost při třídění a kategorizaci dokumentů a zvyšuje celkovou efektivitu správy dokumentů.

Naše řešení se bezproblémově integruje s BIM 360 Docs, softwarovým řešením pro správu dokumentů v cloudu, což umožňuje snadný přenos a uložení roztříděných dokumentů. Implementace zahrnuje aplikaci v jazyce C#, která volá Python API pro zpracování PDF dokumentů. Pro extrakci informací jsou použity pokročilé techniky, jako jsou detekce vlastností dokumentu, předzpracování OCR a NLP s GPT-3.5-turbo od OpenAI. Třídění dokumentů využívá architekturu siamské neuronové sítě pro počítačové vidění, logistickou regresi a NLP pro přesné a vylepšené výsledky. Tento holistický přístup zajišťuje excelentní výsledky při zpracování dokumentů.

graph2.png

 

Galerie

 

 

Klient

ioLabs AG (own R&D project)

Partner

-

Credits

ioLabs AG

Technologie

Pytorch Lightning

MaskRCNN

Langchain

OpenAI API

LLM embeddings

GPT-3.5-Turbo

ResNET

Siamese networks

FastAPI

Logstash and Kibana

BIM 360 Docs

 

Schedule a meeting