Razítkování plánů pomocí umělé inteligence - optimální a přirozené umístění razítek s metadaty do naskenovaných dokumentů.
Ve spolupráci se společností Sartorius, globálním dodavatelem biofarmaceutického a laboratorního vybavení, se ioLabs v roce 2021 zapojilo do projektu, který měl zásadně změnit způsob zpracování dokumentů. Cílem bylo vyvinout daty řízené řešení strojového učení, které by napodobovalo "lidské" umístění vodotisků a razítek na technických PDF souborech a eliminovalo potřebu manuálního rozhodování. Řešení bylo bezproblémově integrováno do webové platformy, která umožňuje uživatelům vybírat dokumenty přímo z BIM 360.
Pomocí nejmodernějšího modelu strojového učení Mask R-CNN můžeme přesně identifikovat části dokumentu, jako jsou legendy, záhlaví, zápatí a loga, a efektivně lokalizovat umístění razítka. Model byl vycvičen na více než 10 000 stranách anotovaných technických dokumentů. Kromě toho úzce specifický ML algoritmus pro technické dokumenty natrénovaný na stejném souboru dat úspěšně rozpoznal orientaci dokumentu. Pro zlepšení stability a výkonu technik ML byl vyvinut tradiční algoritmus pro umístění razítka kolem rozpoznaných objektů, jako jsou právě záhlaví a zápatí dokumentu. Navíc budou naše algoritmy aktivního učení průběžně zlepšovat výkonnost nástroje při jeho používání.
Nástroj pro razítkování je sestaven jako rozhraní API v našem ioFrameworku a využívá naše monitorovací nástroje, včetně Kibana dashboardu a integrace s ioLabs Health dashboardem. Využívá jej aplikace Sartorius Plot-App, která slouží ke správě dokumentů.
Tento projekt nejenže způsobil revoluci ve zpracování dokumentů, ale také podnítil pokrok v oblasti strojového učení a počítačového vidění, čímž poskytl cenné informace a zkušenosti pro zúčastněné společnosti.
KlientioLabs AG (vlastní R&D projekt) Partner- CreditsioLabs AG |
TechnologiePytorch MaskRCNN ResNET FastAPI Logstash and Kibana AWS EC2 and Textract BIM 360 Docs RabbitMQ |