Digitalizacja dokumentów i centralizacja wiedzy z wykorzystaniem OCR i AI w firmach budowlanych i wodno-kanalizacyjnych
AI i automatyzacja Consulting
Więcej o case study Digitalizacja dokumentów i centralizacja wiedzy z wykorzystaniem OCR i AI w firmach budowlanych i wodno-kanalizacyjnych
Case study opisuje projekt digitalizacji dokumentacji technicznej oraz budowy centralnej bazy wiedzy w firmie działającej w sektorze budowlanym i wodno-kanalizacyjnym. Celem projektu było przekształcenie tysięcy zeskanowanych dokumentów PDF, które dla systemów IT stanowiły jedynie obrazy, w przeszukiwalny i inteligentny zasób wiedzy wspierający bieżące decyzje operacyjne, procesy serwisowe oraz dalszą transformację cyfrową organizacji. Projekt udowodnił, że właściwie zaprojektowane połączenie OCR, wyszukiwania semantycznego i centralnej struktury informacji może znacząco skrócić czas dostępu do wiedzy oraz stać się fundamentem kolejnych inicjatyw technologicznych.
O kliencie
Klientem była firma działająca w sektorze budowlanym i wodno-kanalizacyjnym, realizująca projekty infrastrukturalne obejmujące fazę przetargową, projektową, wykonawczą oraz okres gwarancyjny. Przez lata organizacja zgromadziła bardzo obszerną bazę dokumentacji projektowej, technicznej i operacyjnej. Zdecydowana większość tych materiałów istniała w formie zeskanowanych plików PDF, przechowywanych w różnych lokalizacjach, bez spójnej struktury i bez możliwości efektywnego przeszukiwania.
Firma, dążąc do modernizacji i zwiększenia konkurencyjności, potrzebowała rozwiązania, które pozwoliłoby odzyskać wiedzę ukrytą w dokumentach i wykorzystać ją w sposób operacyjny. Kluczowe było stworzenie systemu, który nie tylko archiwizuje pliki, lecz umożliwia realne korzystanie z ich treści w codziennej pracy zespołów oraz na poziomie zarządczym.
Wyzwanie, z którym przyszedł klient
Główne wyzwanie polegało na zarządzaniu ogromnym wolumenem dokumentów technicznych i projektowych, które formalnie były cyfrowe, lecz w praktyce stanowiły nieprzeszukiwalne obrazy. Oznaczało to, że odnalezienie konkretnych informacji, takich jak numery seryjne urządzeń, zakresy robót czy terminy gwarancji, wymagało ręcznego przeglądania setek dokumentów.
Sytuację dodatkowo komplikowała złożoność dokumentacji, obejmującej rysunki techniczne, wykresy, tabele, odręczne adnotacje, pieczątki i podpisy, a także nierówna jakość skanów. Wiedza była rozproszona i trudna do odtworzenia, co generowało wysokie koszty operacyjne oraz zwiększało ryzyko błędów. Brak centralnej bazy wiedzy uniemożliwiał także wdrażanie kolejnych rozwiązań, takich jak system ticketowy, digitalizacja gwarancji czy zaawansowana analityka oparta na AI. Istotnym wyzwaniem był również czynnik ludzki, czyli konieczność przygotowania pracowników na zmianę sposobu pracy i akceptację nowych narzędzi.
Nasze rozwiązanie wyzwania
Aby odpowiedzieć na te problemy, przyjęliśmy etapowe podejście rozpoczynające się od Proof of Concept. Celem PoC było zweryfikowanie kluczowych założeń w rzeczywistych warunkach operacyjnych oraz przygotowanie organizacji do pełnego wdrożenia. Projekt pilotażowy objął digitalizację i oznakowanie około dwóch tysięcy dokumentów pochodzących z jednego wybranego projektu.
Centralnym elementem rozwiązania była baza dokumentów oparta o SharePoint, wzbogacona o spójną taksonomię, metadane oraz wersjonowanie. Kluczową rolę odegrał zaawansowany, hybrydowy mechanizm OCR, zdolny do pracy z dokumentacją techniczną o wysokim stopniu złożoności. System został skonfigurowany w taki sposób, aby w przypadku niepewnego rozpoznania nie generował błędnych danych, lecz wskazywał konkretne fragmenty wymagające weryfikacji przez specjalistę.
Uzupełnieniem rozwiązania było wyszukiwanie semantyczne, pozwalające użytkownikom odnajdywać informacje na podstawie znaczenia, a nie wyłącznie słów kluczowych. PoC został wdrożony na rzeczywistych danych i przetestowany w codziennej pracy zespołów, z jednoczesnym wsparciem użytkowników poprzez krótkie instrukcje oraz mikro-szkolenia.
Wyzwanie
- Zarządzanie ogromnym wolumenem dokumentów technicznych i projektowych
- Złożoność dokumentacji, obejmującej rysunki techniczne, wykresy, tabele, odręczne adnotacje, pieczątki i podpisy
- Nierówna jakość skanów
- Rozproszona i trudna do odtworzenia wiedza
Rozwiązanie
- Etapowe podejście rozpoczynające się od Proof of Concept
- Baza dokumentów oparta o SharePoint
- Wyszukiwanie semantyczne, pozwalające użytkownikom odnajdywać informacje na podstawie znaczenia, a nie wyłącznie słów kluczowych
Rezultaty
Wdrożenie Proof of Concept przyniosło mierzalne i istotne rezultaty. W ponad dziewięćdziesięciu procentach przypadków czas wyszukania potrzebnych informacji skrócił się do poniżej dwóch minut, co znacząco zmniejszyło nakład pracy manualnej związanej z przeglądaniem dokumentów. Uporządkowano proces wersjonowania, eliminując ryzyko pracy na nieaktualnych plikach, a hybrydowe podejście łączące AI i weryfikację człowieka zapewniło wysoką wiarygodność danych.
Projekt skutecznie przygotował organizację na zmianę sposobu pracy, zwiększając akceptację użytkowników i gotowość do dalszej cyfrowej transformacji. Centralna baza wiedzy stała się fundamentem kolejnych inicjatyw, takich jak systemy ticketingowe, digitalizacja gwarancji czy automatyzacja ofertowania. Dla pełnego wdrożenia oszacowano zwrot z inwestycji na poziomie 180–200% w horyzoncie 18–24 miesięcy, co potwierdziło finansową zasadność projektu.
Najważniejszym efektem było jednak przekształcenie dotychczasowych, „milczących” dokumentów w aktywny zasób operacyjny, który realnie wspiera decyzje biznesowe i rozwój organizacji.