Fundament zmiany technologicznej. Na przykładzie firmy z sektora wodno-kanalizacyjnego i budowlanego

19 grudnia 2025 13:40
77
Jakub Smeda
Autor
Jakub Smeda

Firmy z branży wodno-kanalizacyjnej, wykonawcy instalacji i integratorzy “pod klucz” obsługują setki kontraktów, każdy z własną dokumentacją ofertową, realizacyjną, powykonawczą i gwarancyjną. Liczba dokumentów w średniej organizacji liczonej w dziesiątkach projektów rocznie sięga dziesiątek tysięcy plików. Dane znajdują się w e-mailach, Excelach, dyskach lokalnych, archiwach, intranetach i pojedynczych narzędziach. W praktyce oznacza to brak jednego źródła prawdy.

Pracownicy podczas analizy, którą przeprowadzaliśmy w gronie ekspertów Z3X Tech-Care Group w skład, których wchodzili nie tylko specjaliści od AI ale także mgr Inż. budownictwa specjalizujący się w branży gazowniczej Pan Piotr Gizowski, wskazali, że największa utrata wiedzy i błędy pojawiają się w momentach przekazywania projektu z działu handlowego do realizacji, a następnie do serwisu. To wtedy giną informacje dotyczące ustaleń, warunków ofertowych, zapisów gwarancyjnych oraz szczegółów technicznych. Działy pracują zadaniowo, nie dzieląc się pełnym kontekstem. To nie jest problem technologiczny, lecz operacyjny. Technologia jedynie go ujawnia.

Jak problem dokumentów wygląda w liczbach

Przyjmijmy firmę usługowo-produkcyjną działającą w sektorze wod-kan lub w branży instalacyjnej, zatrudniającą około stu pracowników biurowych, projektantów, kosztorysantów i serwisantów. Każdy z nich spędza dziennie od dziesięciu do piętnastu minut na próbach znalezienia właściwej wersji pliku, emaila z informacją, którą kiedyś wysłano lub dokumentu, którego nazwę pamięta, ale lokalizacji już nie.

W skali roku to przedział 2500 - 3500 godzin pracy. Przy stawce wewnętrznej wynoszącej 150 złotych za godzinę daje to od 360 000 do ponad pół miliona złotych kosztu utraconej produktywności. Do tego dochodzi koszt błędów wynikających z pracy na nieaktualnych wzorach oraz ryzyko zamówienia materiałów czy usług w oparciu o niewłaściwe dane. W jednym z analizowanych przypadków scalanie danych z dwóch źródeł doprowadziło do dublowania pozycji, co przełożyło się na ponad 50 000 złotych zbędnego zakupu.

Największym kosztem nie jest jednak czas. Jest nim ryzyko. Dokument to nie plik. W branżach technicznych jest elementem wartości projektowej i kontraktowej.

Dlaczego dokumentacja w tych branżach nie jest archiwum, lecz produktem operacyjnym

Dokument powstaje w ofertowaniu, zmienia się w negocjacjach, staje się instrukcją dla wykonawcy, dowodem przy odbiorach i podstawą roszczenia gwarancyjnego. To oznacza, że dokument nie może być zamknięty i “przekazany do archiwum”. Jego treść zmienia funkcję w czasie, a każda kolejna wersja powinna być stale dostępna i kontrolowana.

Brak centralnego repozytorium oznacza:

  • utratę wiedzy wraz z odejściem pracownika
  • opóźnienia w ofertowaniu i serwisie
  • niską przewidywalność jakości informacji
  • ryzyko prawne w razie kontroli, roszczeń lub sporu z inwestorem
  • brak pętli zwrotnej między realizacją a ofertowaniem

Najbardziej dotkliwe jest to, że błędy nie ujawniają się od razu. Wychodzą po miesiącach, najczęściej w okresie gwarancji.

Fundament zmiany technologicznej

Dlaczego rozpoznawanie tekstu OCR jest kluczowe i czym różni się skan PDF od dokumentu, który rozumie AI

Większość dokumentów w firmach wod-kan i budowlanych istnieje jako pliki PDF, ale są to pliki bez warstwy tekstowej. Dla systemu informatycznego skan PDF jest zdjęciem. Nie da się go przeszukać pod kątem numeru seryjnego, nazwy komponentu, terminu ważności gwarancji ani odpowiedzialności za zakres robót. Pracownik musi otworzyć dokument, przewinąć go, przeczytać lub skopiować treść ręcznie.

OCR, czyli optyczne rozpoznawanie tekstu, zmienia obraz w tekst możliwy do przeszukiwania i analizy. System wykrywa treści, rozpoznaje znaki, odczytuje numery, nazwy i parametry techniczne. Na tej podstawie powstaje warstwa tekstowa, którą można indeksować i analizować semantycznie. AI może wtedy odpowiedzieć na pytanie, znaleźć fragment, wskazać zdanie, porównać wartości, a nawet przeszukać setki dokumentów pod kątem jednego wymogu kontraktowego.

OCR w tych branżach nie jest prostym odczytem liter. Dokumenty zawierają wykresy, rzutnie, tabele, dopiski ręczne, pieczątki i podpisy. Jakość skanu wpływa na jakość rozpoznania. Jeżeli dokument jest zabrudzony, pochylony, zasłonięty, system wprowadza znaczniki niepewności. W tym momencie pojawia się inna zaleta wdrożenia. System nie zgaduje. Zamiast błędnie interpretować dane, generuje listę konkretnych pól problematycznych i kieruje je do specjalisty.

Przykład. W specyfikacji technicznej pompy system rozpoznaje nazwę, ale nie jest w stanie odczytać numeru seryjnego z powodu słabo widocznego druku. Oznacza to, że parametr ten może mieć wpływ na dopasowanie części zamiennej lub warunki gwarancji. System dodaje zadanie do listy, wskazuje stronę i obszar, którego nie odczytano, a pracownik może wprowadzić brakującą wartość w mniej niż minutę. Zamiast przekopywać kilkudziesięciostronicowy dokument, specjalista otrzymuje jedynie to, co wymaga uwagi.

Taka współpraca człowieka i narzędzia jest bardziej efektywna niż próby pełnej automatyzacji. System wykonuje większość pracy, a człowiek uzupełnia brakujące pięć do dziesięciu procent danych. Połączenie tych dwóch elementów daje najwyższą wiarygodność indeksu treści. OCR nie służy do archiwizacji. Jest mechanizmem odzyskiwania wiedzy z papieru, który już istnieje i z którym firma pracowała przez lata. W kontekście późniejszych wdrożeń ticketingu, digitalizacji gwarancji oraz analizy ofert, przekształca przeszłe projekty w zasób operacyjny, który zaczyna pracować na kolejne kontrakty.

Zrealizowaliśmy 1 dowód słuszności pełnego wdrożenia, które z angielska określamy mianem Proof of Conbcept albo częściej skrótem PoC. Tymże POC było połączenie stworzenia:

  • Centralnej bazy wiedzy,
  • OCR
  • wyszukiwanie semantyczne

Celem było sprawdzenie, czy digitalizacja i oznakowanie około 2000 dokumentów z jednego projektu pilotażowego oraz indeksowanie semantyczne pozwolą skrócić czas wyszukania informacji do poniżej 2 minut w ponad 90% przypadków. PoC obejmował repozytorium dokumentów w SharePoint, taksonomię, metadane, wersjonowanie oraz prototyp wyszukiwarki semantycznej. Zakres pilotażu obejmował 30% funkcjonalności docelowych. Nie wdrażaliśmy pełnych obiegów akceptacji dokumentów ani kontroli dostępu opartej o poufność, a chatbot dostępny w interfejsie Teams został odłożony do etapu pełnego projektu. Pilotaż skupił się na tym, co najważniejsze: czy dokumenty będą znajdowane szybko i trafnie oraz czy użytkownicy przyjmą narzędzie.

Wyniki

W tym PoC:

  • znaczne skróciliśmy czas wyszukania treści na ograniczonej próbce.
  • uporządkowaliśmy wersjonowanie dokumentów, a analiza logów użytkowania pozwoliła przygotować mapę braków treści do migracji w projekcie pełnym.
  • potwierdziliśmy też konieczność przygotowania taksonomii i szablonów publikacji, ponieważ bez nich użytkownicy wprowadzaliby dokumenty w sposób niespójny.

Najważniejszym efektem nie były jednak same wyniki. PoC pozwolił przygotować użytkowników na zmianę. Adopcja narzędzia była kluczowym kryterium oceny pilotażu. To nie technologia decyduje o sukcesie, lecz to, czy ludzie zaczną z niej korzystać.

Ryzyka i doświadczenia

Największym wyzwaniem była jakość OCR na skanach technicznych. Porównanie narzędzi pozwoliło dobrać rozwiązanie hybrydowe. Drugim ryzykiem była nadmierna zależność od jednego lub dwóch kluczowych pracowników w zakresie oznaczania dokumentów. Rozwiązaniem okazało się przygotowanie krótkiego poradnika “Jak publikować” oraz dziesięciominutowych mikro-szkoleń. Istotne było również wprowadzenie zasad anonimizacji, aby dokumenty zawierające dane osobowe mogły być wykorzystywane w PoC bez ryzyka naruszeń.

Pilotaż ujawnił również, że pracownicy chcą korzystać z narzędzi AI, ale wstrzymują się z obawy o zgodność z przepisami. Wprowadzenie polityk i checklist okazało się koniecznym elementem dalszej transformacji.

Projekt pełny - inwestycja z przewidywalnym zwrotem

Pełny projekt obejmuje:

  • digitalizację wszystkich dokumentów
  • pełne metadane i wersjonowanie
  • obiegi akceptacji i zgodność z RODO
  • integracje z ticketingiem i CRM/ERP
  • kontrolę dostępu opartą o role i poufność
  • chatbot i wyszukiwanie w języku naturalnym

ROI projektu pełnego oszacowano na poziomie 180-200% w okresie 18-24 miesięcy, co wpisuje się w zakres spodziewanych efektów wskazanych w planie transformacji.

Fundament zmiany technologicznej

Dlaczego musi być to projekt numer jeden w transformacji

Centralna baza wiedzy stanowi podstawę wszystkich kolejnych PoC, w tym ticketingu, digitalizacji gwarancji, automatyzacji ofertowania oraz wdrożenia lokalnego modelu AI. Bez wspólnego repozytorium, bez kontroli wersji i bez zarządzania dostępami, kolejnych projektów nie można wykonać bez ryzyka.

Przykładowy system ticketowy, o którym napisaliśmy w inny artykule, potrzebuje wiedzy, aby przyspieszać diagnozy. Automatyzacja ofert potrzebuje historycznych dokumentów i danych. On-prem LLM potrzebuje źródła treści do analiz. Dashboard sprzedażowy i marketingowy potrzebują jednego języka danych.

Podsumowanie

Centralna baza wiedzy wraz z OCR i wyszukiwaniem semantycznym nie jest projektem dokumentacyjnym. Jest elementem zarządzania ryzykiem, kosztami oraz know-how organizacji. To fundament zmiany technologicznej. To również decyzja o tym, czy organizacja zachowa kontrolę nad wiedzą, czy pozwoli, by odchodziła wraz z każdym kolejnym specjalistą. To pierwszy krok, który warunkuje powodzenie kolejnych.

7 min czytania
Podziel się artykułem:

Gotowy, aby rozpocząć?

Wznieś swoją firmę na wyższy poziom

Pracuj z nami
Pracuj z z3x

Powiązane artykuły

Wszystkie artykuły

Nie chcesz niczego przegapić?

Zapisz się na nasz newsletter

Prosimy, podaj swoje imię
Prosimy, podaj email
* Tak, zgadzam się na regulamin i politykę prywatności.
Top