Analityka danych w praktyce przemysłowej na przykładzie cyfrowej diagnostyki układów pompowych
Czy zastanawialiście się kiedyś w jaki sposób statystyka może zostać wykorzystana w procesie diagnostyki? Nowoczesne obiekty przemysłowe dają szerokie możliwości do implementacji metod statystycznych w praktyce. Czujniki na urządzeniach mechanicznych generują ogromną ilość danych, które są następnie rejestrowane w systemie sterowania oraz archiwizowane. Poprawna interpretacja wartości rejestrowanych pomiarów może pomóc uniknąć kosztownych przestojów produkcyjnych.
Przemysł 4.0 to nie tylko modne pojęcie, lecz także realna rewolucja w dziedzinie produkcji. Jednym z kluczowych elementów tego zjawiska jest wykorzystanie analizy danych i statystyki do optymalizacji obecnie funkcjonujących procesów. Nowoczesne technologie umożliwiają wczesne wykrycie awarii oraz przewidywanie nieprawidłowości w pracy maszyn, co pozwala na zaplanowanie ich przeglądów i napraw w sposób bardziej efektywny i kosztowo optymalny.
Ze względu na wiele czynników wpływających na prawidłowe działanie pomp w obiektach przemysłowych, prowadzenie diagnostyki ich stanu może stanowić wyzwanie. Jednym z kluczowych problemów jest konieczność ciągłego monitorowania wielu zmiennych w systemie sterowania, w tym drgań, ponieważ mogą one wskazywać na potrzebę naprawy lub wymiany uszkodzonych części. W przypadku wystąpienia nieprawidłowości, szybka i skuteczna diagnostyka jest niezbędna, aby zapobiec poważnym awariom i zapewnić niezakłóconą pracę obiektu przemysłowego.
Standardowym podejściem do wykrywania zbyt wysokiego poziomu drgań w systemie sterowania pomp jest rozwiązanie polegające na monitorowaniu sygnału drgań i porównywaniu go z określonymi wartościami granicznymi. Jeśli wartość sygnału drgań przekracza ustalone limity, może to sygnalizować nieprawidłowe działanie systemu i wskazywać na konieczność interwencji.
Metoda ta może być skuteczna w przypadku pomp działających w stałym obciążeniu, jednak jest zbyt prosta by podołać swojemu zadaniu w przypadku pomp, których obciążenie regulowane jest przez falownik.
System ostrzegania przedstawiony powyżej może zostać wzbogacony dodatkowo o dane, które „wyjaśniają” poziom obserwowanych drgań. Na proces drgań wpływa cały szereg zmiennych, z których najważniejsze to:
- prędkość obrotowa,
- parametry pracy pompy,
- procesy starzeniowe pompy,
- zjawiska niepożądane (kawitacja lub rezonans mechaniczny).
Techniką, która może zostać zastosowana do budowy systemu diagnostycznego jest Multivariete State Estimation Technique (MSET). Polega ona na wykorzystaniu modelu – matematycznego odwzorowania procesu, w celu oceny rzeczywistych obserwacji pod kątem możliwości wystąpienia anomalii. Implementacja tej metody wymaga dwóch elementów – modelu oraz modułu odpowiedzialnego za interpretację różnic między wartością teoretyczną i faktyczną.
Pierwszy element – model odwzorowujący proces drgań – można otrzymać dowolną metodą regresji. Aby model był wiarygodny oraz użyteczny, kluczowa przy budowie zbioru uczącego jest analiza jakości danych. „Czyszczenie” zbioru danych powinno z jednej strony – wykluczyć ze zbioru danych typowe błędy w rejestrowanych wartościach, które mogą wynikać z awarii aparatury pomiarowej oraz błędów w komunikacji, a z drugiej strony wykluczyć ze zbioru okresy nietypowej pracy, czyli przykładowo okresy przed awaryjne.
W celu ograniczenia wpływu wartości odstających na wagi modelu, poza samym czyszczeniem danych, które jest kluczowe przy projektach przemysłowych, można także zastosować inną metodę estymacji modelu niż szacowanie parametrów strukturalnych metodą najmniejszych kwadratów. Przykładowo, wykorzystać można regresję opartą na funkcji straty Huber’a.
Funkcja Huber’a, jak i klasycznie wykorzystywana funkcja kwadratowa przedstawiona jest na wykresie poniżej. Jak można zaobserwować, w przypadku użycia funkcji Huber’a, wpływ wartości odstających wśród zmiennej wyjaśnianej przez model jest zmniejszony.
Inna metoda zmniejszenia wpływu wartości odstających to wyłączenie ich z ostatecznego zbioru danych uczących, co przykładowo może zostać wykonane metodą Random Sample Consensus. Algorytm polega na losowym wybieraniu punktów danych i dopasowywaniu do nich modelu (w analizowanym przypadku modelem jest regresja liniowa). W każdej iteracji model zbudowany na kilku obserwacjach, jest oceniany pod kątem liczby punktów nieodstających (inlierów), które zdefiniowane są jako te zawierające się w symetrycznym względem linii interwale. Ostatecznie najlepiej dopasowany model wraz z założonym interwałem, determinuje ostateczny zbiór uczący dla modelu regresji zgodnie z wykresem poniżej.Wykorzystanie metod odpornych na obecność wartości odstających może dodatkowo zapewnić lepszą generalizację, czyli brak efektu przeuczenia modelu, który to mógłby doprowadzić do sytuacji błędnej interpretacji szacowanego poziomu drgań przez system.
Poza modelem, system MSET opiera się także na poprawnej identyfikacji odchyleń od estymowanego przebiegu. Jednym z podejść może być wykorzystanie statystyki t-Studenta i wygenerowanie przedziału ufności opartego na wartości średniokwadratowego błędu otrzymanego na próbie uczącej. Przykładowe zastosowanie na rzeczywistych danych zaprezentowane jest na przykładzie poniżej.
Innym podejściem jest wykorzystanie metody Sequential Probability Ratio Test (SPRT). Jej celem jest badanie, czy pewne dane lub obserwacje są wystarczająco „anomalne” w stosunku do danej hipotezy zerowej, czyli hipotezy o braku anomalii. Na podstawie wartości błędu modelu względem wartości obserwowanych, system może interpretować parametry diagnostyczne pod kątem awarii lub znaczącej zmianie w pracy urządzenia mechanicznego.
System MSET można określić prostą implementacją Cyfrowego Bliźniaka, czyli wirtualnego odwzorowania fizycznego obiektu. Cyfrowe odzwierciedlenie pomiaru drgań może być istotną informacją dla osób nadzorujących procesy, ale dodatkowa pomoc w interpretacji różnic między wartościami pomiarów, a wartościami cyfrowymi wynikającymi z modelu, może stanowić podstawowy system wsparcia decyzji w zakresie diagnostyki.
Dostęp do wszystkich dostępnych wartości parametrów procesowych jest konieczny w celu utrzymania ruchu w procesie produkcyjnym, jednak mnogość informacji na ekranach w dyspozytorniach może utrudnić wychwycenia informacji o nietypowej pracy obiektu. Systemy wsparcia decyzji (DSS) powinny być zaprojektowane tak, aby umożliwiać użytkownikom szybkie i łatwe przekształcanie informacji w wiedzę i udostępniać im ją w formie, która jest dla nich użyteczna i zrozumiała. W ten sposób DSS są w stanie pomóc użytkownikom w podejmowaniu lepiej uzasadnionych decyzji. Oparta na danych historycznych i metodach statystycznych technika MSET, może być fundamentem pod implementację systemu wsparcia decyzyjnego.
Wdrożenie opisanego rozwiązania niesie za sobą dużo korzyści dla obiektu przemysłowego. Proces diagnostyki maszyn jest bardziej efektywny, co przekłada się na większą dostępność maszyn, a ryzyko awarii jest znacznie niższe. Systemy wsparcia decyzyjnego pozwalają na efektywniejsze planowanie procesu produkcji oraz przeglądów. Systemy te budują wśród dyspozytorów wiedzę na temat stanu technicznego maszyn oraz pozwalają im na szybszą reakcję w przypadku zdarzeń niepożądanych. W efekcie, koszty związane z utrzymanie ruchu są niższe.
KGHM Centrum Analityki z powodzeniem realizuje wdrożenia dedykowanych rozwiązań z zakresu wsparcia decyzyjnego, zarówno pod kątem prowadzenia diagnostyki, jak i optymalizacji energetycznej. Opisane w tym artykule podejście pochodzi z jednego z realizowanych obecnie projektów.
Autor:
Jędrzej Adaszyński
Data Scientist
KGHM Centrum Analityki sp. z o.o.