Testowanie przyszłości.
- Paweł Krotki-Borowicki
- 31 mar
- 9 minut(y) czytania
Zaktualizowano: 2 kwi
„Dane są potężne, ponieważ są uniwersalne. Ceną jest kontekst"—C Thi Nguyen.
Motorycy i sportowi fizjo używają coraz większej ilości sprzętu do poszerzania diagnostyki i podejmowania decyzji w złożonych procesach usprawniania (treningu i rehabilitacji). Światowa, a zarazem polska, branża S&C staje się przez to jeszcze bardziej innowacyjna i kieruje się uzasadnioną potrzebą personalizowania programów treningowych względem deficytów i nieprawidłowości, które są łatwiejsze do detekcji aniżeli było to możliwe jeszcze na początku lat dwutysięcznych, kiedy testowano wyłącznie subiektywnymi środkami palpacji lub banalnych wyników 3,2,1 lub 0 jak boli.
O tym jak poradzić sobie z nadmiarem informacji w dobie nadmiaru informacji, jak tworzyć tzw. model efektywny w swojej praktyce oraz jaki może mieć to wpływ na wybór konkretnych interwencji—jest tematem niniejszego tekstu, będącego zbiorem refleksji po konferencji Vald Performance, która w dniach 22–23 marca 2024 odbyła się w Legia Training Center.

Kluczowe punkty
1. Testowanie nie jest celem samym w sobie—stanowi element szerszego podejścia (najlepszych praktyk), które obejmuje diagnozę, edukację, progresję, indywidualizację oraz uwzględnianie specyficznych zastrzeżeń. Ważniejsze niż zbieranie danych jest właściwa selekcja testów, ich krytyczna interpretacja i łatwość w tłumaczeniu na praktykę.
2. Więcej danych nie zawsze oznacza lepsze decyzje—kluczowe znaczenie ma umiejętność właściwego operowania pozyskiwanymi informacjami, a następnie przedstawienie ich w sposób czytelny całemu zespołowi, który zarządza urazem. Istotna jest priorytetyzacja kluczowych wskaźników performance (KPIs), unikając przesadnego polegania na banalnych i często zwodniczych metrykach.
3. Przyszłością analizy sportowej i medycznej jest integracja danych z AI—ze względu na coraz bardziej skomplikowane zbiory informacji, rośnie znaczenie narzędzi opartych o sztuczną inteligencję. Modele językowe mają potencjał do kompleksowego analizowania i generowania spersonalizowanych programów treningowych, co może istotnie wspierać ekspertów w podejmowaniu trafnych decyzji.
Najlepsze praktyki
Testowanie nie funkcjonuje w próżni.
W praktyce fizjoterapii jest niepodważalną częścią reguł postępowania. Nazywamy je “najlepszymi praktykami” (best practices) i choć w wyniku kampanii reklamowych producentów sprzętu może jawić się jako ich centralna część, w rzeczywistości stanowi 1/5 składowych, będących w wielu przypadkach następstwem diagnozy klinicznej (Diagram 1.). To ważny komentarz, gdyż hype na platformy, dynamometry i encodery prędkości sprawia, iż testowanie zyskuje czasami ideologiczny wręcz charakter, przesłania inne, podobnie ważne aspekty ścieżki postępowania (również te subiektywne) i w niektórych przypadkach—wprowadza w błąd.

Epicki powrót
Patrząc szerzej, testowanie (jako zestaw wybranych testów) warto wpisać w powszechne zasady praktyki. Jedną z nich opisuje akronim EPIC, oznaczający “nadzwyczajny” w kontekście powrotu do sportu (RTS), znaczący w domyśle 'epic return'. Jego inicjały oznaczają kolejno: (E) edukacja, (P) progresywne przeciążenie od popularnego 'progressive overload', (I) indywidualizacja oraz (C) zastrzeżenia, czyli 'concerns'. Rehab, który aspiruje do bycia epickim, integruje więc odpowiednie metody obiektywizacji, obejmując (ustandaryzowane) testy funkcjonalne rozszerzające diagnostykę kliniczną i ułatwiające personalizację interwencji z zastrzeżeniem, że nie są one wyłącznie numeryczną abstrakcją, lecz można je w łatwy sposób wdrożyć w codzienną praktykę.
Epickim nie będzie więc pomysł, by ideologicznie mierzyć wszystko bez umiaru, tym bardziej, że zawsze czegoś, najcześciej negatywnego, doszukamy się w metrykach. Szukając istotnych nieprawidłowości i asymetrii, nie zapominamy o aspektach pozytywnych, komunikując cechy, które są dobrze rozwinięte i porównując je do czasu po zabiegu lub wartości normatywnych, by dać choć odrobinę kontekstu. Skoro testowanie, wg najlepszych praktyk, znajduje się "po" diagnozie, to "po" zbieraniu danych powinno być nam łatwiej zarządzać urazem i wybierać najlepszą ścieżkę leczenia, np. zachowawczego vs chirurgicznego.
Stanie się to wtedy, gdy dany uraz badany będzie specyficznie. Jednak w wielu przypadkach bólu mięśniowo–szkieletowego (nawet 90% dla bólu pleców) nie mamy konkretnej diagnozy i mierzymy się z niespecyficznymi zespołami objawów lub kiedy podejrzewamy błąd diagnostyczny. Odpowiednia bateria testów może poprawić więc nasze zrozumienie (czynników ryzyka), z zastrzeżeniem (C), by wybierać takie testy, które dla testowanej osoby mają, nie hipotetyczne, a racjonalne znaczenie z perspektywy symptomów utrudniających codzienne funkcjonowania lub zaangażowanie w sport.
Skala–po–skali
Prawidłowe testowanie przeprowadza się skala–po–skali.
Od dołu: mierząc zakresy ruchu i dalej w górę: deficyty sił w specyficznych zakresach, i następnie elastyczność, wzorce ruchowe, siłę maksymalną, skoki wertykalne i biomechanikę biegania—bynajmniej taką logiką kierują się współcześnie terapeuci mięśniowo–szkieletowi. Dostępne rozwiązania high–tech powinny więc odkrywać zależności między tym co ukryte, a tym co "wyłania się" jako produkt końcowy, kiedy badana osoba biegnie, skacze, dźwiga, hamuje czy ścina (Diagram 2.).

Proponowane podejście ma za zadanie stworzenie kompleksowej bazy danych, która pozwala identyfikować kluczowe aspekty urazu (pola czerwone) oraz ich wzorce kompensacji (pola niebieskie). Dzięki temu praktycy mogą interweniować z większą precyzją i adresować problemy według stworzonej w ten sposób introspekcji: idąc od źródła problemu na wyższy poziom złożoności—zwany emergentnym—czyli obserwowalnym wyłącznie na tym poziomie i zdeterminowanym przez procesy oddolnej kontroli motorycznej, aplikowania sił i samoorganizacji.
Schemat ten może obejmować pozostałe rozszerzenia diagnostyczne zawierające wskazówki z badań krwi, składu ciała, metabolizmu, VO2max, USG, termografii, rezonansu magnetycznego czy różnorakich wearables, w tym danych GPS—wszystko co może zostać zliczone można ująć w systemie, którego używa się do zarządzania urazem. Mimo, że zbieranie ogromnych ilości danych wydaje się nieosiągalne dla pospolitego fizjo, to "wielkie dane" (big data) są tym czym obecnie zajmują się topowe kliniki i kluby, realizując misję zapobiegania ponownym kontuzjom.
Modelowanie danych
Opracowanie dużych ilości informacji wymaga zaawansowanej analityki.
Na wstępie wymaga określenia rozdzielczości oraz skali integralności systemu: tego czy poza podstawowymi testami pozyskujemy też pozostałe personalia. Rozdzielczość opisuje skalę detali, integralność natomiast skalowalność: to czy dane kopiemy wielopoziomo czy ograniczamy się wyłącznie do pojedynczego rodzaju testów. Próba rozszyfrowania układu wysokiej–rozdzielczości (jakim jest sprawność atletyczna) oznacza uwzględnienie ogromnej ilości wyników: jednych bardziej fundamentalnych jak podstawowe zakresy ruchu, innych bardziej emergentnych jak piłkarz w pędzie biegu. W efekcie może to przesadnie rozciągać zakres odczytów: od relatywnie prostej kinetyki sił po dalece zmienną kinematykę zadań sportowych.
Porównać to można do mapy, która przedstawia nie tylko nierówności terenu, drogi i zabudowania, ale także nierówności asfaltu, znaki drogowe i kamienie na szlakach. Planując wędrówkę, wiele szczegółów na takiej mapie nie jest potrzebnych. Dobra mapa powinna być rozrysowana na siatce, która odcina tę część detali, które są zbędne dla celu podróży, tym bardziej jak chcemy opłynąć świat dookoła, zdobyć górski szczyt czy bezpiecznie wrócić do gry. Stawiając kroki milowe, nie da się zaglądać pod każdy kamień i sprawdzać czy czai się tam niebezpieczeństwo i jednocześnie iść efektywnie przed siebie.
Odrzucanie informacji zbędnych jest praktyką, która w naukach ścisłych nosi nazwę uśredniania, choć w akademickim żargonie zwie się "modelowaniem gruboziarnistym" (coarse graining). Jakkolwiek koncepcyjnie proste, tworzenie modelu opartego na uśrednianiu jest niezwykle trudne pod względem matematycznym—tym bardziej, gdy próbujemy wnioskować wzdłuż opisanych przeze mnie poziomów złożoności. Dlatego tak ważną rolę pełnią kluczowe wskaźniki mierzone zarówno dla wydajności jak i zdrowia (key performance indicators, KPIs)—ich priorytetyzacja oferuje maksymalne korzyści przy minimalnym ryzyku utraty sedna sprawy.
Raportowanie i storytelling
Nie mając danych, mamy wyłącznie opinie i często tak jest, że brak wiedzy opartej na jakichkolwiek faktach, z jakiegoś powodu, kreuje śmiałe i wyssane z palca tezy. Jednak mając dane, w którymś momencie jakąś opinię warto wyrazić i nie przesłaniać się za każdym razem ulubionym zwrotem analityków—“to zależy”.
W nauce o danych—młodszej siostrze współczesnej statystyki—przyjmuje się, iż końcowe podsumowanie wyników (testów) wymaga od eksperta (a raczej grupy ekspertów, ale o tym na końcu) umiejętności inspirującego storytellingu. Nie jest to bynajmniej fikcja, bowiem jednym z kluczowych zadań 'data science' jest graficzna wizualizacja danych, by praktykom było łatwiej dostosowywać rutynę. Każda technologia ma z reguły swoją aplikację, która ma taki feature. Vald Hub, dla przykładu, zawiera dashboard (panel), który można zaprojektować w miarę dowolnie, by wyświetlał to co dla prewencji urazów ma krytyczne znaczenie.
Opracowanie surowych danych może wszak wiązać się z zatrudnieniem analityka z dobrze rozwiniętym sportowym zmysłem. Specjalista taki dokonuje agregacji, czyszczenia, syntezy i ekstrakcji krytycznych wskaźników i następnie “wypluwa” tak klarowny raport, że nawet … sztab trenerski go rozumie. Pomijając sarkastyczny ton tej anegdoty, odzwierciedla ona realną i często spotykaną dychotomię między, na ogół, gorliwymi technooptymistami młodej daty, narzucającymi wnikliwe analizy, a utytułowanymi trenerami, którzy załamują ręce, widząc jak całość dyskusji o sportowym doskonaleniu sprowadza się do pojedynczego słupka.
Fasada precyzji
W badaniach sports science mamy aktualnie dość osobliwą sytuację, w której sporą część analiz wykonuje się względem pojedynczych metryk, a wnioski opiera na liniowych korelacjach między wynikiem, a całością fenomenu sportowego performance. Oprócz tego, wybór testów ogranicza się często do podobnej skali, np. CMJ i IMTP (balistyka i izometria obunóż), często bez refleksji nad wpływem urazu na synergie mięśniowe czy zachowanie całej osoby w sportowym otoczeniu.
Podobne wnioski wyciągnąć też można z popularnych wskaźników tj. eccentric utilisation ratio (EUR), hamstring/quadriceps ratio (H:Q) czy nawet DSI (dynamic strength index). Każdy z nich oparty jest na na tyle prostym pomyśle (podzielenia jednej wartości przez drugą), by wiedzieć że takich kalkulacji nie warto używać do wnioskowania. Nawet sam twórca DSI, Sheppard, w swoim artykule z 2011 roku przestrzegł przed zbyt dosłownym traktowaniem wartości 0,6, która decyduje o tym czy zawodnik powinien rozwijać siłę maksymalną czy dynamiczną.
Obyczaje te tworzą fasadę profesjonalizmu, którą nazywam 'scam–based rehab', czyli rehabilitacją opartą na chłamie. Skrywa ona złudzenie kontroli nad tym, czego nie da się (w tym momencie) opisać żadnym skończonym równaniem. Zdarza się, że przywiązanie do nadmiernego używania technologii i "liczenia" każdego przypadku powoduje sytuacje, w których zapominamy o elementarnych aspektach testowania klinicznego (o których nie napisałem prawie nic) i umiejętności słuchania (wywiadu). Obnaża też prawdę, że często sami komplikujemy proces rehabilitacji: jak pacjent zgłasza, że ma regres, że nowe ćwiczenia prowokują ból, a poza tym ostatnimi czasy niedosypia, to ta "informacja" w zupełności wystarcza, by zmodyfikować program, a jak problem się nawarstwia—skonsultować go z lekarzem.
Testowanie przyszłości
Współczesna medycyna i sport zmagają się z rosnącą ilością danych: od biomechaniki, przez fizjologię, po genetykę. Pozyskiwanie danych staje się ponadto coraz bardziej dostępne, a ich ilość rośnie wykładniczo, przesilając ludzkie zdolności poznawcze i prowadząc do paraliżu analizy. Tradycyjne podejście, oparte na analizie wybranych metryk i prostych korelacjach, nie radzi sobie w pełni z opisem dynamicznej rzeczywistości, której nie da się zredukować do wszystkich składowych elementów, które ją tworzą.
Integracja multimodalnych zbiorów danych w spójne modele treningowe jest wprawdzie możliwa dzięki konsyliom eksperckim, jednak jest to rozwiązanie kosztowne, czasochłonne, wymagające chęci wymiany sprzecznych poglądów i trudne do skalowania. W tym właśnie miejscu wielkie nadzieje przypisuje się roli sztucznej inteligencji. Nowoczesne modele językowe, tj. GPT-4 czy nadchodzący GPT-5, operują miliardami parametrów, potrafią sugerować trafniejsze diagnozy, nigdy nie są zmęczone i nade wszystko: mogą rozświetlać kontekst między rozproszonymi informacjami.
W połączeniu z ludzką ekspertyzą i odpowiednim wytrenowaniem generatywnego wnioskowania, AI może projektować prospektywne, spersonalizowane rekomendacje prozdrowotne i plany treningowe, otwierając nowy rozdział w praktyce 'sports science', która poza przybliżonym modelowaniem, będzie też w stanie uwzględniać unikalne, niedostrzegalne i wysoko–zmienne detale.
Czas pokaże, czy kontakt z tą nieznaną technologią otworzy nam oczy na sprawy, które nie śniły nam się dotychczas czy może cała ta obietnica sztucznej inteligencji okaże się rozdmuchanym balonem, który koniec–końców pełnić będzie jedynie rolę taniego sekretarza, po którym specjalista S&C i tak będzie zmuszony poprawiać i wyrażać mniej lub bardziej trafne opinie.
Ograniczenia
Poglądy zawarte w tym tekście są w dużej mierze koncepcyjne i wyrażają osobiste przekonania autora. Nie definiują tego czym jest "diagnoza" i "testowanie" i mogą być trudne do zrozumienia osobom, które nie pracują na codzień w warunkach klinicznych lub nigdy nie pracowały w żadnym laboratorium 'sports science'. Brak przykładowych 'case studies' jest ograniczeniem, które może utrudniać przełożenie przedstawionej teorii na praktykę. Artykuł pomija też aspekt psychologiczny: motywację, sportową tożsamość i lęk przed ponowną kontuzją. Pobieżnie omawia kwestie ekonomiczne związane z wdrożeniem nowoczesnych technologii i zatrudnieniem analityków danych, co jest głównym zastrzeżeniem wielu centrów medycyny sportu i prywatnych gabinetów fizjoterapii. Na koniec, brakuje w nim refleksji nad aspektami etycznymi przechowywania danych osobowych elitarnych sportowców.
W przyszłości planuję podzielić przykładami raportów opartych o "wielkie dane", które stworzone są w wyniku specjalistycznej analizy oraz wsparciu rozwiązań AI. Celowo nie wrzucam ich tutaj, by zachować apetyt na później.
TBC ...
Przeczytaj więcej
Musat CL et al. Diagnostic Applications of AI in Sports: A Comprehensive Review of Injury Risk Prediction Methods. Diagnostics (Basel) (2024) OPEN ACCESS. Brearley S et al. The Dynamic Strength Index: Is it a Useful Tool to Guide Programming Decisions? OPEN ACCESS.
Bolling C et al. Context Matters: Revisiting the First Step of the ‘Sequence of Prevention’ of Sports Injuries. Sports Medicine (2018). OPEN ACCESS.
Bittencourt NF et al. Complex Systems Approach for Sports Injuries: Moving from Risk Factor Identification to Injury Pattern Recognition—Narrative Review and New Concept. British Journal of Sports Medicine (2016). OPEN ACCESS.
Dijkstra HP et al. Managing the Health of the Elite Athlete: A New Integrated Performance Health Management and Coaching Model. British Journal of Sports Medicine (2014). OPEN ACCESS.
Wzbogać dyskusję
Zareaguj na idee zawarte w powyższym tekście, pisząc na: me@pawelkrotki.com.