Koronawirus — wciąż nie mówimy o tym co trzeba! Wstępna analiza treści w Internecie

Covid-19 dominuje dysksuję światową i krajową. Problemem jednak jest to o czym rozmawiamy, gdyż wciąż skupiamy się na kolejnych przypadkach i jesteśmy pasywni wobec zagrożenia. Za mało dyskutujemy o sposobach radzenia sobie z kryzysem i przeciwdziałaniem.

Poniższy post to wstępne wyniki 356,798 wzmianek w mediach społecznościowych, forach, newsach, mediach itd. Analiza niestety nie uwzględnia Facebooka ze względu na brak dostępu do danych. Jeśli czyta to Brand24, to poproszę o update ;) Chciałem na szybko sprawdzić czy możliwe jest wyciągnięcie wartościowych informacji, bo obawiałem się, że dyskutujemy tylko o jednym, czyli zarażeniach i nowych wypadkach, nie skupiając się na rozwiązaniu kryzysu czy np. testowaniu. Miałem rację.

tl;dr kluczowy jest 4-ty obrazek w tym artkykule ;)

Jak działa social listening?

Moja praca wymaga ode mnie bycia na bieżąco z trendami oraz bycia blisko z konsumentami. Jeden z produktów, którym kieruje, opiera się na analizie nieustrukturyzowanego tekstu przy użyciu sztucznej inteligencji, by rozumieć co klienci mówią o danej marce i na podstawie tego podejmować decyzje biznesowe. Zanim to jednak nastąpi muszę najpierw zdobyć jakoś dane.

Osobiście używam narzędzia Crimson Hexagon/Brandwatch ze względu na globalny zasięg i to, że mamy pełne wpięcia do naszej infrastruktury w firmie. W dużym skrócie, narzędzie to używa robotów indeksujących, podobnie jak Google, i gromadzi wzmianki na dany temat, który wcześniej zadacie.

Użyłem prostego wpisu: [(coronavirus OR corona* OR covid* OR “covid-19” OR “wirus” OR koronawirus OR korona*) AND — (RT)], który pozwolił złapać większośc wpisów dotyczących koronawirusa w Polsce i jednocześnie usunął szum, np. z retweetów.

Postanowiłem je wykorzystać i zrozumieć o czym mówimy, żeby np. lepiej komunikować się z innymi, np. uspokajając ich lub lepiej moderować dyskusję, a także lobbować w którym kierunku powinniśmy dyskutować.

Pamiętajmy, że analiza jest wstępna, nie przechodziła przez kilka rąk, peer review, a sam Crimson Hexagon, jak każde narzędzie, też ma ograniczenia.

Ciągle mówimy tylko o kolejnych zarażeniach

Stworzyłem uproszczoną analize klastrów, usuwajac maksymalną ilośc największe częstości zaimków oraz większość róznych odmian słowa “koronawirus”.

Większość konwersacji to głównie wzmianki typu: “Minister Zdrowia poinformował o nowym przypadku” lub “Nowe przypadki koronawirusa w Polsce”; “Nowi zakażeni w Polsce”; “Zakażony w Poznaniu” etc.

Widać, że wciąż śledzimy jedną główną metrykę, czyli ilość zakażonych oraz liczbę zgonów i to na niej skupiają się media.

Wzmianki na forach, mediach społęcznościowych i newsach

Gdy wyczyścimy dane, usuwając z nich newsy i media, skupiając się na samym Twitterze i forach — informacje są wciąż niepełne. Dalej skupiamy się na liczbie zakazonych, ale zaczynamy widzieć porównania do Chin, Włoch. Ciągle są to jednak metryki pasywne, czyli opisujące minione przypadki. Relatywnie niedużo wpisów i wzmianek dotyczy zasad, środków przeciwdziałania, np. nie wychodzenia z domu.

Tylko Twitter i fora

O czym jeszcze dyskutuje się w Polsce poza przypadkami? Pozostawiłem wstepnie rzeczowniki i pododawałem odmiany przypadków do siebie (jakieś inne rzeczy, typu przymiotniki też się pewnie znajdą).

Pozwoliło to na stworzenie chmury tagów. Oczywiście usunąłem samego “koronawirusa”, bo zaburzałby wielkość.

Jest to bardzo proste narzędzie, pozwala określić o kim lub o czym jeszcze się mówi. Ważną postacią jest minister Szumowski i jego polityka informacyjna — wzmianki o nim pojawiają się praktycznie non stop
i niewątpliwie stanie się symbolem kryzysu koronawirusa.

Pojawiają się również daty, pokazujące jak ważny jest czas i tempo wirusa. Pomimo tego, kwestia zakażeń i nowych wypadków wciąż wybija
w konwersacji, a pozostałe tematy nie przebijają się do mainstreamu.

Chmura słów kluczowych

Za mało rozmawiamy o pacjentach i sposobach walki z wirusem!

Wszystkie analizy, które dotychczas wykonałem uwypkuklają dominację pasywnego reagowania, vs. przeciwdziałania.

Ostatnią z rzeczy, którą wykonałem, to kategoryzacja słów kluczowych z chmury tagów wg kilku subiektywnych kategorii:

  1. Zarażenia — wpisy o nowych przypadkach
  2. Populacja/obszary kraju — informacje geograficzne, nt. ryzyka, zagrożonych mieszkańców etc
  3. Rząd/służby — min. Szumowski, Premier, Prezydent, służby, sanepid etc.
  4. Działania/zalecenia — wszystkie kwestie związane z zostawaniem w domu, kwarantanną, zamknięciem szkół, home office, etc.
  5. Czas/daty — stempel czasowy wydarzeń, głównie pokazujący
  6. Informacje — agencje prasowe, zdjęcia, mapy, infografiki etc.
  7. Europa/Świat — wzmianki o innych krajach, przede wszystkim, Włoszech, Chinach i USA
  8. Szpitale/pacjenci — wzmianki o personelu, stanie szpitali itd.
  9. Brak kategorii — tam gdzie nie dało się przyporządkować do innych

Pamiętajmy, że moja kategoryzacja jest subiektywna i wiele z tych tematów to wspólne zbiory. Jeśli sami chcecie pobawić się w analizę, to w linku macie plik z surowymi danymi.

Oczywiście można też przyczepić się samych wybranych kategorii, ale wciąż widać pewne prawidłowości.

  1. Dyskutujemy dwukrotnie więcej o zarażeniach, niż o o działaniach i zaleceniach. Media powinny grzać kwestie zostawania w domu, społecznej odpowiedzialności, wspólnego działania, zamiast skupiać się na opisie przypadków per różne geografie + konferencje MZ.
  2. Kwestia szpitali i stanu pacjentów schodzi na dalszy plan — prawie w ogóle nie rozmawiamy o zaopatrzeniu, potrzebach i samopoczuciu pacjentów.
  3. Liczba zarażonych (ok. ~200) daje w tym momencie Polakom fałszywe poczucie bezpieczeństwa, gdyż nie jest to właściwa metryka. Liczba ta wciąż jest relatywnie niska.
  4. Ze wszystkich publikacji, tylko 1% (!) wzmianek miał w sobie słowo: “test”, co oznacza, że nie mówimy o tym, że testów na wirusa w naszym kraju się praktycznie nie wykonuje.
Podział procentowy 6,631 występowań 127 najczęściej wymienianych słów kluczowych

Podsumowując, skupmy się na tym, co faktycznie może nam pomóc, czyli sposobach walki z wirusem i rzetelnej polityce informacyjnej, m.in. lobby nt rzetelnego testowania i sposobów izolacji. Potrzebujemy publikacji o wskaźniku R0 (więcej w linku), nieodpowiedzialnych zachowaniach Polaków (wycieczki na Ślężę w dolnośląskim) i piętnowaniu przypadków łamania kwarantanny.

Co więcej, musimy sami pracować nad tym, by spokojnie przeciwdziałać, zamiast publikować kolejne przypadki i siać strach poprzez fearclicki.

Jeśli mamy o czymś pisać od dziś, to przede wszystkim o testowaniu lub jego braku oraz stanie polskich szpitali i pacjentów oraz przyciskaniu znajomych, którzy wesoło jeżdżą na ferie.

Powodzenia, udostępniajcie dalej i dajcie znać jeśli chcecie żebym wszedł w jakiś temat głębiej!

MW

Dodatek: jakie źródła przeanalizowałem?

Wiadomo, że temat jest powszechnie dyskutowany, ale mamy obecnie ponad 356 tysięcy wspomnień w kontekście koronawirusa. Moja analiza nie uwzględnia Facebooka, więc jest stosunkowo ograniczona.

Na przestrzeni ostatniego tygodnia, od 9 do 16 marca zaobserwowano wzrost o 120%. Jeśli weźmiemy pod uwagę wzrost od 1 marca, to ilość wzmianek urosła ponad pięciokrotnie!

Zakładając,że Facebook jest najpopularniejszym medium w Polsce, reszta konwersacji odbywa się głównie w newsach oraz na Twitterze. Fora, w tym np. Wykop.pl czy wp.pl, również generują widoczny ruch. Oczywiście, brak głównego medium jest problemem, ale musimy założyć, że tematy są podobne.

--

--

CEO @ Valueships; COO @ Stanversity; Ph.D. on SaaS Pricing; ex-McKinsey; Wroclaw, Poland; Husband & Dad

Love podcasts or audiobooks? Learn on the go with our new app.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store