WSTĘP

Badanie ma na celu analizę wskaźnika samobójstw w ujęciu zarówno kontynentalnym jak i krajowym, uwzględniając podział na mężczyzn i kobiety. Sprawdzona zostanie zależność między badanym wskaźnikiem a spożyciem alkoholu, wydatkami na opiekę zdrowotną z własnej kieszeni, rządowymi wydatkami na opiekę zdrowotną oraz PKB per capita. Wnioski wysnuwane są na podstawie przefiltrowanych i zgrupowanych danych oraz korelacji spearmana, na którą zdecydowałem się ze względu na liczne wartości odstające w badanym zestawie danych. Analiza w głównej mierze sprawdza wpływ czynników finansowych na wskaźnik samobójstw, nie uwzględniając tym samym czynników społecznych.

DANE

SUICIDE:

country - kraje
year - rok
sex - płeć, podział na mężczyzn, kobiety oraz ujęcie ogólne
suicide - wskaźnik (Współczynnik śmiertelności z powodu samobójstw) liczony w następujący sposób: (liczba samobójstw w ciągu roku / liczba ludności) * 100 000 mówi więc on nam ile samobójstw w ciągu roku przypada na 100 000 mieszkańców

źródło: https://www.who.int/data/gho/data/indicators/indicator-details/GHO/crude-suicide-rates-(per-100-000-population)

ALCOHOL

country - kraje
year - rok
sex - płeć, podział na mężczyzn, kobiety oraz ujęcie ogólne
alcohol - wskaźnik (średnie dzienne spożycie na osobę w gramach wśród osób pijących) liczony w następujący sposób: APC x 1000 x 0,793/365 , gdzie APC to Alcohol Per Capita, pomnożone razy 1000 bo zmieniamy z litrów na mililitry a następnie mnożymy razy 0,793 czyli wagę alkoholu oraz dzielimy na 365 aby uzyskać dzienne spożycie.

źródło: https://www.who.int/data/gho/data/indicators/indicator-details/GHO/average-daily-intake-in-grams-of-alcohol--population-15

OOP

country - kraje
year - rok
oop (out of pocket) - wydatki na opiekę zdrowotną przypadające na jedną osobę w gospodarstwie domowym wyrażone w USD.

źródło: https://www.who.int/data/gho/data/indicators/indicator-details/GHO/out-of-pocket-expenditure-(oop)-per-capita-in-us

DGHE

country - kraje
year - rok
dghe- wydatki rządowe na opiekę zdrowotną w przeliczeniu na osobę wyrażone w USD

źródło - https://www.who.int/data/gho/data/indicators/indicator-details/GHO/domestic-general-government-health-expenditure-(gghe-d)-per-capita-in-us

PKB

country - kraje
year - rok
pkb - średnia roczna produkcja gospodarcza na osobę w danym kraju lub regionie, skorygowana o inflację i różnice w kosztach utrzymania między krajami.

źródło: https://ourworldindata.org/grapher/gdp-per-capita-worldbank?tab=table

PYTANIA BADAWCZE

I. Zapoznanie się z danymi, interpretacja statystyk opisowych, filtrowanie i grupowanie danych

1a) Na którym kontynencie i w jakim kraju wskaźnik osiąga wartość najwyższą, a w którym najniższą?
1b) Czy płeć ma znaczenie?
1c) Jak to wygląda jeśli chodzi o Polskę?

II. Interpretacja danych historycznych

2a) Jak zmieniał się wskaźnik samobójstw na przestrzeni lat w ujęciu kontynentalnym?

III. Badanie zależności + wykresy

3a) Czy istnieje zależność między średnim spożyciem alkoholu w kraju (wśród osób pijących) a samobójstwami?
3b) Czy w krajach, gdzie obywatele płacą za leczenie z własnej kieszeni, wskaźnik samobójstw jest wyższy?
3c) Czy w krajach z wyższymi wydatkami rządowymi na opiekę zdrowotną wskaźnik samobójstw jest niższy?
3d) Czy istnieje zależność między pkb per capita a samobójstwami?

I. Zapoznanie się z danymi, interpretacja statystyk opisowych, filtrowanie i grupowanie danych

## 'data.frame':    12210 obs. of  4 variables:
##  $ country: chr  "Saint Vincent and the Grenadines" "Oman" "occupied Palestinian territory, including east Jerusalem" "Jordan" ...
##  $ year   : int  2021 2021 2021 2021 2021 2021 2021 2021 2021 2021 ...
##  $ sex    : chr  "Female" "Female" "Female" "Female" ...
##  $ suicide: num  0 0.21 0.23 0.29 0.34 0.26 0.33 0.32 0.36 0.43 ...
country year sex suicide
Length:12210 Min. :2000 Length:12210 Min. : 0.000
Class :character 1st Qu.:2005 Class :character 1st Qu.: 3.540
Mode :character Median :2010 Mode :character Median : 6.740
NA Mean :2010 NA Mean : 9.532
NA 3rd Qu.:2016 NA 3rd Qu.:12.300
NA Max. :2021 NA Max. :95.200
## [1] 9.376667

Średnia wartość dla badanego wskaźnika wynosi 9,5. Oznacza to, że średnio na świecie samobójstwo co roku (w badanym okresie) popełnia około 9 osób na 100 000 populacji, natomiast mediana wynosi 6,7 co może wskazywać na pewną asymetrię rozkładu naszych danych i outliery. Odchylenie standardowe jest niemalże równe średniej, co wskazuje na duże zróżnicowanie danych. Aby to lepiej zobrazować zobaczmy jak to wygląda na boxplocie.


Łatwo zauważyć, że jest wiele krajów, dla których wskaźnik jest o wiele większy od mediany. Może to wynikać w szczególności z różnic kulturowych, religijnych oraz różnic w populacji. Niektóre kraje mogą również zaniżać liczbę samobójstw chociażby poprzez złą jakość raportowania (w szczególności w mniej zamożnych państwach), a jeszcze inne nie są uwzględnione w analizie ze względu na brak danych np. Korea Północna i Południowa oraz Rosja.

1a) Na którym kontynencie i w jakim kraju wskaźnik osiąga wartość najwyższą, a w którym najniższą?

1b) Czy płeć ma znaczenie?

UJĘCIE KONTYNENTALNE

continent sex mean_continent_suicide
Africa Both sexes 7.11
Africa Female 3.79
Africa Male 10.49
Asia Both sexes 7.74
Asia Female 4.07
Asia Male 11.24
Europe Both sexes 14.46
Europe Female 6.53
Europe Male 23.05
North America Both sexes 6.00
North America Female 2.38
North America Male 9.68
Oceania Both sexes 12.07
Oceania Female 6.00
Oceania Male 18.12
South America Both sexes 11.51
South America Female 5.26
South America Male 17.85

Najwyższy współczynnik dla obu płci osiągnęła Europa i wynosi on 14,46. Oznacza to, że na 100 000 osób, samobójstwo popełnia 14. Jeśli chodzi o podział na mężczyzn i kobiety to Europa również jest na prowadzeniu i wskaźniki wynoszą kolejno: 23,05 dla mężczyzn oraz 6,53 dla kobiet.
Oznacza to, że na 100 000 mężczyzn samobójstwo popełnia 23, na 100 000 kobiet samobójstwo popełnia około 7. Na podstawie powyższych danych można stwierdzić, iż w Europie mężczyźni popełniają samobójstwo około 3 razy częściej niż kobiety.
Najniższy współczynnik dla obu płci widzimy w Ameryce Północnej (6). Dla kobiet i mężczyzn również będzie to również Ameryka Północna: Kobiety (2,38) Mężczyźni (9,68)

Najwyższe wartości wskaźnika samobójstw

Ogólnie

country sex mean_country_suicide
Lithuania Both sexes 36.79
Belarus Both sexes 30.03
Guyana Both sexes 29.23
Kazakhstan Both sexes 27.06
Ukraine Both sexes 26.55
Suriname Both sexes 24.12
Latvia Both sexes 23.72
Hungary Both sexes 23.54
Slovenia Both sexes 23.19
Lesotho Both sexes 21.97

Spośród wszystkich krajów, najwyższy wskaźnik dla obu płci osiągnęła Litwa i wynosi on 36,79, co oznacza, że na 100 000 mieszkańców Litwy, samobójstwo co roku popełnia średnio 37 osób. Co ciekawe, w “top 10” znajduje się aż 7 krajów postkomunistycznych.

Mężczyźni

country sex mean_country_suicide
Lithuania Male 64.62
Belarus Male 53.94
Ukraine Male 47.73
Kazakhstan Male 46.79
Guyana Male 45.40
Latvia Male 41.90
Hungary Male 37.62
Slovenia Male 36.82
Suriname Male 36.40
Estonia Male 35.07
Kiribati Male 33.97
Sri Lanka Male 33.62
Japan Male 31.34
Mongolia Male 31.22
Lesotho Male 30.74

Jeśli chodzi o mężczyzn to wskaźnik największy jest również na Litwie i wynosi 64.62. Warto pochylić się tutaj nad Japonią, która plasuje się na 13 miejscu z wynikiem 31.34, albowiem ogromnym problemem w tym kraju jest samotność, co przekłada się w znacznym stopniu na liczbę samobójstw. Jest to również jedyny kraj spośród “top 13”, który ma populację większą niż 100 milionów. Warto w tym momencie wspomnieć, że najwyższa wartość wskaźnika =/= największa liczba samobójstw. Aby to zobrazować przeprowadzę obliczenia dla naszego “top 1” (Litwy) oraz dla naszego “top 13” (Japonii):

continent country year sex suicide
Asia Japan 2011 Male 33.16
Europe Lithuania 2011 Male 66.48

Dla przykładu weźmy rok 2011:

Litwa: wskaźnik = 66.48, populacja mężczyzn: 1 403 000 (wikipedia)
Japonia: wskaźnik = 31.16, populacja mężczyzn: 62 184 000 (stat.go.jp)

Przypominam, że wskaźnik został obliczony w następujący sposób: (liczba samobójstw w ciągu roku / liczba ludności) * 100 000 Chcąc wydobyć samą liczbę samobójstw należy wynik pomnożyć przez liczbę ludności (w tym wypadku przez liczbę mężczyzn) i podzielić przez 100 000.

Litwa: około 932 samobójstw
Japonia: około 19 377 samobójstw

Podsumowując, pomimo tego że wskaźnik dla Litwy jest dwa razy większy niż dla Japonii, w Litwie mężczyźni popełniają ponad 20 razy mniej samobójstw.

Kobiety

country sex mean_country_suicide
Lesotho Female 13.67
India Female 13.62
Guyana Female 13.41
Lithuania Female 12.70
Japan Female 12.56
Belgium Female 11.60
Suriname Female 11.60
Switzerland Female 10.81
Hungary Female 10.74
Serbia Female 10.57

Najwyższy wskaźnik dla kobiet osiągnęło Lesotho (kraj w południowej Afryce) oraz Indie gdzie wskaźniki wynosły 13,67 i 13,62.

Najniższe wartości wskaźnika samobójstw

Ogólnie

country sex mean_country_suicide
Antigua and Barbuda Both sexes 0.67
Lebanon Both sexes 0.82
Sao Tome and Principe Both sexes 0.86
Egypt Both sexes 0.92
Jordan Both sexes 1.19
Peru Both sexes 1.41
Jamaica Both sexes 1.42
Saudi Arabia Both sexes 1.53
Papua New Guinea Both sexes 1.77
Indonesia Both sexes 1.79

Badany wskaźnik dla obu płci osiąga najmniejszą wartość dla Antigui i Barbudy (Kraj na Karaibach) i wynosi 0.67 Oznacza to, że na 1 000 000 mieszkańców samobójstwo popełnia 7 osób. Jeśli chodzi o bardziej znane kraje to na drugim miejsciu znajduje się Liban z wartością 0.82.

Mężczyźni

country sex mean_country_suicide
Lebanon Male 0.96
Antigua and Barbuda Male 1.17
Sao Tome and Principe Male 1.28
Egypt Male 1.37
Jordan Male 1.62
Saudi Arabia Male 1.75
Peru Male 1.90
Papua New Guinea Male 2.09
Indonesia Male 2.30
Jamaica Male 2.51

Dla samych mężczyzn, wskaźnik jest najmniejszy w Libanie i wynosi 0,96 czyli na 100 000 mężczyzn przypada jedno samobójstwo.

Kobiety

country sex mean_country_suicide
Antigua and Barbuda Female 0.23
Jamaica Female 0.34
Oman Female 0.44
Sao Tome and Principe Female 0.44
Egypt Female 0.46
Grenada Female 0.63
Maldives Female 0.63
Lebanon Female 0.69
Jordan Female 0.73
United Arab Emirates Female 0.78

Natomiast jeśli chodzi o kobiety, znowu widzimy Antigue i Barbude na pierwszym miejsciu oraz Jamajkę na drugim.

1c) Jak to wygląda jeśli chodzi o Polskę?

country sex poland_mean_suicide
Poland Both sexes 16.457
Poland Female 4.494
Poland Male 29.207

Widoczna jest duża dysproporcja pomiędzy obliczonymi średnimi wartościami wskaźnika. Aby sprawdzić czy jest ona statystycznie istotna, przeprowadzę test dla dwóch średnich.

Hipotezy:

H0: m1 = m2

H1: m1 > m2

Czyli sprawdzimy czy średnia wartość wskaźnika samobójstw jest statystycznie większa dla mężczyzn, ale najpierw trzeba sprawdzić, którego testu możemy użyć, a którego nie.

Test dla mężczyzn

## 
##  Shapiro-Wilk normality test
## 
## data:  .
## W = 0.90213, p-value = 0.0328

Test dla kobiet

## 
##  Shapiro-Wilk normality test
## 
## data:  .
## W = 0.92739, p-value = 0.1082

Ponieważ dane dla mężczyzn nie są zgodne z rozkładem normalnym (p-value < 0.05) nie mogę tutaj użyć testu t-studenta - skorzystam z testu Wilcoxona.

## 
##  Wilcoxon rank sum exact test
## 
## data:  x and y
## W = 484, p-value = 4.753e-13
## alternative hypothesis: true location shift is greater than 0

Wyliczona wartość p-value jest mniejsza od 0.05 czyli odrzucamy H0.

Możemy zatem stwierdzić, że średnia dla mężczyzn jest istotnie większa od średniej dla kobiet.

Wracając, widzimy więc, że w Polsce wskaźnik dla obu płci wynosi 16,46, co sugeruje, że średnio co roku na 100 000 obywateli Polski przypada 16 samobójstw.
Jak zmieni się ta liczba, jeśli zamiast 100 000 mieszkańców weźmiemy cały kraj? Na podstawie danych z GUS obliczyłem średni stan ludności w Polsce w latach 2000-2021 i wynosi on 38 293 191.
(16,46 / 100 000) * 38 293 191 = 6303,06 = 6303 - średnio tyle osób popełnia samobójstwo co roku. Patrząc na te dane od razu rzuca się w oczy dysproporcja między wskaźnikiem dla mężczyzn i dla kobiet, albowiem dla mężczyzn jest on ponad 7 razy większy, co oznacza, że w Polsce mężczyźni popełniają samobójstwo 7 razy częściej niż kobiety.

II. Interpretacja danych historycznych

2a) Jak zmieniał się wskaźnik samobójstw na przestrzeni lat w ujęciu kontynentalnym?


W Europie możemy zauważyć największą tendencję spadkową, albowiem wskaźnik z poziomu 17.5 (2000 r.) zmalał do około 11.5 (2020 r.) co zdaje się być sporym sukcesem. Można by powiedzieć, że wraz z ogólnym rozwojem i polepszeniem się poziomu życia współczynnik ten malał. Widzimy również, że w latach 2007 - 2009 wskaźnik zaczął rosnąć co może częściowo pokrywać się czasowo z globalnym kryzysem gospodarczym, jednak brak jest podstaw do jednoznacznego wnioskowania o zależności przyczynowej.

Tendencję spadkową można zauważyć również w Azji oraz w Ameryce Północnej co prawdopodobnie również ma powiązanie z rozwojem i poprawą warunków życiowych.

Afryka zdaje się zaś utrzymywać wskaźnik na podobnym poziomie przez cały badany okres, co z kolei może wiązać się z powolnym rozwojem w tamtejszych rejonach.

Najbardziej zmienna zdaje się być Ameryka Południowa, gdzie wskaźnik rósł i malał na zmianę.

III. Badanie zależności + wykresy

3a) Czy istnieje zależność między średnim spożyciem alkoholu (wśród osób pijących) w kraju a samobójstwami?

Ogólnie

x<-suicide_alcohol%>%
  filter(sex=="Both sexes")%>%
  group_by(continent,sex)

cor(x$suicide,x$alcohol,method = "spearman")
## [1] 0.4762647

Korelacja wynosi 0.48, co sugeruje umiarkowaną zależność pomiędzy alkoholem a samobójstwami. Sprawdźmy jeszcze jak to wygląda jeśli chodzi o mężczyzn i kobiety osobno.

Mężczyźni

x<-suicide_alcohol%>%
  filter(sex=="Male")%>%
  group_by(continent,sex)

cor(x$suicide,x$alcohol,method="spearman")
## [1] 0.5365437

Widzimy, że korelacja dla mężczyzn wzrosła do 0.54. Co prawda interpretacja pozostaje bez zmian, ale wyższa korelacja może wskazywać na to, że zależność między spożywaniem alkoholu a samobójstwami jest silniejsza w przypadku mężczyzn aniżeli w przypadku kobiet. Zobaczmy jeszcze jak to wygląda na wykresie.


W Afryce możemy zauważyć, że rosnące spożycie alkoholu nie ma wpływu na współczynnik samobójstw. Największą zależność widzimy dla Europy oraz Azji, gdzie dla Europy zdaje się być silniejsza dlatego w dalszej części badania skupię się właśnie na niej.

x<-suicide_alcohol%>%
  filter(sex=="Male",continent=="Europe")%>%
  group_by(continent,sex)

cor(x$suicide,x$alcohol,method="spearman")
## [1] 0.5424906

Korelacja dla mężczyzn w Europie jest niemalże identyczna jak w przypadku korelacji globalnej.


Łatwo zauważyć, że wraz ze wzrostem spożywanego alkoholu rośnie również wskaźnik samobójstw. Oczywiście, nie jest to relacja liniowa, ponieważ korelacja wyniosła 0.54, jednakże widać pewną zależność. Widzimy również kraje, które pomimo wysokiego spożycia alkoholu, wskaźnik samobójstw mają relatywnie niski oraz na odwrót - wskaźnik samobójstw jest absurdalnie wysoki przy wcale nie tak dużym spożyciu alkoholu. Oznacza to, że wśród pijących osób, alkohol może mieć wpływ na popełniane samobójstwa, jednakże nie jest on głównym czynnikiem.

Kobiety

x<-suicide_alcohol%>%
  filter(sex=="Female")%>%
  group_by(continent,sex)

cor(x$suicide,x$alcohol,method = 'spearman')
## [1] 0.3125813

Dla kobiet sytuacja wygląda już nieco inaczej - mianowicie korelacja wyniosła 0.31, przez co nie możemy już mówić o umiarkowanej zależności, albowiem taki wynik sugeruje słabą zależność.

W tym miejscu warto również sprawdzić jak wygląda spożycie alkoholu ze względu na płeć.

sex mean_alcohol
Both sexes 12.27
Female 5.08
Male 19.82

Jak widzimy, średnia wartość wskaźnika dla mężczyzn jest niemalże 4 razy większa od wartości wskaźnika dla kobiet.

Powszechną wiedzą jest szkodliwość alkoholu oraz jego negatywne działanie na nasz organizm chociażby na wątrobę, trzustkę czy też serce. Warto jednak wspomnieć, że alkohol nie dotyka nas tylko na poziomie fizycznym. Ludzie z problemami często sięgają po różne używki takie jak narkotyki, czy też właśnie alkohol aby chwilowo zapomnieć o problemach, jednak w rzeczywistości działa to w drugą stronę. Często takie zachowanie nie dość, że pogłębia pierwotny problem to dodatkowo generuje nowe - takie jak depresja, zaburzenia lękowe czy też zaniki pamięci oraz może prowadzić do uzależnienia.

Alkohol w pewnym stopniu przyczynia się do popełnianych samobójstw, w szczególności u mężczyzn, jednakże na podstawie przedstawionych danych nie można stwierdzić, że jest on głównym determinantem omawianego zjawiska.

3b) Czy w krajach, gdzie obywatele płacą za leczenie z własnej kieszeni, wskaźnik samobójstw jest wyższy?

cor(suicide_oop$suicide,suicide_oop$oop,method = 'spearman')
## [1] 0.1565698

Korelacja między własnymi wydatkami na opiekę zdrowotną a wskaźnikiem samobójstw jest słaba (0.16). Oznacza to, że wysokie wydatki mogą mieć w niektórych krajach wpływ na wyższy wskaźnik samobójstw, jednak nie jest to relacja przyczynowo-skutkowa. Aby to lepiej zobrazować, spójrzmy na wykres.


Widzimy, że najwięcej danych znajduje się w przedziale 0-500 USD, oraz właśnie w tym przedziale wskaźnik samobójstw osiąga najwyższe jak i najniższe wartości. To sugeruje, że dla większości świata wydatki na opiekę zdrowotną z własnej kieszeni mają znikomy wpływ na popełniane samobójstwa. Dla Europy możemy zaobserwować, że wskaźnik samobójstw utrzymuje się stosunkowo wysoko przy rosnących wydatkach. Oznacza to, że wysokie wydatki lub ich brak nie są głównymi czynnikami, które oddziałują na badany wskaźnik.

3c) Czy w krajach z wyższymi wydatkami rządowymi na opiekę zdrowotną wskaźnik samobójstw jest niższy?

cor(suicide_dghe$suicide,suicide_dghe$dghe,method='spearman')
## [1] 0.2975694

Korelacja w tym przypadku jest już nieco wyższa, (0.3) ale dalej kwalifikuje się jako słaba. Jest ona jednak wyższa niż w przypadku wydawania własnych pieniędzy, co mogłoby sugerować pewien paradoks, mianowicie: wzrostowi rządowych wydatków na opiekę zdrowotną towarzyszy większy wzrost wskaźnika samobójstw, niż w przypadku finansowania leczenia z własnej kieszeni. Jest to o tyle ciekawe, że intuicyjnie wydawałoby się, że jest na odwrót.

Widzimy, że na przestrzeni lat wydatki rządowe wzrosły, co jednak nie miało przełożenia na wskaźnik samobójstw. Możemy zauważyć duże zróżnicowanie - najwięcej danych jest skupione w przedziale 0 - 2000 USD, gdzie znajdziemy państwa zarówno z wysokim, a nawet najwyższym wskaźnikiem samobójstw jak i najniższym.

3d) Czy istnieje zależność między PKB per capita a samobójstwami?

cor(suicide_pkb$pkb,suicide_pkb$suicide,method='spearman')
## [1] 0.243138

Korelacja na poziomie 0.24 wskazuje na słabą zależność pomiędzy PKB per capita a wskaźnikiem samobójstw. Oznacza to, że w niektórych krajach wzrostowi PKB per capita mógł towarzyszyć wzrost wskaźnika samobójstw.

Wykresy dla poszczególnych lat nie różnią się znacząco od siebie. Największe zagęszczenie danych ma miejsce w przedziale 0 - 50 000 USD gdzie znajdziemy zarówno najwyższą jak i najniższą wartość wskaźnika.

PODSUMOWANIE

Na podstawie badanych danych pokazane zostało, w którym kraju oraz na jakim kontynencie wskaźnik samobójstw osiąga wartość najwyższą oraz najniższą. Przedstawiono jak badany wskaźnik zmieniał się w czasie w ujęciu kontynentalnym oraz sprawdzono korelację pomiędzy spożyciem alkoholu wśród osób pijących oraz trzema czynnikami ekonomicznymi. Na podstawie wykonanych testów, wykazano iż spożycie alkoholu ma największy wpływ na wskaźnik śmiertelności z powodu samobójstw spośród badanych czynników. Korelacja pomiędzy finansowymi czynnikami a badanym wskaźnikiem wyszła niska, co może wskazywać na to, że większe przełożenie mają czynniki społeczno-kulturowe, takie jak religia, samotność czy też ustrój w państwie.