Badanie ma na celu analizę wskaźnika samobójstw w ujęciu zarówno kontynentalnym jak i krajowym, uwzględniając podział na mężczyzn i kobiety. Sprawdzona zostanie zależność między badanym wskaźnikiem a spożyciem alkoholu, wydatkami na opiekę zdrowotną z własnej kieszeni, rządowymi wydatkami na opiekę zdrowotną oraz PKB per capita. Wnioski wysnuwane są na podstawie przefiltrowanych i zgrupowanych danych oraz korelacji spearmana, na którą zdecydowałem się ze względu na liczne wartości odstające w badanym zestawie danych. Analiza w głównej mierze sprawdza wpływ czynników finansowych na wskaźnik samobójstw, nie uwzględniając tym samym czynników społecznych.
country - kraje
year - rok
sex - płeć, podział na mężczyzn,
kobiety oraz ujęcie ogólne
suicide - wskaźnik (Współczynnik
śmiertelności z powodu samobójstw) liczony w następujący sposób: (liczba
samobójstw w ciągu roku / liczba ludności) * 100 000 mówi więc on nam
ile samobójstw w ciągu roku przypada na 100 000 mieszkańców
country - kraje
year - rok
sex - płeć, podział na mężczyzn,
kobiety oraz ujęcie ogólne
alcohol - wskaźnik (średnie dzienne
spożycie na osobę w gramach wśród osób pijących) liczony w następujący
sposób: APC x 1000 x 0,793/365 , gdzie APC to Alcohol Per Capita,
pomnożone razy 1000 bo zmieniamy z litrów na mililitry a następnie
mnożymy razy 0,793 czyli wagę alkoholu oraz dzielimy na 365 aby uzyskać
dzienne spożycie.
country - kraje
year - rok
oop (out of pocket) - wydatki na
opiekę zdrowotną przypadające na jedną osobę w gospodarstwie domowym
wyrażone w USD.
country - kraje
year - rok
dghe- wydatki rządowe na opiekę
zdrowotną w przeliczeniu na osobę wyrażone w USD
country - kraje
year - rok
pkb - średnia roczna produkcja
gospodarcza na osobę w danym kraju lub regionie, skorygowana o inflację
i różnice w kosztach utrzymania między krajami.
źródło: https://ourworldindata.org/grapher/gdp-per-capita-worldbank?tab=table
1a) Na którym kontynencie i w jakim kraju wskaźnik osiąga wartość
najwyższą, a w którym najniższą?
1b) Czy płeć ma znaczenie?
1c)
Jak to wygląda jeśli chodzi o Polskę?
2a) Jak zmieniał się wskaźnik samobójstw na przestrzeni lat w ujęciu
kontynentalnym?
3a) Czy istnieje zależność między średnim spożyciem alkoholu w kraju
(wśród osób pijących) a samobójstwami?
3b) Czy w krajach, gdzie
obywatele płacą za leczenie z własnej kieszeni, wskaźnik samobójstw jest
wyższy?
3c) Czy w krajach z wyższymi wydatkami rządowymi na opiekę
zdrowotną wskaźnik samobójstw jest niższy?
3d) Czy istnieje
zależność między pkb per capita a samobójstwami?
## 'data.frame': 12210 obs. of 4 variables:
## $ country: chr "Saint Vincent and the Grenadines" "Oman" "occupied Palestinian territory, including east Jerusalem" "Jordan" ...
## $ year : int 2021 2021 2021 2021 2021 2021 2021 2021 2021 2021 ...
## $ sex : chr "Female" "Female" "Female" "Female" ...
## $ suicide: num 0 0.21 0.23 0.29 0.34 0.26 0.33 0.32 0.36 0.43 ...
| country | year | sex | suicide | |
|---|---|---|---|---|
| Length:12210 | Min. :2000 | Length:12210 | Min. : 0.000 | |
| Class :character | 1st Qu.:2005 | Class :character | 1st Qu.: 3.540 | |
| Mode :character | Median :2010 | Mode :character | Median : 6.740 | |
| NA | Mean :2010 | NA | Mean : 9.532 | |
| NA | 3rd Qu.:2016 | NA | 3rd Qu.:12.300 | |
| NA | Max. :2021 | NA | Max. :95.200 |
## [1] 9.376667
Średnia wartość dla badanego wskaźnika wynosi 9,5. Oznacza to, że średnio na świecie samobójstwo co roku (w badanym okresie) popełnia około 9 osób na 100 000 populacji, natomiast mediana wynosi 6,7 co może wskazywać na pewną asymetrię rozkładu naszych danych i outliery. Odchylenie standardowe jest niemalże równe średniej, co wskazuje na duże zróżnicowanie danych. Aby to lepiej zobrazować zobaczmy jak to wygląda na boxplocie.
Łatwo zauważyć, że jest wiele krajów, dla których wskaźnik jest o
wiele większy od mediany. Może to wynikać w szczególności z różnic
kulturowych, religijnych oraz różnic w populacji. Niektóre kraje mogą
również zaniżać liczbę samobójstw chociażby poprzez złą jakość
raportowania (w szczególności w mniej zamożnych państwach), a jeszcze
inne nie są uwzględnione w analizie ze względu na brak danych np. Korea
Północna i Południowa oraz Rosja.
| continent | sex | mean_continent_suicide |
|---|---|---|
| Africa | Both sexes | 7.11 |
| Africa | Female | 3.79 |
| Africa | Male | 10.49 |
| Asia | Both sexes | 7.74 |
| Asia | Female | 4.07 |
| Asia | Male | 11.24 |
| Europe | Both sexes | 14.46 |
| Europe | Female | 6.53 |
| Europe | Male | 23.05 |
| North America | Both sexes | 6.00 |
| North America | Female | 2.38 |
| North America | Male | 9.68 |
| Oceania | Both sexes | 12.07 |
| Oceania | Female | 6.00 |
| Oceania | Male | 18.12 |
| South America | Both sexes | 11.51 |
| South America | Female | 5.26 |
| South America | Male | 17.85 |
Najwyższy współczynnik dla obu płci osiągnęła Europa i wynosi on
14,46. Oznacza to, że na 100 000 osób, samobójstwo popełnia 14. Jeśli
chodzi o podział na mężczyzn i kobiety to Europa również jest na
prowadzeniu i wskaźniki wynoszą kolejno: 23,05 dla mężczyzn oraz 6,53
dla kobiet.
Oznacza to, że na 100 000 mężczyzn samobójstwo popełnia
23, na 100 000 kobiet samobójstwo popełnia około 7. Na podstawie
powyższych danych można stwierdzić, iż w Europie mężczyźni popełniają
samobójstwo około 3 razy częściej niż kobiety.
Najniższy
współczynnik dla obu płci widzimy w Ameryce Północnej (6). Dla kobiet i
mężczyzn również będzie to również Ameryka Północna: Kobiety (2,38)
Mężczyźni (9,68)
| country | sex | mean_country_suicide |
|---|---|---|
| Lithuania | Both sexes | 36.79 |
| Belarus | Both sexes | 30.03 |
| Guyana | Both sexes | 29.23 |
| Kazakhstan | Both sexes | 27.06 |
| Ukraine | Both sexes | 26.55 |
| Suriname | Both sexes | 24.12 |
| Latvia | Both sexes | 23.72 |
| Hungary | Both sexes | 23.54 |
| Slovenia | Both sexes | 23.19 |
| Lesotho | Both sexes | 21.97 |
Spośród wszystkich krajów, najwyższy wskaźnik dla obu płci osiągnęła Litwa i wynosi on 36,79, co oznacza, że na 100 000 mieszkańców Litwy, samobójstwo co roku popełnia średnio 37 osób. Co ciekawe, w “top 10” znajduje się aż 7 krajów postkomunistycznych.
| country | sex | mean_country_suicide |
|---|---|---|
| Lithuania | Male | 64.62 |
| Belarus | Male | 53.94 |
| Ukraine | Male | 47.73 |
| Kazakhstan | Male | 46.79 |
| Guyana | Male | 45.40 |
| Latvia | Male | 41.90 |
| Hungary | Male | 37.62 |
| Slovenia | Male | 36.82 |
| Suriname | Male | 36.40 |
| Estonia | Male | 35.07 |
| Kiribati | Male | 33.97 |
| Sri Lanka | Male | 33.62 |
| Japan | Male | 31.34 |
| Mongolia | Male | 31.22 |
| Lesotho | Male | 30.74 |
Jeśli chodzi o mężczyzn to wskaźnik największy jest również na Litwie i wynosi 64.62. Warto pochylić się tutaj nad Japonią, która plasuje się na 13 miejscu z wynikiem 31.34, albowiem ogromnym problemem w tym kraju jest samotność, co przekłada się w znacznym stopniu na liczbę samobójstw. Jest to również jedyny kraj spośród “top 13”, który ma populację większą niż 100 milionów. Warto w tym momencie wspomnieć, że najwyższa wartość wskaźnika =/= największa liczba samobójstw. Aby to zobrazować przeprowadzę obliczenia dla naszego “top 1” (Litwy) oraz dla naszego “top 13” (Japonii):
| continent | country | year | sex | suicide |
|---|---|---|---|---|
| Asia | Japan | 2011 | Male | 33.16 |
| Europe | Lithuania | 2011 | Male | 66.48 |
Dla przykładu weźmy rok 2011:
Litwa: wskaźnik = 66.48, populacja mężczyzn: 1 403 000
(wikipedia)
Japonia: wskaźnik = 31.16, populacja mężczyzn: 62 184
000 (stat.go.jp)
Przypominam, że wskaźnik został obliczony w następujący sposób: (liczba samobójstw w ciągu roku / liczba ludności) * 100 000 Chcąc wydobyć samą liczbę samobójstw należy wynik pomnożyć przez liczbę ludności (w tym wypadku przez liczbę mężczyzn) i podzielić przez 100 000.
Litwa: około 932 samobójstw
Japonia: około 19 377 samobójstw
Podsumowując, pomimo tego że wskaźnik dla Litwy jest dwa razy większy niż dla Japonii, w Litwie mężczyźni popełniają ponad 20 razy mniej samobójstw.
| country | sex | mean_country_suicide |
|---|---|---|
| Lesotho | Female | 13.67 |
| India | Female | 13.62 |
| Guyana | Female | 13.41 |
| Lithuania | Female | 12.70 |
| Japan | Female | 12.56 |
| Belgium | Female | 11.60 |
| Suriname | Female | 11.60 |
| Switzerland | Female | 10.81 |
| Hungary | Female | 10.74 |
| Serbia | Female | 10.57 |
Najwyższy wskaźnik dla kobiet osiągnęło Lesotho (kraj w południowej Afryce) oraz Indie gdzie wskaźniki wynosły 13,67 i 13,62.
| country | sex | mean_country_suicide |
|---|---|---|
| Antigua and Barbuda | Both sexes | 0.67 |
| Lebanon | Both sexes | 0.82 |
| Sao Tome and Principe | Both sexes | 0.86 |
| Egypt | Both sexes | 0.92 |
| Jordan | Both sexes | 1.19 |
| Peru | Both sexes | 1.41 |
| Jamaica | Both sexes | 1.42 |
| Saudi Arabia | Both sexes | 1.53 |
| Papua New Guinea | Both sexes | 1.77 |
| Indonesia | Both sexes | 1.79 |
Badany wskaźnik dla obu płci osiąga najmniejszą wartość dla Antigui i Barbudy (Kraj na Karaibach) i wynosi 0.67 Oznacza to, że na 1 000 000 mieszkańców samobójstwo popełnia 7 osób. Jeśli chodzi o bardziej znane kraje to na drugim miejsciu znajduje się Liban z wartością 0.82.
| country | sex | mean_country_suicide |
|---|---|---|
| Lebanon | Male | 0.96 |
| Antigua and Barbuda | Male | 1.17 |
| Sao Tome and Principe | Male | 1.28 |
| Egypt | Male | 1.37 |
| Jordan | Male | 1.62 |
| Saudi Arabia | Male | 1.75 |
| Peru | Male | 1.90 |
| Papua New Guinea | Male | 2.09 |
| Indonesia | Male | 2.30 |
| Jamaica | Male | 2.51 |
Dla samych mężczyzn, wskaźnik jest najmniejszy w Libanie i wynosi 0,96 czyli na 100 000 mężczyzn przypada jedno samobójstwo.
| country | sex | mean_country_suicide |
|---|---|---|
| Antigua and Barbuda | Female | 0.23 |
| Jamaica | Female | 0.34 |
| Oman | Female | 0.44 |
| Sao Tome and Principe | Female | 0.44 |
| Egypt | Female | 0.46 |
| Grenada | Female | 0.63 |
| Maldives | Female | 0.63 |
| Lebanon | Female | 0.69 |
| Jordan | Female | 0.73 |
| United Arab Emirates | Female | 0.78 |
Natomiast jeśli chodzi o kobiety, znowu widzimy Antigue i Barbude na pierwszym miejsciu oraz Jamajkę na drugim.
| country | sex | poland_mean_suicide |
|---|---|---|
| Poland | Both sexes | 16.457 |
| Poland | Female | 4.494 |
| Poland | Male | 29.207 |
Widoczna jest duża dysproporcja pomiędzy obliczonymi średnimi wartościami wskaźnika. Aby sprawdzić czy jest ona statystycznie istotna, przeprowadzę test dla dwóch średnich.
Hipotezy:
H0: m1 = m2
H1: m1 > m2
Czyli sprawdzimy czy średnia wartość wskaźnika samobójstw jest statystycznie większa dla mężczyzn, ale najpierw trzeba sprawdzić, którego testu możemy użyć, a którego nie.
##
## Shapiro-Wilk normality test
##
## data: .
## W = 0.90213, p-value = 0.0328
##
## Shapiro-Wilk normality test
##
## data: .
## W = 0.92739, p-value = 0.1082
Ponieważ dane dla mężczyzn nie są zgodne z rozkładem normalnym (p-value < 0.05) nie mogę tutaj użyć testu t-studenta - skorzystam z testu Wilcoxona.
##
## Wilcoxon rank sum exact test
##
## data: x and y
## W = 484, p-value = 4.753e-13
## alternative hypothesis: true location shift is greater than 0
Wyliczona wartość p-value jest mniejsza od 0.05 czyli odrzucamy H0.
Możemy zatem stwierdzić, że średnia dla mężczyzn jest istotnie większa od średniej dla kobiet.
Wracając, widzimy więc, że w Polsce wskaźnik dla obu płci wynosi
16,46, co sugeruje, że średnio co roku na 100 000 obywateli Polski
przypada 16 samobójstw.
Jak zmieni się ta liczba, jeśli zamiast 100
000 mieszkańców weźmiemy cały kraj? Na podstawie danych z GUS obliczyłem
średni stan ludności w Polsce w latach 2000-2021 i wynosi on 38 293 191.
(16,46 / 100 000) * 38 293 191 = 6303,06 = 6303 - średnio tyle osób
popełnia samobójstwo co roku. Patrząc na te dane od razu rzuca się w
oczy dysproporcja między wskaźnikiem dla mężczyzn i dla kobiet, albowiem
dla mężczyzn jest on ponad 7 razy większy, co oznacza, że w Polsce
mężczyźni popełniają samobójstwo 7 razy częściej niż kobiety.
W Europie możemy zauważyć największą tendencję spadkową, albowiem
wskaźnik z poziomu 17.5 (2000 r.) zmalał do około 11.5 (2020 r.) co
zdaje się być sporym sukcesem. Można by powiedzieć, że wraz z ogólnym
rozwojem i polepszeniem się poziomu życia współczynnik ten malał.
Widzimy również, że w latach 2007 - 2009 wskaźnik zaczął rosnąć co może
częściowo pokrywać się czasowo z globalnym kryzysem gospodarczym, jednak
brak jest podstaw do jednoznacznego wnioskowania o zależności
przyczynowej.
Tendencję spadkową można zauważyć również w Azji oraz w Ameryce
Północnej co prawdopodobnie również ma powiązanie z rozwojem i poprawą
warunków życiowych.
Afryka zdaje się zaś utrzymywać wskaźnik na podobnym poziomie przez
cały badany okres, co z kolei może wiązać się z powolnym rozwojem w
tamtejszych rejonach.
Najbardziej zmienna zdaje się być Ameryka Południowa, gdzie wskaźnik rósł i malał na zmianę.
x<-suicide_alcohol%>%
filter(sex=="Both sexes")%>%
group_by(continent,sex)
cor(x$suicide,x$alcohol,method = "spearman")
## [1] 0.4762647
Korelacja wynosi 0.48, co sugeruje umiarkowaną zależność pomiędzy alkoholem a samobójstwami. Sprawdźmy jeszcze jak to wygląda jeśli chodzi o mężczyzn i kobiety osobno.
x<-suicide_alcohol%>%
filter(sex=="Male")%>%
group_by(continent,sex)
cor(x$suicide,x$alcohol,method="spearman")
## [1] 0.5365437
Widzimy, że korelacja dla mężczyzn wzrosła do 0.54. Co prawda interpretacja pozostaje bez zmian, ale wyższa korelacja może wskazywać na to, że zależność między spożywaniem alkoholu a samobójstwami jest silniejsza w przypadku mężczyzn aniżeli w przypadku kobiet. Zobaczmy jeszcze jak to wygląda na wykresie.
W Afryce możemy zauważyć, że rosnące spożycie alkoholu nie ma
wpływu na współczynnik samobójstw. Największą zależność widzimy dla
Europy oraz Azji, gdzie dla Europy zdaje się być silniejsza dlatego w
dalszej części badania skupię się właśnie na niej.
x<-suicide_alcohol%>%
filter(sex=="Male",continent=="Europe")%>%
group_by(continent,sex)
cor(x$suicide,x$alcohol,method="spearman")
## [1] 0.5424906
Korelacja dla mężczyzn w Europie jest niemalże identyczna jak w przypadku korelacji globalnej.
Łatwo zauważyć, że wraz ze wzrostem spożywanego alkoholu rośnie
również wskaźnik samobójstw. Oczywiście, nie jest to relacja liniowa,
ponieważ korelacja wyniosła 0.54, jednakże widać pewną zależność.
Widzimy również kraje, które pomimo wysokiego spożycia alkoholu,
wskaźnik samobójstw mają relatywnie niski oraz na odwrót - wskaźnik
samobójstw jest absurdalnie wysoki przy wcale nie tak dużym spożyciu
alkoholu. Oznacza to, że wśród pijących osób, alkohol może mieć wpływ na
popełniane samobójstwa, jednakże nie jest on głównym czynnikiem.
x<-suicide_alcohol%>%
filter(sex=="Female")%>%
group_by(continent,sex)
cor(x$suicide,x$alcohol,method = 'spearman')
## [1] 0.3125813
Dla kobiet sytuacja wygląda już nieco inaczej - mianowicie korelacja wyniosła 0.31, przez co nie możemy już mówić o umiarkowanej zależności, albowiem taki wynik sugeruje słabą zależność.
W tym miejscu warto również sprawdzić jak wygląda spożycie alkoholu ze względu na płeć.
| sex | mean_alcohol |
|---|---|
| Both sexes | 12.27 |
| Female | 5.08 |
| Male | 19.82 |
Jak widzimy, średnia wartość wskaźnika dla mężczyzn jest niemalże 4 razy większa od wartości wskaźnika dla kobiet.
Powszechną wiedzą jest szkodliwość alkoholu oraz jego negatywne działanie na nasz organizm chociażby na wątrobę, trzustkę czy też serce. Warto jednak wspomnieć, że alkohol nie dotyka nas tylko na poziomie fizycznym. Ludzie z problemami często sięgają po różne używki takie jak narkotyki, czy też właśnie alkohol aby chwilowo zapomnieć o problemach, jednak w rzeczywistości działa to w drugą stronę. Często takie zachowanie nie dość, że pogłębia pierwotny problem to dodatkowo generuje nowe - takie jak depresja, zaburzenia lękowe czy też zaniki pamięci oraz może prowadzić do uzależnienia.
Alkohol w pewnym stopniu przyczynia się do popełnianych samobójstw, w szczególności u mężczyzn, jednakże na podstawie przedstawionych danych nie można stwierdzić, że jest on głównym determinantem omawianego zjawiska.
cor(suicide_oop$suicide,suicide_oop$oop,method = 'spearman')
## [1] 0.1565698
Korelacja między własnymi wydatkami na opiekę zdrowotną a wskaźnikiem samobójstw jest słaba (0.16). Oznacza to, że wysokie wydatki mogą mieć w niektórych krajach wpływ na wyższy wskaźnik samobójstw, jednak nie jest to relacja przyczynowo-skutkowa. Aby to lepiej zobrazować, spójrzmy na wykres.
Widzimy, że najwięcej danych znajduje się w przedziale 0-500 USD,
oraz właśnie w tym przedziale wskaźnik samobójstw osiąga najwyższe jak i
najniższe wartości. To sugeruje, że dla większości świata wydatki na
opiekę zdrowotną z własnej kieszeni mają znikomy wpływ na popełniane
samobójstwa. Dla Europy możemy zaobserwować, że wskaźnik samobójstw
utrzymuje się stosunkowo wysoko przy rosnących wydatkach. Oznacza to, że
wysokie wydatki lub ich brak nie są głównymi czynnikami, które
oddziałują na badany wskaźnik.
cor(suicide_dghe$suicide,suicide_dghe$dghe,method='spearman')
## [1] 0.2975694
Korelacja w tym przypadku jest już nieco wyższa, (0.3) ale dalej kwalifikuje się jako słaba. Jest ona jednak wyższa niż w przypadku wydawania własnych pieniędzy, co mogłoby sugerować pewien paradoks, mianowicie: wzrostowi rządowych wydatków na opiekę zdrowotną towarzyszy większy wzrost wskaźnika samobójstw, niż w przypadku finansowania leczenia z własnej kieszeni. Jest to o tyle ciekawe, że intuicyjnie wydawałoby się, że jest na odwrót.
Widzimy, że na przestrzeni lat wydatki rządowe wzrosły, co jednak nie miało przełożenia na wskaźnik samobójstw. Możemy zauważyć duże zróżnicowanie - najwięcej danych jest skupione w przedziale 0 - 2000 USD, gdzie znajdziemy państwa zarówno z wysokim, a nawet najwyższym wskaźnikiem samobójstw jak i najniższym.
cor(suicide_pkb$pkb,suicide_pkb$suicide,method='spearman')
## [1] 0.243138
Korelacja na poziomie 0.24 wskazuje na słabą zależność pomiędzy PKB per capita a wskaźnikiem samobójstw. Oznacza to, że w niektórych krajach wzrostowi PKB per capita mógł towarzyszyć wzrost wskaźnika samobójstw.
Wykresy dla poszczególnych lat nie różnią się znacząco od siebie. Największe zagęszczenie danych ma miejsce w przedziale 0 - 50 000 USD gdzie znajdziemy zarówno najwyższą jak i najniższą wartość wskaźnika.
Na podstawie badanych danych pokazane zostało, w którym kraju oraz na jakim kontynencie wskaźnik samobójstw osiąga wartość najwyższą oraz najniższą. Przedstawiono jak badany wskaźnik zmieniał się w czasie w ujęciu kontynentalnym oraz sprawdzono korelację pomiędzy spożyciem alkoholu wśród osób pijących oraz trzema czynnikami ekonomicznymi. Na podstawie wykonanych testów, wykazano iż spożycie alkoholu ma największy wpływ na wskaźnik śmiertelności z powodu samobójstw spośród badanych czynników. Korelacja pomiędzy finansowymi czynnikami a badanym wskaźnikiem wyszła niska, co może wskazywać na to, że większe przełożenie mają czynniki społeczno-kulturowe, takie jak religia, samotność czy też ustrój w państwie.