Jakim sposobem najlepiej policzyć średnią

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
MPieniek
Użytkownik
Użytkownik
Posty: 6
Rejestracja: 14 lut 2011, o 12:10
Płeć: Mężczyzna
Lokalizacja: łódzkie
Podziękował: 1 raz

Jakim sposobem najlepiej policzyć średnią

Post autor: MPieniek »

Witajcie,
głowię się nad sposobem obliczenia średniej dla takiego przypadku (dane w arkuszu excel):
Chcę zbadać średnie zagęszczenie młodych drzewek w lesie. Młode drzewka rosną w specyficznych warunkach, to znaczy w miejscach po starych, przewróconych drzewach. Miejsca te nazywane są lukami. Luki są różnej wielkości, więcej jest małych luk niż dużych i są one wypełniane przez różną liczbę drzewek.
Dane:
excel z danymi:
... 7633dff7f5
areał luki w m2..................liczba drzewek
31 ............................................11
102 ...........................................11
28 ............................................ 1
46 ............................................ 85
31 ............................................ 18
15 ............................................ 1
33 ............................................ 1
19 ............................................ 0
51 ............................................ 6
34 .............................................50
88 .............................................101
79 ............................................. 46
38 ............................................. 5
58 ............................................. 8
32 .............................................8
31 .............................................17
211 ............................................2
176 ............................................50
53 ............................................. 1
41 ............................................. 2

SUMA 1197 m2 ........................ 424 drzewek

Najprostszym sposobem obliczenia średniej jest zsumować wszystkie odnotowane osobniki i podzielić przez zsumowany areał wszystkich luk. Otrzymamy wtedy 0,35 drzewka na 1m2, co po przeliczeniu na 100m2 daje 35 drzewek na 100m2.
Ale na wynik wpływają wtedy wyjątkowo duże luki. Więc można przeliczyć najpierw liczbę drzewek w każdej luce na 100m2 i wtedy obliczyć średnią. Wtedy każda luka ma tą samą teoretyczną wielkość, czyli każda ma 100m2.

Nr luki .............. Liczba drzewek w luce o powierzchni 100m2
1 ............................................35,48
2 ............................................10,78
3 ............................................3,57
4 ............................................184,78
5 ............................................58,06
6 ............................................6,67
7 ............................................3,03
8 ............................................0,00
9 ............................................11,76
10 ............................................147,06
11 ............................................114,77
12 ............................................58,23
13 ............................................13,16
14 ............................................13,79
15 ............................................25,00
16 ............................................54,84
17 ............................................0,95
18 ............................................28,41
19 ............................................1,89
20 ............................................4,88

............................................SUMA 777,12 drzewek na 2000m2 (bo 20 luk,a każda ma 100m2, co daje 2000m2)
Czyli sumujemy liczby drzewek i dzielimy przez liczbę luk. Otrzymamy 39 drzewek na 100m2.
Średnie obliczone tymi dwoma sposobami różnią się aż o 4 sztuki na 100m2.
Zaś średnia ważona obliczona dla pierwszego zestawu danych wynosi 26. Rozumiem, że średnia ważona mówi ile jest drzew odnotowanych na lukę. A potrzebuję wiedzieć ile jest drzewek na 100m2.
Bardzo proszę o sugestie.
szw1710

Jakim sposobem najlepiej policzyć średnią

Post autor: szw1710 »

Pytałeś już o to na zaprzyjaźnionym forum. Nie odpowiadałem, bo nie jestem pewien. Ale wydaje mi się, że właściwszą w drugim przypadku jest średnia harmoniczna.

Powiedzmy, że mamy tylko dwie dane: \(\displaystyle{ d_1}\) drzewek na \(\displaystyle{ 100\,\text{m}^2}\) w pierwszej luce i odpowiednio \(\displaystyle{ d_2}\). Więc w pierwszej luce masz jedno drzewko na \(\displaystyle{ \frac{100\text{m}^2}{d_1}}\) i podobnie w drugiej luce. Teraz jeśli luli mają być równomiernie zapełnione, to dajemy w obie po \(\displaystyle{ d}\) drzewek na \(\displaystyle{ 100\,\text{m}^2}\). Wobec tego łącznie w obu lukach mamy

\(\displaystyle{ \frac{100}{d_1}+\frac{100}{d_2}=\frac{100}{d}+\frac{100}{d}}\).

Dlatego \(\displaystyle{ \frac{2}{d}=\frac{1}{d_1}+\frac{1}{d_2}}\).

Stąd już widać, że \(\displaystyle{ d=\frac{1}{\frac{\tfrac{1}{d_1}+\tfrac{1}{d_2}}{2}}}\)

co jest średnią harmoniczną.
MPieniek
Użytkownik
Użytkownik
Posty: 6
Rejestracja: 14 lut 2011, o 12:10
Płeć: Mężczyzna
Lokalizacja: łódzkie
Podziękował: 1 raz

Jakim sposobem najlepiej policzyć średnią

Post autor: MPieniek »

Bardzo dziękuję za odpowiedź. Ze średnią harmoniczną jest mały problem. W jednej luce nie odnotowano w ogóle drzewek. W „statystyce dla przyrodników” przeczytałem, że średnia harmoniczna nie ma sensu dla elementów szeregu statystycznego równych zeru, ponieważ nie można dzielić przez zero. W tym naszym konkretnym przypadku jest tylko jedna luka „z zerem”, ale mam też inny zestaw danych, gdzie w 5 lukach nie odnotowano drzewek, a zbadano w sumie 20 luk.

Moim głównym zasadniczym pytaniem jest: z jakich danych policzyć średnią? Czy „z surowych”, czyli nie zwracam uwagi, że luki różnią się wielkością i liczę po prostu średnią, czy mam użyć do obliczenia średniej „dane przekształcone”, czyli dane z każdej luki najpierw zostają przeliczone na 100m2.-- 10 lis 2014, o 12:40 --Przejrzałem 3 książki do ekologii. Wzór na zagęszczenie osobników jest po prostu średnią arytmetyczną.
Zanim do nich dotarłem, przeglądałem rozprawę habilitacyjną, w której poruszony był problem zagęszczenia młodych drzewek w lukach. Autor podzielił zbadane przez siebie luki na trzy grupy: małe, średnie, duże. Dla każdej z trzech grup podał średnią arytmetyczną. Czyli jeżeli mamy przesłanki, aby przypuszczać że wielkość luki wpływa na zagęszczenie, to lepiej zastosować podział na małe, średnie i duże luki. Granica między małymi, średnimi i dużymi lukami jest "płynna". Zależy jak podzieli je autor. A podział zależy od miejsca wykonywania badań: góry, wyżyny, niziny, typ lasu, jego wiek wpływają na liczebność próby. Według niektórych artykułów, większość badanych przeze mnie luk jest mała.
MPieniek
Użytkownik
Użytkownik
Posty: 6
Rejestracja: 14 lut 2011, o 12:10
Płeć: Mężczyzna
Lokalizacja: łódzkie
Podziękował: 1 raz

Jakim sposobem najlepiej policzyć średnią

Post autor: MPieniek »

Wybieram drugi sposób liczenia średniej dla luk, ponieważ przeliczając najpierw dane z każdej luki na 100 m2 otrzymuję zagęszczenie drzewek dla każdej luki na 100m2. Rozumiem, że niweluję tym samym wpływ dużych luk na małe i odwrotnie.
ODPOWIEDZ