Sei sulla pagina 1di 24

Capı́tulo 1

Estimación de tamaño
poblacional

Existen diferentes procedimientos para estimar el tamaño y caracterı́sticas


de las poblaciones biológicas. A continuación se describen algunos métodos
que se basan en la división del ámbito que contiene la población en pequeñas
áreas regulares, por cuadricula, triangulación, etc, y mediante el empleo de
lı́neas transversales y de procedimientos de captura, marcado y recaptura.

1.1. Estimación por captura y recaptura


Suponga que se desea estimar N, la cantidad de animales en una po-
blación, (por ejemplo peces): se atrapan n1 animales, se marcan y luego se
sueltan, permitiendo que los marcados y no marcados se mezclen, luego se
extrae una segunda muestra en forma independiente de tamaño n2 , de tal for-
ma que el p % de los n2 están marcados, luego se tiene que bajo el supuesto
que la población no ha cambiado entre ambas muestras y que la recolección
proporciona una muestra aleatoria simple de la población, se estima que el
p % de la población están marcados y que por lo tanto n1 , marcados en la
primera muestra, representa el p % de la población, entonces

Se estima N como:

n1 −→ p % 100×n1
⇒x=
x −→ 100 p%

1
100 × n1
N̂ =
p%
100 × n1
=
100 × nm2
n1 × n2
=
m
Este método tiene varios supuestos

1. La población en cerrada: ningún elemento ha salido o entrado a la


población (N es la misma en ambas selecciones).

2. Cada individuo es una muestra aleatoria simple de la población.

3. Las dos muestras son independientes, es decir, que la probabilidad de


que un pez sea capturado en la segunda muestra es independiente (no
depende) de su historia de captura.

4. Los individuos marcados no pierde su marca.


n
X
Suponiendo un modelo de razón constante, entonces para ty = N = yi ,
i=1
donde yi = 1 para cada i ∈ U y definiendo

1 Si el i-ésimo individuo está marcado
xi =
0 Caso contrario
N
X
Entonces, t̂yr = tx β̂, donde tx = xi = n1 y
i=1
ȳ n2
β̂ = =
x̄ m
Luego,
n2 n1 n2
N̂ = t̂yr = n1 =
m m
(Esta estimación coincide con la estimación de máxima verosimilitud). Se
sigue entonces que (ignorando la correción para poblaciones finitas):

2
V̂ (N̂ ) = t2x V̂ (β̂)
 n n 2 n − m
1 2 2
=
m m(n2 − 1)
n2 n2 n2 − m n2
= 12
m m n2 − 1
n21 n2 (n2 − m)
=
m3
2 n2 (1 − m )
n 2 n2
= 12
m m

Dado que N̂ es un estimador sesgado, cuando los tamaños de muestras son


pequeños el sesgo puede ser muy grande y además es posible que la segunda
muestra no contenga individuos marcados, haciendo infinita la estimación.
En este caso se propone el estimador con menos sesgo

(n1 + 1)(n2 + 1)
Ñ = −1 (1.1)
m+1
Con el estimador de la varianza (Seber 1970)

(n1 + 1)(n2 + 1)(n1 − m)(n2 − m)


V̂ (Ñ ) = (1.2)
(m + 1)2 (m + 2)
Para estosqestimadores no se recomienda estimar I.C(100(1 − α) %) clási-
cos θ̂ ± z1− α2 V̂ (θ̂) para ninguno de los dos estimadores (N̂ y Ñ ) dado que
estos exigen normalidad (o ≈ N (0, 1)) para N̂ o Ñ y esta aproximación a
la normal puede no ser adecuada en estos casos, sobre todo para muestras
pequeñas. En estos casos de recomienda usar intervalos bootstrap (métodos
de remuestreo).

ejemplo 1.1.1 (Captura y recaptura) Para estimar la cantidad de peces


de un lago (N ) se atrapan 200 peces del lago, se mancan y luego se sueltan de
tal forma que se dejan un tiempo considerable para que los marcados y el resto
de los del lago se mezclen. Posteriormente se seleccionan aleatoriamente 100
peces de lago y se encuentra que 20 de ellos están marcados, es decir que
se estima que 20 % son marcados. Bajo el supuesto que la población no ha
cambiado, entonces se tiene que n1 = 200, n2 = 100 y m = 20 de donde

3
n1 n2
t̂y =
m
200(100)
=
20
= 1000 peces

con

 
m
n21 1− n2
V̂ (t̂y ) =
m2 m
20

200 1002 1 − 100
2
=
202 20
100 (100 − 20)
= 100
20
2
100 (80)
=
20
= 40000

entonces,
√ 200
e.e
ˆ = 40000 = 200 y Cve = × 100 = 20 %
1000

1.2. Tablas de contingencia para experimen-


tos con captura y recaptura
Fienberg (1972) sugiere que los datos de captura y recaptura se vean en
una tabla de contingencia incompleta. En general, si xij es la cifra observada
en la celda (i, j), la tabla de contingencia se ve como sigue:

¿Está en la segunda muestra?


Sı́ No
¿Está en la Sı́ x11 (= m) x12 x1+ (= n1 )
primera muestra? No x21 x∗22 x∗2+
x+1 (= n2 ) x∗+2 x∗++

El asterisco es porque no se observa esa celda. Las cifras esperadas son:

4
¿Está en la segunda muestra?
Sı́ No
¿Está en la Sı́ m11 m12 m1+
primera muestra? No m21 m∗22 m∗2+
m+1 m∗+2 m∗++ = N

para estimar las cifras esperadas usarı́amos m̂11 = x11 , m̂12 = x12 y
m̂21 = x21 . Si la presencia en la primera muestra es independiente de la
presencia en la segunda muestra, entonces las posibilidades de estar en la
segunda muestra son las mismas para los individuos marcados y los que no:
m11 m12
= ∗ . En consecuencia, bajo la independencia, en la celda con el
m21 m22
individuo no incluido en cualquiera de las muestras es:

m̂12 m̂21
m̂∗22 =
m̂11
x12 x21
= ,
x11
y

N̂ = m̂11 + m̂12 + m̂21 + m̂22


x+1 x1+
= .
x11

Se calcula la estimación de N̂ con base a la hipótesis de que las dos


muestras son independientes; pero esa hipótesis no se puede verificar debido
a que sólo se observan tres de las cuatro celdas de la tabla de contingencias.

ejemplo 1.2.1 Supongamos que se quiere estimas N , la cantidad de peces


en un lago. Se lleva a cabo el siguiente método: se atrapan y se marcan 200
peces del lago y se sueltan. Permitimos que los marcados se mezclen con los
demás peces del lago, luego, se extrae una segunda muestra independiente de
100 peces. 20 de la segunda muestra están marcados, entonces suponiendo
que la población no ha cambiado durante el proceso de recolección de ambas
muestras. De este modo, se tiene que :Para estimar los valores faltantes y
N , tenemos que:

5
¿Está en la segunda muestra?
Sı́ No
¿Está en la Sı́ 20 180 200
primera muestra? No 80 ? ?
100 ? N̂

m̂12 m̂21 x12 x21 180 × 80


m̂22 = = = = 720
m̂11 x11 20
y
x+1 x1+ 100 × 200
N̂ = = = 1000
x11 20
Por tanto:

¿Está en la segunda muestra?


Sı́ No
¿Está en la Sı́ 20 180 200
primera muestra? No 80 720 800
100 900 N̂ = 1000

1.3. Estimación con varias recapturas


Las hipótesis para la estimación por captura y recaptura con dos muestras,
son fuertes:

1. La población debe ser cerrada.

2. Las dos muestras aleatorias deben ser independientes.

Además, estas hipótesis no se pueden probar, ya que solo se observan tres


de las cuatro celdas de la tabla de contingencia; son necesarias las cuatro pa-
ra probar la independencia de las muestras. Es posible ajustar modelos más
complicados si se extraen K > 2 muestras aleatorias y en particular si se
hace uso de distintos tipos de marcas para los individuos capturados en las
diversas muestras.

Schnabel (1938) analizó la forma de estimar N al extraer K muestras y


determinó que la estimación de máxima verosimilitud de N es la solución de

6
N N
X (ni − ri ) Mi X
= ri ,
i=1
N − Mi i=1
donde:
ni es el tamaño de la muestra i.
ri es la cantidad de individuos recapturados en la muestra i.
Mi es el número de peces marcados al extraer la muestra i.
Si se usan marcas individuales, se puede analizar también aspecto de la
inmigración y emigración de la población y probar algunas de las hipótesis
de independencia.

Se utiliza el siguiente ejemplo para dar idea de lo que se trata hacer en


esta sección.
ejemplo 1.3.1 Domingo-Salvany et al (1995), usaron captura y recaptura
para estimar la frecuencia de adicción al opio en Barcelona, España. Uno de
sus conjuntos de datos consistı́a de tres muestras (K = 3) de 1989:
1. Adictos al opio de las salas de urgencia, lista E.
2. Personas que iniciaron tratamiento contra el opio en 1989, del sistema
de información sobre uso de drogas en Cataluña, lista T.
3. Muertos por sobredosis registradas en el forense en 1989, lista D.
Habı́a un total de 2864 personas distintas en las tres listas. Los integrantes
de las tres listas se compararon en los siguientes resultados:
¿Está en la lista D?
Sı́ No
¿Está en la lista T? ¿Está en la lista T?
Sı́ No Sı́ No
¿Está en Sı́ 6 27 314 1728
la lista E? No 8 69 712 ?

No es claro que estos datos cumplan las hipótesis para el método de cap-
tura y recaptura con dos muestras. Como hay más de dos muestras, podemos
evaluar las hipótesis de independencia mediante modelos Log-lineales; sin em-
bargo hay una hipótesis que nunca podremos probar: La celda faltante sigue
el mismo modelo que el resto de los datos.
Si se extraen tres muestras las cifras esperadas son:

7
¿Está en la muestra 3?
Sı́ No
¿Está en la muestra 2? ¿Está en la muestra 2?
Sı́ No Sı́ No
¿Está en la Sı́ m111 m121 m112 m122
muestra 1? No m211 m∗221 m∗212 m∗222

El modelo Log-lineal saturado para tres muestras es:

ln (mijk ) = µ + αi + βj + γk + (αβ)ij + (αγ)ik + (βγ)jk + (αβγ)ijk

Pero, no se puede ajustar este modelo, debido a que requiere ocho grados
de libertad y solo hay siete celdas. Aun ası́, se pueden ajustar los siguientes
modelos donde α se refiere a lista E (muestra 1), β se refiere a lista T (muestra
2) y γ se refiere a lista D (muestra 3).

1. Completa independencia:

ln (mijk ) = µ + αi + βj + γk

Este modelo implica que la presencia en cualquiera de la listas es in-


dependiente de la presencia en cualquiera de las otras listas. Siempre
debe adaptarse en la captura y recaptura con dos muestras.

2. Una lista es independiente de las otras dos:

ln (mijk ) = µ + αi + βj + γk + (αβ)ij

La presencia de la lista E (muestra 1) se relaciona con la probabilidad


de que alguien esté en la lista T (muestra 2), pero la presencia de la
lista D (muestra 3) es independiente de la presencia de las otras listas.
De este modelo hay tres versiones; las otras dos sustituyen (αγ)ik o
(βγ)jk en vez de (αβ)ij .

3. Dos muestras son independientes dada la tercera:

ln (mijk ) = µ + αi + βj + γk + (αβ)ij + (αγ)ik

Hay tres modelos de este tipo; los otros dos sustituyen (αβ)ij + (βγ)jk
o (αγ)ik + (βγ)jk en vez de (αβ)ij + (αγ)ik . La presencia de la lista de
muertos o de tratamientos son condicionalmente independientes dado

8
el estado de la lista E (muestra 1); una vez que sabemos que alguien
esta en la lista de la sala de urgencias, el hecho de saber si esta en
la lista de muertos no proporciona información adicional acerca de la
probabilidad de que esté en la lista de tratamiento.

4. Todas las interacciones son de dos sentidos:

ln (mijk ) = µ + αi + βj + γk + (αβ)ij + (αγ)ik + (βγ)jk

En este modelo siempre se ajustan perfectamente los datos: tiene la


misma cantidad de parámetros como celdas en la tabla de contingencia.

Los modelos que se ajustan a la independencia, se usan para estimar el


valor de la celda faltante, la cual puede verificarse mediante la prueba
de razón de verosimilitud de (Cormack 1992) para construir intervalos
de confianza para N , usando cualquiera de los modelos. Un intervalo
de confianza de 95 % para la celda faltante consta de aquellos valores
u para los que no se rechazarı́a una prueba de hipótesis de nivel 0.05
de H0 : m222 = u para el modelo Log-lineal adapto.
Sea G2 (u) (G2 es el estadı́stico de prueba de la razón de verosimilitud)
la estadı́stica de prueba de razón de verosimilitud (desviación) para la
tabla completa. con u sustituida en la celda omitida; sea t el total des
siete celdas observadas y sea û la estimación de la celda faltante usando
es modelo Log-lineal. Comark muestra que el conjunto:
     
2 2 u û
u : G (u) − G (û) + log − log < q1 (α)
t+u t + û

donde q1 (α) es el percentil de la distribución χ21 con área α en la cola


derecha; es un intervalo de confianza aproximado del 100(1 − α) % para
m222 .

Aun con todo lo mostrado hasta el momento, en ninguno de los modelos


se podrá demostrar la hipótesis de que la celda faltante siga el modelo, pero
al menos sera posible examinar las hipótesis de independencia por parejas
entre las muestras. Entonces, para la frecuencia de adicción al opio se ajus-
taron los modelos Log-lineales vistos a partir de los datos, usando la función
glim de S-PLUS y se obtuvieron los siguientes resultados:

9
grados de Intervalo de
Modelo G2 libertad (gl) p−valor m̂222 N̂ confianza al 95 %
1 Independencia 1.80 3 0.62 3,967 6,891 [6.322; 7.407]
2a E*T 1.09 2 0.58 4,639 7,499 [5, 992; 9, 706]
2b E*D 1.79 2 0.41 3,959 6,823 [6, 296; 7, 425]
2c T*D 1.21 2 0.55 3,929 6,793 [6, 283; 7, 373]
3a E*T,E*D 0.19 1 0.67 6,141 9,005 [5, 921; 16, 445]
3b E*T,T*D 0.92 1 0.34 4,416 7,280 [5, 687; 9, 812]
3c E*D,T*D 1.20 1 0.27 3,918 6,782 [6, 253; 7, 388]
4 E*T,E*D,T*D – 0 – 7,510 10,374 [4, 941; 25, 964]

En este caso G2 es la estadı́stica de prueba de razón de verosimilitud para ese


modelo. Se puede apreciar que el modelo de independencia es el que mejor se
ajusta a los datos. Las cifras esperadas por celda bajo el modelo 1: Completa
independencia, son: Estas cifras predichas

¿Está en la lista D?
Sı́ No
¿Está en la lista T? ¿Está en la lista T?
Sı́ No Sı́ No
¿Está en Sı́ 5.1 28.3 310.8 1730.7
la lista E? No 11.7 64.9 712.4 3966.7

por celda conducen a la estimación:

N̂ = 2864 + 3967 = 6831

Esto si se asume el modelo independencia. Análogamente se pueden calcular


los valores de N̂ para los otros modelos; estimando el valor de la celda faltante
a partir del modelo y sumando esa estimación al total conocido para las demás
celda, en este caso 2864.
Ahora, una aproximación a los resultados anteriores se puede apreciar
si se realiza la rutina con el procedimiento CATMOD en SAS para los datos
suministrados: la rutina es la siguiente:

data opium;
input er treat death count;
cards;
1 1 1 6
1 1 2 314
1 2 1 27

10
1 2 2 1728
2 1 1 8
2 1 2 712
2 2 1 69;
proc catmod data=opium;
weight count;
model er*treat*death = _response_ /ml pred=freq freq prob;
loglin er treat death;
run;
proc catmod data=opium;
weight count;
model er*treat*death = _response_ /ml pred=freq freq prob;
loglin er treat death er*treat;
run;
proc catmod data=opium;
weight count;
model er*treat*death = _response_ /ml pred=freq freq prob;
loglin er treat death er*treat er*death;
run;
proc catmod data=opium;
weight count;
model er*treat*death = _response_ /ml pred=freq freq prob;
loglin er treat death er*treat er*death treat*death;
run;

1.4. Muestro por cuadriculas (áreas)


Suele aplicarse a poblaciones estacionarias y ha recibido distintos nom-
bres (por áreas). La diferenciación de áreas en el plano y su identificación
en el terreno requieren a menudo operaciones topográficas engorrosas para el
observador y perturbadoras para los elementos observados. Para animales en
el aire o agua la situación se complica y se tendrı́a que sustituir el área por
volúmenes, y la localización resulta casi imposible. Se recomienda estudiar
la forma y tamaño de las áreas en relación con un aspecto espacial de diseño
de muestreo, es decir, considerando la localización fı́sica de las unidades.

La división por cuadricula suele ser conveniente por razones de eficiencia


(precisión o acuracidad/costo) se aconseja áreas hexagonales, aunque debe
tenerse en cuenta la facilidad de delimitación de las áreas y la rapidez de su
trazado.

11
Similar al muestreo por conglomerados o áreas, se prefieren muchas áreas
pequeñas a pocas áreas grandes, por efecto intracorrelación, o correlación po-
sitiva intraconglomerados, esto puede aumentar los costos y el error o sesgo
de contorno.

La selección de áreas puede hacerse con probabilidad constante, o propor-


cional al tamaño expresado por la extensión, o el número de individuos por
área. En algunos casos es necesario usar más de una selección, por lo tanto
el muestre multietápico es una opción (cuadricula-transectas)

1.5. Muestreo por fajas o bandas y lı́neas trans-


versales
En el caso más simple consiste de varias lı́neas paralelas que atraviesan el
ámbito que contiene la población, estas lı́neas transversales o fajas se trazan
previamente de manera que no se corten entre sı́, y se eligen al azar entre
un conjunto o sistema de lı́neas posibles, establecido de antemano. Se van
anotando los individuos o animales que se encuentren y los caracteres que
sean objeto de estudio, también se mide la distancia recorrida desde el ori-
gen hasta su encuentro, la distancia del ejemplar a la lı́nea, ası́ como también
ángulo de lı́nea con la visual del observador al individuo.

Figura 1.1: pendiente

4 : Sucesivas posiciones del observador.


• : Individuo observado.
w : Distancia perpendicular entre la lı́nea de transecta y el individuo observado.
d : Distancia entre el observador y el individuo observado.
θ : Ángulo de la lı́nea con la visual del observador al individuo.

Entonces, llamando

l : Largo de la transecta.
n : Número de animales observados.

Existen los siguientes criterios para la determinar la densidad de especies


utilizando lı́neas de transecta

12
n
1. D̂ = ; donde w̄ es el promedio de las distancias y 2w es el ancho
2lw̄
promedio de la faja.
n
2. D̂ = ¯; donde d¯ es el ancho promedio de la faja (método de King).
2ld
n
3. D̂ = ¯ ; donde α es el ángulo promedio y 2d¯sin α es el ancho
2ld sin α
promedio de la faja (método de Webbs).
En cualquiera de los casos, la abundancia (N) se estima como:

N̂ = AD̂
n
=A
2lw̄
X yi
= 2lw̄
i A

1
yi : Caracterı́stica de interés =
0
Este método es conocido como de Transecta de lı́neas y aquı́ se asume que
no todos los individuos serán vistos (observados) por el observador y que el
número de individuos vistos (u observados) se incrementará con la distancia
recorrida en la transecta. En esta técnica el observador debe recorrer la lı́nea
de transecta (l), contando los individuos (animales, arboles, etc) a ambos
lados de la lı́nea y registrando “sin error” di o wi cuando el individuo es
detectado.

Esta técnica de muestreo puede realizarse por tierra, mar o desde el aire.
Este tipo de muestreo por transectas de lı́nea exige ciertos criterios para
obtener estimaciones confiables de abundancia poblacional. Estos son:
1. Los individuos situados sobre la lı́nea nunca pueden dejar de ser vistos.
2. Los individuos no se mueven antes de ser detectados, las distancias son
medidas desde la ubicación inicial del individuo y no son contados más
de una vez.
3. Las distancias son medidas sin error.
4. La detección de un individuo es independiente de la detección de otro.
5. El comportamiento de respuesta de la población no cambia sustancial-
mente a lo largo de la transecta.

13
6. Los individuos son homogéneos respecto a su comportamiento de res-
puesta al observador, sin importar su sexo, edad, etc.

observación 1.5.1 Otro método de estimación de la densidad es el dado


por Haynes, el cual se realiza basado en un censo de puntos. Se asume en
este método que la probabilidad de ocurrencia depende de la distancia des-
de el observador y ası́ las observaciones son divididas en clases de distancias.

Aquı́, n = n1 +n2 +· · ·+nm , son los números de observaciones en distintas


clases de distancias.

ejemplo 1.5.1 d1 ≤ 25 m, d1 ≤ 26 − 50 m, etc. La densidad se estima por:


1
D̂ =  
n1 n2 nm
2L d1
+ d2
+ ··· + dm

observación 1.5.2 Cuando se toman varias transectas, entonces se tiene


L1 , L2 , . . . , Lk1 , largo de las n1 transectas seleccionadas. En este caso L =
Xk1
Li . (Suponga que se colocan las n1 transectas una después de la otra,
i=1
k1
X
entonces el largo total es L = Li y se sigue que w̄ y dˆ son las distancias
i=1
promedios de todos los wk y dk para las k1 lı́neas).

¿Cómo queda en este caso el estimador de Haynes?


1
Una propuesta puede ser D̂ = 
nd1 nd2
 donde ndk es
ndm
2L + d1 d2
+ ··· + dm
el número de individuos a la distancia dk

Para el caso que se tomen áreas de tipo circular de radio w, entonces


k1 πw2
la probabilidad del i-ésimo circulo es Pi = , ası́, la estimación de la
A
densidad es (por unidad de área medida)
n
D̂ =
k1 πw2
y la abundancia estimada es

14
N̂ = AD̂
nA
=
k1 πw2
k1 es el número de lı́neas o transectas

1.6. Transectas de ancho fijo


En este método, contrario al caso de transecta de lı́nea, el ancho (w) de la
transecta se fija antes del estudio. Se asume que todos los individuos dentro
de la faja son contados y que el largo de la transecta es conocido.

Para que este método sea válido en el caso de animales, se debe estar
seguro que se encontrará cada individuo dentro de la faja y que su presencia
a lo largo de la transecta no afectará la presencia o ausencia de otro individuo.

Figura 1.2: pendiente

La densidad de población por área muestreada es


n
D̂ = (1.3)
2Lw
con n el número de individuos o hallazgos.

El tamaño de la población (N ), puede ser estimado por

N̂ = AD̂
nA
=
2Lw
n
X yi
= (1.4)
p
i=1 i

1 Si es de la especie 2Lw
con yi = y pi = → Proporcional al ta-
0 Caso contrario A
maño.

15
Donde A es el área del ámbito. Nuevamente, cuando se toma o selecciona
Xn1
varias transectas de ancho fijo w, se toma L = Li (como si se colocara
i=1
una transecta detrás de la otra) con Li la longitud o largo de cada transecta
seleccionada.

Error estándar
Para transectas de ancho fijo
n nA
D̂ = y N̂ = (1.5)
2wL 2wL
Mientras que para el caso circular
n nA
D̂ = y N̂ = . (1.6)
k1 πw2 k1 πw2
Los errores de estimación dependen de las cantidades
v
n u k1  2
u k1 X
2 nk n
Se = t L − (1.7)
L L2 (k1 − 1) k=1 k Lk L

Para el caso de transecta de ancho fijo, donde nk es el número de indivi-


duos sobre la k-ésima área.

Mientras que para el caso circular


v
  u k1  2
n u 1 X n
Se =t nk − (1.8)
k1 k1 (k1 − 1) k=1 k1

Entonces los errores estándar para D̂ son

Se Ln

e.e(D̂) = (1.9)
2w
y
 
n
Se k1
e.e(D̂) = (1.10)
πw2
En cualquiera de los casos

e.e(N̂ ) = Ae.e(D̂)

16
Intervalos de confianza pueden ser obtenidos asumiendo una distribución
Log-normal para D̂, ası́ un I.C.(95 %) es
!

, D̂C (1.11)
C
donde
n  o
C = exp 1.96 × e.e loge D̂
y
s 
   2 
e.e loge D̂ = loge 1 + Cve(D̂)

con

e.e(D̂)
Cve(D̂) =

Cuando n es pequeño es mejor usar el percentil t(k1 −1, 1− α2 ) .
ejemplo 1.6.1 En un estudio para determinar la abundancia de una cierta
especie de pájaros (robin) se realizó un muestreo por transectas, donde se
seleccionaron o marcaron 19 transectas y se contaba el número de aves de la
especie dentro de 70 metros de la lı́nea (w = 70 m). Los datos obtenidos son
los siguientes:

lı́nea: 1 2 3 4 5 6 7 8 9 10
Li =Longitud (m): 208 401 401 299 350 401 393 405 385 204
Número de aves: 2 5 9 2 6 4 2 2 1 0

lı́nea: 11 12 13 14 15 16 17 18 19 Total
Li =Longitud (m): 39 47 204 271 236 189 177 200 20 4830
Número de aves: 0 0 2 3 3 0 4 2 0 47

Entonces,

19
X
L= Li
i=1
= 4830 m
= 4.83 km

17
w = 70 m = 0.070 km y n = 47. Ası́,

47
D̂ =
2(0.070)(4.83)
= 69.51

= 70 pajaros/km2

y
1.6887
e.e(D)
ˆ = = 12.02
2(0.070)

observación 1.6.1 i) De acuerdo a la forma o distribución de las unida-


des de observación, las transectas pueden varias en campo, por ejemplo

Figura 1.3: pendiente

ii) En otros casos es necesario subdividir el área de interés en sub-áreas,


siendo necesario usar una estrategia de muestreo estratificado

Figura 1.4: pendiente

1.7. Muestro por intercepto de lı́neas


La técnica de muestreo de intercepto de lı́neas es un método de muestro
donde los elementos de la población son seleccionados sin reemplazo bajo el
siguiente esquema

i) Cada elemento de la población se representa geométricamente por una


aguja única en un plano R2 .

ii) Aquellos elementos cuyas agujas interceptan la lı́nea elegida en R2 ,


serán incluidas en la muestra.

Esta definición incluye el muestreo de intercepto de lı́neas de población de


elementos circulares, conocido en la literatura de muestreo como interceptas
planas.

18
Esta técnica de muestreo ha sido empleada en muestreo forestales para
estimar la longitud total de hileras (arboles) en una región, también se ha
usado para evaluar el volumen, peso, numero de troncos en áreas de bosques.
Esta técnica también puede ser usada en problemas de vegetación asociando
objetos circulares tales como manchas o grupos de vegetación, a los que se
puede estimar cualquier caracterı́stica tales como su número, área total, bio-
masa, número de flores, frutos, insectos, etc.

Su fácil aplicación y su menor costo ha permitido su uso alternativo a


métodos de muestreo basados en cuadriculas (trazas, franjas, etc.), abriendo
perspectivas en estudios de ecologı́a.

En pesquerı́a (área acuı́cola) se ha usado para evaluar algas y el recurso


bentónico conocido como “loco”.

Esta técnica de muestreo pertenece a la familia de técnicas de muestreo


con probabilidad de selección proporcional al tamaño de los elementos se
constituyen la población muestreada.

Suponga que se tiene un área rectángula de dimensión w × L, la cual se


encuentra contenida dentro de una región de forma arbitraria y área A.

Al centro del rectángulo se corre una lı́nea L0 L00 de longitud L, paralela


a los lados de longitud Li en forma aleatoria sobre A, bajo los siguientes
supuestos.

i) Li ≤ w

ii) El centro M de la aguja esta siempre dentro de A

iii) Con respecto a la posición M , la aguja puede caer en cualquier dirección

iv) L es suficientemente largo respecto a Li para permitir intersecciones de


tipo S 0 entre L0 L00 y Li (Li << L)

Ahora, la probabilidad de que al lanzar la aguja aleatoriamente, el centro


M carga en el rectángulo wL es
wL
P1 i = (1.12)
A
Bajo la condición que M ⊂ wL, la probabilidad de la intersección es:

19
1
L
2 i
P2i = 1 1
w π
2 2
2Li
= (1.13)
πw
Entonces la probabilidad buscada es:

Pi = P (M ∈ wL)P (Intersección/wL)
= P1i P2i
wL 2Li
=
A πw
2Li L
= (1.14)

Asociando una aguja con un objeto circular en cuyo caso la probabilidad
de que la aguja insercepte la lı́nea central es donde di es el diametro del
circulo que corta L0 L00

wL
Pi 0 =
A
1
di
= 21
2
w
Ldi
= (1.15)
A

1.8. Estimadores de parámetros poblaciona-


les
Los parámetros de interés a estimar son:
1. Total para caracterı́stica y de los objetos por unidad de área
N
X yi
ya = (1.16)
i=1
A

2. Total de la caracterı́stica y de los objetos en el área Ai


N
X
y= yi (1.17)
i=1

20
3. Media de la caracterı́stica y por objeto
N
X yi
ȳU = (1.18)
i=1
N

Los objetos pueden corresponder a figuras circulares o no circulares.


Para este caso se usará el estimador de Horvitz-Thompsom para el total con
2Li L
πi =
πA
Entonces se tiene que: (para objetos no circulares)
n
πA X yi
t̂y = ŷ = (1.19)
2L i=1 Li

es un estimador insesgado de y = t̂y

Este estimador para objetos no circulares coinciden formalmente con el


π-estimador, la diferencia es que para el método de lı́neas de intersección el
tamaño n de la muestra no se fija a priori como en el t̂yπ , sino que el tamaño
de la muestra es la variable aleatoria definida como el número de agujas que
cortaron a la intercepta.

1.9. Variables cuantitativas


1.9.1. Muestreo de una lı́nea
Datos (objetos no circulares)

y1 , y2 , . . . , yi , . . . , yn
L1 , L2 , . . . , Li , . . . , Ln
Las observaciones yi y Li representan la caracterı́stica de interés y la lon-
gitud de la aguja en el i-ésimo objeto no circular interceptado por una lı́nea
aleatoriamente escogida en el área A.

21
θ θ̂ V (θ̂)

N n n  2
X yi π X yi  π 2 X y i
ya = ŷa = t̂ya = V (ŷa ) =
i=1
A 2l i=1 Li 2l i=1
Li

N n  n 
2 X 2
X πA X yi 2 πA yi
y = ty yi = Aya ŷ = t̂yπ = Aŷa = V (ŷ) = A V (ŷa )
i=1
2l i=1 Li 2l i=1
Li

N n n  2
X yi X yi X yi − ỹs
N A Li Li
X yi i=1 i=1 i=1
ȳU = = N
ȳˆU = ỹs = n V (ỹs ) = n  2
i=1
N A
X 1 X 1
i=1
Li i=1
Li

Para yi = 1 ∀i = 1, 2, . . . , N , entonces

N̂ = Aŷa
n
πA X 1
= (1.20)
2L i=1 Li

y la varianza sigue de la expresión definida para t̂yπ

Datos circulares

y1 , y2 , . . . , yi , . . . , yn
d1 , d2 , . . . , di , . . . , dn
donde las observaciones yi y di representa la caracterı́stica de interés y el
diámetro de i-ésimo objeto circular interceptado por una lı́nea aleatoriamen-
te escogida en el área A.

22
θ θ̂ V (θ̂)

N n n  2
X yi π X yi  π 2 X y i
ya = ŷa = t̂ya = V (ŷa ) =
i=1
A 2l i=1 Li 2l i=1
Li

N n  n 
2 X 2
X πA X yi 2 πA yi
y = ty yi = Aya ŷ = t̂yπ = Aŷa = V (ŷ) = A V (ŷa )
i=1
2l i=1 Li 2l i=1
Li

N n n  2
X yi X yi X yi − ỹs
N A Li Li
X yi i=1 i=1 i=1
ȳU = = N
ȳˆU = ỹs = n V (ỹs ) = n  2
i=1
N A
X 1 X 1
i=1
Li i=1
Li

Para estimar el total N de objetos circulares basta con hacer yi = 1


∀i = 1, 2, . . . , N

1.9.2. Muestreo replicado con k lı́neas


Datos:

y11 , y12 , . . . , y1i , . . . , y1n1


transecta 1
L11 , L12 , . . . , L1i , . . . , L1n1

y11 , y12 , . . . , y1i , . . . , y1n1


transecta 2
L21 , L22 , . . . , L2i , . . . , L2n1
..
.
y21 , y22 , . . . , y2i , . . . , y2n1
transecta j
Lj1 , Lj2 , . . . , Lji , . . . , Ljnj
..
.
yk1 , yk2 , . . . , yki , . . . , yknk
transecta k
Lk1 , Lk2 , . . . , Lki , . . . , Lknk

Si los objetos son circulares, simplemente se reemplazan las longitudes

23
Lji (individuo i para la j-ésima lı́nea) de las agujas por los diámetros dji de
los objetos.

θ θ̂ V (θ̂)

k k
X
Lj (yja − ŷa )2
X
Lj yaj k X nj
j=1 π X yij j=1
ya = k
ŷa = k
V (ŷa ) = k
X X j=1 i=1
Lij X
Lj 2 Lj (k − 1) Lj
j=1 j=1 j=1

k k
X
Lj (ŷ0ja − ŷa0 )2
X
Lj y0ja nj
k X
j=1 π X yij j=1
ya0 = k
ŷa = Pk V (ŷa0 ) = k
X j=1 Lj j=1 i=1
dij X
Lj (k − 1) Lj
j=1 j=1

Objetos no circulares Objetos circulares


nj nj
π X yij 1 X yij
ŷja = (j = 1, 2, · · · , k) ŷ0ja = (j = 1, 2, · · · , k)
2Lj j=1 Lij Lj j=1 dij

24

Potrebbero piacerti anche