8 ESTIMACAO POR REGIOES

Definição

Dado um experimento \((\theta, X, \mathcal{F})\) e uma observação \(x\), realizar uma estimação por regiões significa obter uma região \(R \subseteq \Theta\) tal que \(\mathbb{P}(\theta \in R \ | \ x) = \gamma\) para algum nível de confiança \(\gamma\) definido previamente.

Em geral, o tipo de estimação por regiões usado na inferência bayesiana é a chamada região HPD (High Posterior Density). Dizemos que uma região \(R \subseteq \Theta\) é uma HPD de probabilidade \(\gamma\) se: 1. \(\mathbb{P}(\theta \in R \ | \ x) = \gamma\) 2. \(\forall\ \theta \in R, \theta' \not\in R, f(\theta \ | \ x) \geq f(\theta' \ | \ x)\) Isso implica que a região HPD é a menor região1 de \(\Theta\) com probabilidade \(\gamma\). Em outras palavras, é a região modal de probabilidade \(\gamma\).

Formulação com teoria da decisão

O problema da estimação por regiões pode ser formulado através de um problema de decisão. No caso, teremos o espaço de decisões \(\mathcal{D} =\) \(B(\mathbb{R})\) e então definimos uma função de perda que leva em conta tanto se \(\theta\) está em \(R\), quanto o comprimento de \(R\): \[ L(R, \theta) = \lambda(R) - k \cdot \mathbb{I}(\theta \in R) \] onde \(k>0\) é uma constante que define o quão “estrita” é nossa região (e será totalmente responsável pela quantidade \(\gamma\)) e \(\lambda\) é uma medida de Lebesgue em \(\Theta\).

Neste caso, o risco a posteriori de \(R\) é \[ \begin{gather} r_x(R) = E [L(R, \theta \ | \ x)] = \int_\Theta [\lambda(R) - k \cdot \mathbb{I}(\theta \in R)]\ \text{d}\mathbb{P}(\theta \ | \ x) \\ =\underbrace{ \int_\Theta \lambda(R) \ \text{d}\mathbb{P}(\theta \ | \ x) }_{ = \lambda(R) = \int_R d\theta } - \underbrace{ \int_\Theta \mathbb{I}(\theta \in R)] \cdot k \cdot f(\theta \ | \ x)\ \text{d}\theta }_{ = \int_R kf(\theta \ | \ x)\ \text{d}\theta }\\ = \int_R 1 - k f(\theta \ | \ x)\ \text{d}\theta \end{gather} \] Queremos minimizar esta quantidade, então tomaremos \(R^*\) toda a região que torna o integrando negativo: \[ R^* = \{ \theta \in \Theta : 1- kf(\theta \ | \ x) \leq 0 \} = \left\{ \theta \in \Theta : f(\theta \ | \ x) \geq \frac{1}{k} \right\} \] Essa é nossa estimativa. Comparando com a definição de região HPD, fica claro que \(\gamma = \int_{R^*} f(\theta \ | \ x)\ d\theta\), que depende apenas de \(k\), como esperado.

Relacionados


  1. Menor no sentido de menor medida de Lebesgue↩︎

© 2025 Luã Jaz. Todos os direitos reservados.