Variáveis Aleatórias

Damos o nome de variável aleatória (VA) a qualquer função X:ΩRnX: \Omega \to \R^n que verifique uma condição de mensurabilidade.
Uma VA diz-se unidimensional se n=1n = 1, bidimensional se n=2n=2 e multidimensional se n>2n>2.
O conjunto X(Ω)RnX(\Omega) \subset \R^n é normalmente representado por RX\R_X.
Dizemos que uma VA é:

  • discreta se RX\R_X for contável;
  • contínua se RX\R_X não for contável;

Essencialmente, uma VA deve ser entendida como uma função que, para uma EA, traduz os resultados dessa EA. Vamos ver alguns exemplos:

Exemplo 1

Considere-se a experiência aleatória correspondente a lançar um dado ao ar. O espaço de resultados desta EA é o seguinte:

Ω={Saiu 1,Saiu 2,Saiu 3,Saiu 4,Saiu 5,Saiu 6}\Omega = \{ \text{Saiu 1}, \text{Saiu 2}, \text{Saiu 3}, \text{Saiu 4}, \text{Saiu 5}, \text{Saiu 6} \}

Uma variável aleatória que fará sentido é a função X:ΩRX: \Omega \to \R tal que:

X(Saiu 1)=1X(Saiu 2)=2X(Saiu 6)=6X(\text{Saiu 1}) = 1 \\ X(\text{Saiu 2}) = 2 \\ \cdots \\ X(\text{Saiu 6}) = 6

Agora já temos uma tradução da nossa experiência em números, pelo que podemos fazer continhas!!!

Exemplo 2

Considere-se a experiência aleatória que consiste em lançar um objeto ao ar e medir quantos tempo ele demora a cair no chão. O espaço de resultados desta EA é

Ω={O objeto demorou x a cair:xR+}\Omega = \{ \text{O objeto demorou } x \text{ a cair}: x \in \R^+ \}

Uma variável aleatória que fará sentido definir é a função X:ΩRX: \Omega \to \R tal que:

X(O objeto demorou x a cair)=xX(\text{O objeto demorou } x \text{ a cair}) = x

Note-se que tanto neste exemplo como no anterior podiamos ter definido qualquer outra VA que nos apetecesse. No entanto estas são as que nos farão mais sentido para trabalhar com elas.

Wait... O que raio é uma condição de mensurabilidade???

Mais uma vez, perceber o que é uma condição de mensurabilidade não é necessário para trabalhos/exame/projeto. É um conceito abstrato e difícil de interiorizar, pelo que quem tiver dificuldades com ele está melhor a saltar à frente.
De qualquer forma, para quem tiver interesse, fica a definição - note-se que este conceito pode ser relevante em oral!

Condição de mensurabilidade

Dizemos que uma VA XX unidimensional tem uma condição de mensurabilidade se qualquer conjunto da forma ],x]]-\infty, x] (xRx \in \R) tiver imagem inversa segundo XX. Isto é, para qualquer conjunto xRx \in \R, existe um evento AΣA \in \Sigma tal que X(A)=],x]X(A) = ]-\infty, x].

Para analisar probabilidades, atribuimos a VA's XX uma função de probabilidade P:Ω[0,1]P: \Omega \to [0,1] definida por

P(X=x)=P({ωΩ:X(ω)=x})P(X = x) = P( \{ \omega \in \Omega : X(\omega) = x \} )

Em relação a VA's, é também comum definir a função de distribuição (fd) como a função FX(x):R[0,1]F_X(x): \R \to [0,1] tal que

FX(x)=P(Xx)F_X(x) = P(X \leq x)

Dependendo se a VA é discreta ou contínua, esta função tem restrições e propriedades diferentes (apesar de análogas). Nomeadamente, para VA's discretas é possível usar somatórios, já que Ω\Omega é contável. Para VA's contínuas, por contraste, teremos de trabalhar com integrais.
Está então na altura de analisar cada caso em separado.

Variáveis Aleatórias Discretas

A funçao de probabilidade de uma VA discreta deve ser tal que:

  • P(X=x)>0,xRXP(X = x) > 0, \forall_{x \in \R_X}
  • xRXP(X=x)=1\sum_{x \in \R_X} P(X = x) = 1

Para VA's contínuas é evidente que a função de distribuição pode ser dada por

FX(x)=P(Xx)=yRX,yxP(X=y)F_X(x) = P(X \leq x) = \sum_{y \in \R_X, y \leq x} P(X = y)

As VA's discretas satisfazem as seguintes propriedades:

  • FXF_X é monótona crescente, contínua à direita e tem #RX\#\R_X pontos de descontínuidade. Consequentemente, o gráfica da fd de uma VA discreta é algo parecido a:

Gráfico da fd de um VA dicsreta

  • FX()=limxFX(x)=0F_X(-\infty) = \lim_{x \to -\infty} F_X(x) = 0;
  • FX(+)=limx+FX(x)=1F_X(+\infty) = \lim_{x \to +\infty} F_X(x) = 1;
  • P(X<x)=P(Xx)P(X=x)=FX(x)P(X=x)P(X < x) = P(X \leq x) - P(X = x) = F_X(x) - P(X = x);
  • P(X>x)=1P(Xx)=1FX(x)P(X > x) = 1 - P(X \leq x) = 1 - F_X(x);
  • P(a<Xb)=FX(b)FX(a)P(a < X \leq b) = F_X(b) - F_X(a);
  • P(a<X<b)=FX(b)FX(a)P(X=b)P(a < X < b) = F_X(b) - F_X(a) - P(X = b);
  • P(aXb)=FX(b)FX(a)+P(X=a)P(a \leq X \leq b) = F_X(b) - F_X(a) + P(X = a);
  • P(aX<b)=FX(b)FX(a)+P(X=a)P(X=b)P(a \leq X < b) = F_X(b) - F_X(a) + P(X = a) - P(X = b);

Variáveis Aleatórias Contínuas

Para VA's contínuas temos que qualquer evento elementar é impossível. Isto é:

P(X=x)=0,xRP(X = x) = 0, \forall_{x \in \R}

Então, a melhor forma de caracterizar VA's contínuas é através da sua função de distribuição.
Dizemos entao que uma VA XX é contínua se e só se:

  • Possuir uma função distribuição FX(x)F_X(x) contínua e crescente (em sentido lato) em R\R;
  • Existir uma função fX(x):RR0+f_X(x): \R \to \R_0^+ tal que
    FX(x)=xfX(t)dtF_X(x) = \int_{-\infty}^x f_X(t) \, dt
    A esta função dá-se o nome de função de densidade de probabilidade (fdp).

As VA's contínuas têm as seguintes propriedades:

  • Um gráfico vagamente semelhante ao representado abaixo, devido à continuidade e monotonicidade lata:

Gráfico da fd de um VA contínua

  • fX(x)=δFX(x)δxf_X(x) = \frac{\delta F_X(x)}{\delta x}
  • FX()=0F_X(-\infty) = 0, FX(+)=1F_X(+\infty) = 1 e, consequentemente, 0FX(x)10 \leq F_X(x) \leq 1 para qualquer xRx \in \R;
  • Para qualquer a,bRa,b \in \R:
    P(a<X<b)=P(aX<b)=P(a<Xb)=P(aXb)=FX(b)FX(a)=abfX(x)dxP(a < X < b) = P(a \leq X < b) = P(a < X \leq b) = P(a \leq X \leq b) = \\ F_X(b) - F_X(a) = \int_a^b f_X(x) \, dx

Valor Esperado e Variância

Por vezes é relevante condensar informação sobre uma VA num só número. As funções mais que relevantes que nos dão informação sobre VA's são:

  • Valor Esperado: E(X)E(X), μ\mu ou μx\mu_x
    É dado por:

    Para VA’s discretasPara VA’s contıˊnuasE(X)=xRXxP(X=x)E(X)=xfX(x)dxse esta seˊrie convergirse este integral convergir\begin{matrix} \text{Para VA's discretas} & & \text{Para VA's contínuas} \\ E(X) = \sum_{x \in \R_X} x P(X = x) & & E(X) = \int_{-\infty}^{\infty} x f_X(x) \, dx \\ \text{se esta série convergir} & & \text{se este integral convergir} \end{matrix}

    Definimos ainda o valor esperado de uma função hh sobre XX como:

    E(h(X))=xRXh(x)P(X=x)E(h(X))=h(x)P(X=x)para X discretaPara X contıˊnua\begin{matrix} E(h(X)) = \sum_{x \in \R_X} h(x) P(X = x) & & E(h(X)) = \int_{-\infty}^\infty h(x) P(X = x) \\ \text{para } X \text{ discreta} & & \text{Para } X \text{ contínua} \end{matrix}

    Nomeadamente, se h(x)=ax+bh(x) = ax + b, para a,bRa, b \in \R, verificamos que

    E(aX+b)=aE(X)+bE(aX+b) = aE(X) + b

    Esta funçao é a medida de centralidade principal de uma VA.

  • Variância: Var(X)Var(X), V(X)V(X), σ2\sigma^2 ou σx2\sigma^2_x
    É definido como

    V(X)=E((XE(X))2)=E(X2)E(X)2V(X) = E\left( (X - E(X))^2 \right) = E(X^2) - E(X)^2

    A variância tem as seguintes propriedades:

    • V(X)0V(X) \geq 0;
    • V(X)=0XV(X) = 0 \Leftrightarrow X constante;
    • V(aX+b)=a2V(x)V(aX+b) = a^2V(x), para a,bRa,b \in \R.

    Esta função dá-nos uma medida de divergência em relação ao valor esperado (ao centro).

  • Desvio Padrão: DP(X)DP(X), σ\sigma ou σX\sigma_X
    É definido por

    DP(X)=V(X)DP(X) = \sqrt{V(X)}

    Esta função tem a propriedade DP(aX+b)=aDP(X)DP(aX+b) = aDP(X).

    Esta função é usada principalmente quando se quer uma medida de desvio que funcione bem com multiplicações por escalares em XX.