# ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL I BIDIMENSIONAL
## 1. Introducció
L'**estadística descriptiva** s'ocupa de recollir, organitzar, resumir i presentar dades de manera que siguin fàcilment comprensibles. A diferència de l'estadística inferencial, no pretén generalitzar a una població més àmplia, sinó descriure les característiques de les dades observades. És la base fonamental per a qualsevol anàlisi estadístic posterior.
## 2. Conceptes Bàsics
### 2.1 Terminologia
- **Població:** Conjunt complet d'elements sobre els quals es vol estudiar una característica.
- **Mostra:** Subconjunt de la població seleccionat per a l'estudi.
- **Individu:** Cada element de la població o mostra.
- **Variable estadística:** Característica que es mesura o observa en cada individu.
- **Dada:** Valor concret que pren la variable en un individu.
**Variables qualitatives (categòriques):**
- **Nominals:** Categories sense ordre (color d'ulls, estat civil)
- **Ordinals:** Categories amb ordre (nivell d'estudis, satisfacció)
**Variables quantitatives (numèriques):**
- **Discretes:** Valors enters o comptables (nombre de fills)
- **Contínues:** Qualsevol valor en un interval (alçada, temperatura)
## 3. Organització de Dades
### 3.1 Taula de freqüències
Per a una variable amb valors $x_1, x_2, \ldots, x_k$:
**Per a variables qualitatives:**
- **Diagrama de barres:** Barres separades amb alçada proporcional a la freqüència
- **Diagrama de sectors:** Angles proporcionals ($\theta_i = 360° \cdot f_i$)
**Per a variables quantitatives discretes:**
- **Diagrama de barres**
- **Polígon de freqüències**
**Per a variables quantitatives contínues:**
- **Histograma:** Barres adjacents, àrea proporcional a la freqüència
- **Polígon de freqüències:** Unió de marques de classe
- **Ogiva:** Polígon de freqüències acumulades
## 4. Mesures de Posició Central
### 4.1 Mitjana aritmètica
Per a dades individuals $x_1, x_2, \ldots, x_n$:
$$\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i$$
Per a dades agrupades amb freqüències:
$$\bar{x} = \frac{1}{n} \sum_{i=1}^{k} n_i \cdot x_i = \sum_{i=1}^{k} f_i \cdot x_i$$
**Propietats:**
- $\sum_{i=1}^{n} (x_i - \bar{x}) = 0$ (suma de desviacions és zero)
- $\bar{x}(ax + b) = a\bar{x} + b$ (linealitat)
- Sensible a valors extrems (outliers)
### 4.2 Mediana
El valor que deixa el 50% de les dades per sota i el 50% per sobre.
**Càlcul per a dades ordenades:**
$$Me = \begin{cases} x_{(n+1)/2} & \text{si } n \text{ senar} \\ \frac{x_{n/2} + x_{n/2+1}}{2} & \text{si } n \text{ parell} \end{cases}$$
**Per a dades agrupades en intervals:**
$$Me = L_i + \frac{n/2 - N_{i-1}}{n_i} \cdot a_i$$
on $L_i$ és el límit inferior de l'interval medià (el primer amb $N_i \geq n/2$).
**Propietats:**
- Robusta davant de valors extrems
- Adequada per a distribucions asimètriques
### 4.3 Moda
El valor amb major freqüència. Pot no ser única (distribució bimodal, multimodal) o no existir.
- $g_2 > 0$: Leptocúrtica (més apuntada que la normal)
- $g_2 < 0$: Platicúrtica (més aplanada que la normal)
- $g_2 = 0$: Mesocúrtica (com la normal)
## 8. Diagrama de Caixa (Box Plot)
Representació gràfica basada en els quartils:
- La caixa va de $Q_1$ a $Q_3$ (conté el 50% central)
- Línia interior marca la mediana
- Bigotis s'estenen fins a $Q_1 - 1.5 \cdot RIQ$ i $Q_3 + 1.5 \cdot RIQ$
- Valors fora dels bigotis són **outliers** (atípics)
## 9. Estadística Bidimensional
### 9.1 Distribucions conjuntes
Per a dues variables $(X, Y)$ observades conjuntament, es construeix una taula de doble entrada amb freqüències conjuntes $n_{ij}$.
### 9.2 Distribucions marginals i condicionades
- **Marginal de X:** $n_{i\cdot} = \sum_j n_{ij}$
- **Condicionada de X donat Y=yⱼ:** $n_{i|j} = n_{ij}$ amb freqüències relatives $f_{i|j} = n_{ij}/n_{\cdot j}$
### 9.3 Independència estadística
Dues variables són independents si:
$$f_{ij} = f_{i\cdot} \cdot f_{\cdot j} \quad \forall i, j$$
Equivalentment, les distribucions condicionades són iguals a la marginal.
## 10. Tipificació
### 10.1 Variable tipificada
La transformació:
$$z_i = \frac{x_i - \bar{x}}{\sigma}$$
produeix una variable amb $\bar{z} = 0$ i $\sigma_z = 1$.
### 10.2 Aplicació
- Comparar valors de distribucions diferents
- Detectar valors atípics ($|z| > 2$ o $|z| > 3$)
- Base per a la distribució normal estàndard
## 11. Aplicacions Didàctiques
### 11.1 A l'ESO
- Enquestes a classe: recollida i organització de dades reals
- Gràfics amb paper i programari (Excel, GeoGebra)
- Càlcul de mitjana, mediana, moda amb calculadora
### 11.2 Al Batxillerat
- Anàlisi complet: dispersió, asimetria, curtosi
- Comparació de distribucions amb tipificació
- Projectes d'investigació estadística amb dades reals
- Programació de funcions estadístiques
## 12. Conclusions
L'estadística descriptiva proporciona les eines bàsiques per resumir i comunicar informació continguda en conjunts de dades. Les mesures de centralització, dispersió i forma ofereixen una caracterització completa d'una distribució. La representació gràfica adequada és essencial per a la comprensió i comunicació dels resultats.
Estudia este tema con OPOSGRATIS
Has leído el desarrollo del tema. Para consolidar tu aprendizaje, estudia las flashcards asociadas con repetición espaciada (algoritmo SM-2), realiza simulacros de examen, y practica el supuesto práctico. Todo gratis y sin registro previo.