# Improper Handling of Unicode Encoding (CWE-176)

The product does not properly handle when an input contains Unicode encoding.

**Stack:** Python

- Prevalence: Media 3 lenguajes cubiertos
- Impact: Medio Se recomienda revisión
- Prevention: Documentada 3 ejemplos de corrección

**OWASP:** Injection (A03:2021-Injection) - #3

## Description

Unicode characters can have multiple encodings or representations. If an application does not properly handle Unicode, attackers may be able to bypass security filters or cause unexpected behavior using alternate encodings.

## Prevention

Estrategias de prevención para Improper Handling of Unicode basadas en 1 reglas de detección de Shoulder.

### Python

Normalize Unicode strings with NFKC before comparison or security-critical operations

## Warning Signs

- [MEDIUM] missing Unicode normalization leading to security bypasses

## Consequences

- Eludir mecanismo de protección
- Ejecutar código no autorizado

## Mitigations

- Normaliza la entrada Unicode a una forma canónica antes de procesarla
- Aplica las comprobaciones de seguridad después de la normalización Unicode
- Usa funciones de comparación que tengan en cuenta Unicode

## Detection

- Total rules: 3
- Languages: go, javascript, typescript, python

## Rules by Language

### Python (1 rules)

- **Unicode Normalization Issues** [MEDIUM]: Detects missing Unicode normalization leading to security bypasses.
  - Remediation: Normalize Unicode strings before comparison using unicodedata.normalize().

```python
import unicodedata

def normalize_username(username):
    return unicodedata.normalize('NFKC', username).lower()

if normalize_username(input_name) == normalize_username(stored_name):
    grant_access()
```

Learn more: https://shoulder.dev/learn/python/cwe-176/unicode-normalization