Encuentra empalmes y ediciones en cualquier grabación de audio

Una herramienta gratuita en el navegador que busca puntos de empalme: lugares donde el audio ha sido cortado, unido o editado. Seis detectores forenses (flujo espectral, cambio de ruido de fondo, fase ENF, salto de tono, cambio de timbre y clics a nivel de muestra) votan sobre cada 50 ms de audio y muestran candidatos con marcas de tiempo precisas.

Cómo detectar empalmes

1

Sube tu archivo de audio o video (MP3, WAV, OGG, FLAC, M4A, AAC, MP4, WebM).

2

Espera a que terminen los seis detectores: normalmente entre 1 y 3 segundos para unos minutos de audio.

3

Lee el veredicto y la puntuación heurística; las grabaciones limpias se quedan en verde.

4

Inspecciona la línea de tiempo del espectrograma en busca de marcadores rojos; haz clic en cualquier marcador para escuchar el contexto de 1,5 segundos.

5

Abre "¿Por qué se ha marcado?" en cada tarjeta de empalme para ver qué detectores se activaron y por qué.

6

Exporta TXT o JSON si necesitas el informe para un flujo forense.

Encuentra cada corte y edición en cualquier grabación

✂️
Sube audio o video para empezar
MP3, WAV, OGG, FLAC, M4A, AAC, MP4, WebM
✂️
Detectando empalmes…
Puntuación heurística: 0% (heurística, no estadística)
¿Cómo funciona esto?

Ocho detectores independientes operan sobre una rejilla uniforme de 50 ms. Cada uno se normaliza frente a las propias estadísticas del archivo (μ + k·σ) y luego se combinan con pesos de fiabilidad en una puntuación fusionada. Los picos por encima del umbral se extraen como candidatos a empalme y se fusionan dentro de 250 ms.

fused = Σ wᵢ · σᵢ(signalᵢ), splice_candidate = local_max(fused) ≥ 0.55

  • Discontinuidad de flujo espectral — cambio fotograma a fotograma de la STFT
  • Punto de cambio del ruido de fondo — log-ratio del RMS en el percentil 10
  • Clic — pico de la segunda diferencia frente al RMS local
  • ENF (50 / 60 Hz) frecuencia + fase — detección en cuadratura más pico de FFT con interpolación parabólica; precisión sub-Hz
  • Tono (F0) — autocorrelación, log-ratio en fotogramas con voz
  • MFCC — 26 mel, distancia L2 con 13 coeficientes
  • Bicoherencia — biespectro normalizado, promediado sobre (f₁, f₂) ∈ [200 Hz, 2 kHz]
  • Proxy de RIR — relación de energía tardía (50–200 ms tras el inicio / pico) por ventana de 1 s

Cuando ENF o RIR no están presentes (grabaciones al aire libre, mezclas secas, tonos continuos), su peso se redistribuye proporcionalmente entre los detectores restantes para que la puntuación fusionada siga siendo comparable entre tipos de grabación.

Referencias: Grigoras (2007) criterio ENF; Duxbury et al. (2003) detección de inicios por flujo espectral; Davis y Mermelstein (1980) MFCC; Nikias y Petropulu (1993) espectros de orden superior.

Línea de tiempo del espectrograma · haz clic en cualquier parte para escuchar
0:00.000 / 0:00
Empalmes detectados 0
Mostrar solo:
🧪 Validación en el navegador

Sintetiza una batería de escenarios de prueba en tu navegador y ejecuta el detector sobre cada uno, para que puedas verificar tú mismo nuestras métricas publicadas. No se descargan archivos de prueba: todo se genera localmente con Web Audio.

Publicada