Детектор склеек аудио — поиск стыков и монтажа

Бесплатный браузерный инструмент, который ищет точки склейки — места, где аудио было разрезано, соединено или отредактировано. Шесть криминалистических детекторов (спектральный поток, шумовой фон, фаза ENF, скачок тона, смена тембра, отсчётные щелчки) голосуют за каждые 50 мс аудио и показывают кандидатов с миллисекундной точностью.

Как обнаружить склейки

1

Загрузите аудио- или видеофайл (MP3, WAV, OGG, FLAC, M4A, AAC, MP4, WebM).

2

Дождитесь завершения работы шести детекторов — обычно 1–3 секунды на несколько минут аудио.

3

Прочитайте вердикт и эвристическую оценку; чистые записи остаются зелёными.

4

Изучите красные маркеры на таймлайне; кликните по маркеру, чтобы прослушать 1,5 с контекста.

5

Раскройте «Почему помечено?» в карточке склейки — увидите, какие детекторы сработали и почему.

6

Экспортируйте TXT или JSON, если нужен отчёт для криминалистического workflow.

Найдите все стыки и редактирования в записи

✂️
Загрузите аудио или видео для анализа
MP3, WAV, OGG, FLAC, M4A, AAC, MP4, WebM
✂️
Ищу склейки…
Эвристическая оценка: 0% (эвристика, не статистика)
Как это работает?

Восемь независимых детекторов работают на равномерной сетке по 50 мс. Каждый нормирован относительно собственной статистики файла (μ + k·σ) и комбинируется со взвешенными коэффициентами в общий счёт. Пики выше порога извлекаются как кандидаты на склейку и объединяются в радиусе 250 мс.

fused = Σ wᵢ · σᵢ(сигналᵢ), кандидат_склейки = local_max(fused) ≥ 0,55

  • Спектральный поток — межкадровое изменение STFT
  • Точка разрыва шумового фона — лог-отношение 10-го перцентиля RMS
  • Щелчок — пик второй разности относительно локального RMS
  • ENF (50 / 60 Гц) частота + фаза — квадратурный детектор плюс пик FFT с параболической интерполяцией; точность ниже 1 Гц
  • Тон (F0) — автокорреляция, лог-отношение в озвученных кадрах
  • MFCC — 26 мел-полос, L2-расстояние по 13 коэффициентам
  • Бикогерентность — нормированный биспектр, усреднённый по (f₁, f₂) ∈ [200 Гц, 2 кГц]
  • Прокси RIR — отношение поздней энергии (50–200 мс после онсета к пику) на окне 1 с

Когда ENF или RIR отсутствуют (запись на улице, сухой микс, непрерывный тон) их вес перераспределяется пропорционально между остальными детекторами, чтобы сводный счёт оставался сопоставимым между разными типами записей.

Источники: Grigoras (2007) — ENF criterion; Duxbury et al. (2003) — onset detection; Davis & Mermelstein (1980) — MFCC; Nikias & Petropulu (1993) — higher-order spectra.

Таймлайн со спектрограммой · кликните, чтобы прослушать
0:00.000 / 0:00
Обнаруженные склейки 0
Показывать только:
🧪 Валидация в браузере

Синтезирует набор тестовых сценариев прямо на странице и прогоняет детектор на каждом — так вы можете самостоятельно проверить наши заявленные метрики. Сценарии (чистая речь, жёсткие разрезы, кроссфейды, разрывы ENF, скачки тона, смены помещения) генерируются на лету, скачивать тестовые файлы не нужно.

Опубликовано Обновлено Авторы: