NoFake

Голос как улика: как судебные эксперты ищут следы ИИ в аудиозаписях

Фото: magnific.com

Признаки дипфейка в аудиозаписях эксперты выявляют с помощью комплекса «ИКАР Лаб-3». Система анализирует голос, речь и технические параметры записи.

В Казахстане внедрена новая методика судебно-фонографической экспертизы для выявления признаков использования искусственного интеллекта при создании дипфейк-аудиозаписей. Благодаря этому эксперты получили дополнительные возможности для проверки подлинности аудиоматериалов, которые могут использоваться в качестве доказательств по уголовным делам.

О том, как специалисты выявляют признаки дипфейка в аудиозаписях и какие технологии помогают им в этой работе, корреспонденту NoFake.kz рассказали в столичном Институте судебных экспертиз.

Судебно-фонографическая экспертиза проводится двумя специалистами: один отвечает за спектральный анализ звука, второй — за лингвистическое исследование.

Специалист по спектральному анализу проверяет аудиозапись на наличие монтажа и других изменений. Лингвист исследует её целостность и последовательность, анализирует тембр голоса, ритм речи и эмоциональную окраску высказывания.

В работе астанинские эксперты используют программно-аппаратный комплекс «ИКАР Лаб-3». Он формирует выводы в процентах или в виде коэффициента вероятности и помогает установить, принадлежат ли записи голоса одному человеку. Система сохраняет эффективность даже в тех случаях, когда человек пытается намеренно изменить голос: например, говорит шёпотом, зажимает нос или искусственно делает его более низким или высоким.

Программа анализирует не только особенности речи человека, но и биологические характеристики его голосового аппарата. Она изучает частоту и вибрацию голоса, отображает эти данные на 3D-графике и с математической точностью рассчитывает степень совпадения двух голосов.

В целом комплекс содержит базу из 126 признаков, по которым эксперты оценивают особенности речи человека. Среди них — манера речи, постановка ударений, дикция, диалект, заикание и особенности произношения отдельных звуков. В обновлённой версии «ИКАР Лаб-3» к этим возможностям добавился анализ аудиозаписей на наличие признаков использования искусственного интеллекта. В институте подчеркнули, что вывод о наличии таких признаков делается только после комплексного анализа записи.

«Мы не можем говорить о вероятности использования искусственного интеллекта в процентах. Перед нами стоит конкретная задача — определить, есть ли в записи признаки его применения или нет. Изучив все материалы в комплексе, мы приходим к одному выводу, который затем указываем в экспертном заключении. Например, пишем, что в этой фонограмме выявлены признаки применения ИИ», — говорит главный эксперт отдела видеофонографических экспертиз Айнагуль Бекмагамбетова.

По её словам, эксперты работают с целым рядом показателей, для которых существуют свои нормативные значения. Если отдельные параметры заметно выходят за эти рамки, это может указывать на использование технологий искусственного интеллекта. Однако одних технических данных недостаточно: нередко ИИ «выдают» особенности самой речи, поэтому специалисты внимательно анализируют не только голос, но и то, как именно говорит человек.

«Мы анализируем речевые привычки человека: использует ли он диалекты, слова-паразиты, насколько естественно строит речь. Также обращаем внимание на отдельные фрагменты записи, где речь может отличаться. Голос живого человека меняется под влиянием эмоций, поэтому речь может быть сбивчивой. У ИИ таких особенностей нет — это поток речи без запятых и пауз. Всё-таки это робот», — отметила Айнагуль Бекмагамбетова.

Отметим, что сегодня судебные эксперты уже работают над тем, чтобы научиться не только выявлять признаки искусственного интеллекта в записях, но и точнее устанавливать случаи подмены голоса конкретного человека.

Читайте также