Клонирование голоса теперь и в России
Компания Screenlife вместе с разработчиком HR-сервиса займется развитием нейросети на основе искусственного интеллекта. Сеть сможет смоделировать и воспроизвести любые голоса на русском языке — от президента до звезд Голливуда
Компания Screenlife Technologies Тимура Бекмамбетова и разработчик HR-сервиса «Робот Вера» Stafory запустили проект Vera Voice, который позволяет синтезировать голос знаменитостей на русском языке.
Сеть обучается копировать звуки на примере оригинала. Презентационный ролик компании представили голосами Владимира Путина, журналистов Владимира Познера и Ксении Собчак. Запуск пилотного проекта запланирован на ноябрь.
Эксперты по кибербезопасности уже бьют тревогу. Deepfake-технологии, способные заменять голоса, лица и объекты на фотографиях, могут серьезно угрожать безопасности бизнеса и повлиять на мировые политические процессы. Впрочем, к этому мошенники придут не скоро — для ботов человеческая речь пока недоступна. Как их можно отличить, рассказывает основатель и директор по развитию «Промобот» Олег Кивокурцев.
Олег Кивокурцев основатель и директор по развитию «Промобот» «Условные риски есть в плане того, что чем точнее, тем проще спутать с реальным прототипом этого голоса, и эти риски действительно существуют. Но пока не существует абсолютно идеального, чистого синтеза речи. Это связано с определенными особенностями лингвистики, очень легко отличить как минимум по двум пунктам. Первый — чистота речи: когда говорит человек, у него есть вдохи в речи, определенные интонации, ускорение речи, замедление. Роботизированный синтез подобными особенностями не обладает. Второй — сама суть разговора, пока настоящего человека от чат-бота отличить тоже легко. Вред может быть принесен простым людям: например, позвонил якобы начальник или член семьи, что-то сказал. Поэтому близким следует внимательнее относиться: прежде чем какое-то действие совершать, позвонить и убедиться».
Клонирование голоса активно развивается во всем мире. Минувшим летом Facebook разработал синтезатор речи, который заговорил голосом Билла Гейтса, а голосовой помощник Alexa от Amazon начал разговаривать голосом актера Сэмуэля Л. Джексона. Есть две версии — с нецензурной лексикой и без. Но такие проекты вне конкуренции с настоящими актерами дубляжа, считает Владимир Антоник — официальный голос Сэмуэля Л. Джексона в России.
Владимир Антоник актер, режиссер дубляжа«Я думаю, что все-таки без человека будет сложно. Вряд ли какой-то голос может передать эмоцию, которая есть у нас. Механически, я понимаю, можно подделать голос и все остальное, но сердца-то не будет. Я думаю, что если какой-то текст не эмоциональный, а информативный — может быть. Если это какая-то игровая сцена — признание в любви, ненависть, просто сострадание — вряд ли у машины это получится. Это мое мнение».
По оценкам консалтинговой компании Markets & Markets, рынок клонирования голоса к 2023 году приблизится к 2 млрд долларов. При этом защитить себя от мошенников в недалеком будущем будет дорого. Эксперты посчитали, что услуги компаний по киберохране могут стоить от 50 тысяч долларов до «пары миллионов» в год.