Google неплохо помучил программку, примерно на 5000 часов видео, в котором промелькнули 110.000 тысяч фраз или 17.500 слов. Цель на самом деле ставилась благородная, а именно-научить компьютер понимать человеческий язык без звука. Нельзя сказать, что результаты DeepMind идеальны, но они весьма впечатляющи и уж точно превосходят человеческие. Заставляет задуматься вот какой факт: DeepMind успешно расшифровал всего 46.8%. И вроде бы даже меньше половины, но профессионал, прошедший обучение у того же признанного эксперта, который помогал натаскивать «машину», смог справиться только с 12.4%.
У эксперимента есть базис в виде софтины из Оксфордского университета под названием LipNet, которая отлично справляется со своей задачей чтения по губам, опознавая 90%. Однако проблема в том, что словарный запас у программы совсем небольшой, всего лишь 57 слов.