Когда вы находитесь в темном кинотеатре, то ваши реакции на происходящее на экране чаще всего остаются незамеченными другими. Вот вы широко открываете глаза при неожиданном повороте сюжета, буквально подпрыгиваете в кресле от страшной сцены или пускаете слезу под мелодраматичную музыку – все эти эмоции, вероятнее всего, будут направлены не более чем в пластиковую спинку впереди стоящего кресла.
Но только лишь в том случае, если этот кинотеатр не оснащен «компьютерным зрением». Если вам когда-нибудь выдастся шанс побывать в одном из таких, то будьте уверены, пока вы будете смотреть фильм, фильм будет смотреть за вами.
Компьютерную программу, основная задача которой заключается именно в том, о чем написано выше, разработала компания Silver Logic Labs. Ее генеральный директор Джеримая Хамон – эксперт в области прикладной математики, специализирующийся на теории чисел. Он много лет проработал в стенах таких гигантов, как Amazon, Microsoft, а также в Гарвардской медицинской школе, занимаясь различными вопросами, связанными с человеческой потребительской природой. Однако его основным интересом всегда было понять, как искусственный интеллект (ИИ) сможет помочь лучше предугадывать одну из самых сложных наших особенностей – человеческое поведение.
Исследуя алгоритмы ИИ для анализа человеческих реакций на восприятие различных видов медиа, Хамон понял, что это может принести пользу не только в научном плане, но и коммерческом. Его система работает следующим образом: ИИ-алгоритм следит за аудиторией, которая смотрит фильм, отмечая эмоции на лицах людей, проявляющиеся даже через самые едва заметные изменения (так называемые микровыражения), а затем генерирует на основе этой информации нужные данные для последующего анализа.
Хамон серьезно углубился в подобные исследования около трех лет назад и, хотя результаты его работы для медиаиндустрии выглядят пока очень сыро, большой интерес к данной теме они, безусловно, привлекли. В значительной степени потому, что обещают надежные результаты, так как поведение людей может быть таким же предсказуемым, как и работа программного обеспечения, по крайней мере в видении самого Хамона. ИИ, в свою очередь, а также используемые им технологии компьютерного зрения помогут производить сбор информации о том, как люди реагируют на те или иные фильмы и телевизионные передачи, гораздо эффективнее любой фукус-группы. Как только ИИ обучат сбору нужного набора данных, он сможет обеспечивать быстрый, последовательный и детальный анализ этой информации. Для тех сфер индустрии, которым приходится работать с этими данными – новость просто замечательная. Ведь благодаря более грамотному и эффективному анализу человеческих желаний и предпочтений они смогут улучшать свои продукты и сервисы, приносящие деньги.
Рейтинги – один из важнейших и показательных аспектов, обеспечивающих успех той или иной телевизионной программе или фильму. К удивлению тех, кто следил за процессом, текущая версия программного обеспечения Хамона смогла предсказать рейтинги Nielsen, Rotten Tomatoes и IMDB с точностью от 84 до 99 процентов. Разность в показателях связана с тем, что некоторые объекты рейтинга являются «мультимодальными», то есть рассчитаны на более широкую аудиторию, поэтому их, как правило, бывает сложнее предсказать. Вообще, когда речь идет о ТВ, то уже сама по себе попытка предсказать популярность той или иной передачи не может не впечатлять.
«Когда я только начинал, все говорили мне, что я никогда не смогу предсказывать подобное, потому что никто не может», — поделился Хамон в разговоре с порталом Futurism.
Но при наличии математики нет ничего невозможного. Ведь, по мнению Хамона, с помощью математических методов можно отмечать многие нюансы, которые отметить без их использования просто невозможно.
«Мы взяли эмоциональные реакции на визуальную и звуковую стимуляцию аудитории и конвертировали их в цифровые значения. А когда что-то приобретает форму цифрового значения, то это рано или поздно приобретает форму нужного уравнения, задача которого в нашем случае сводится к тому, чтобы узнать, насколько действительно вам понравилось (или понравится) то или иное шоу», — говорит Хамон.
Исследователь сообщает, что здесь проводится широкий статистический анализ, но при этом отказывается сообщать какие-либо детали о том, какое же уравнение он использует для расчета, указывая на то, что таким образом он пытается защитить «секретный ингредиент» своей программы.
За пределами индустрии развлечений
Высокая эффективность ИИ в предугадывании человеческих предпочтений побудила Хамона исследовать и другие сферы, в которых его программа могла бы быть эффективной. Например, в определении того, говорит ли человек правду или нет. Как и полиграф, ИИ мог бы сопоставлять данные, указывающие на стрессовые состояния, с эталонным набором значений и на основе этого определять, врет ли человек или нет. Для проверки этой идеи Хамон использовал ИИ-алгоритм для выполнения задачи по определению эмоций у людей на основе видео относительно низкого качества. Для исследования он использовал ролики информационного агентства CSPAN, а также кадры съемок с пресс-конференций президента Дональда Трампа.
В момент, когда истина может подвергаться сомнению, отделение правды от лжи может носить критический характер. Однако система также может использоваться и в ситуациях, когда речь в буквальном смысле идет не на жизнь, а на смерть. Например, в медицине, где может потребоваться точно определить уровень боли, испытываемой человеком, чтобы врачи могли подобрать более эффективные средства лечения.
Хамон отмечает, что система может оказаться полезной, например, в ситуациях, когда необходимо определить инсульт. Несмотря на то, что медицинские сотрудники обычно проходят необходимую подготовку, позволяющую им определять признаки инсульта, нередко бывают моменты, когда упускаются так называемые микроинсульты (или транзиторные ишемические атаки, если по-научному), за которыми очень часто следуют масштабные инсульты, поражающие большую площадь мозга. Компьютерное зрение ИИ могло бы определять эти микропризнаки инсульта или даже симптомы или намеки приближающегося заболевания еще до того, как они фактически проявятся у пациента. В таком случае медицинский персонал смог бы своевременно реагировать на ситуацию, и, возможно, даже предпринять шаги, позволяющие избежать дальнейшего развития более серьезного инсульта.
Но будет ли это на самом деле работать? Хамон считает, что это возможно. Исследователь уверен, что ИИ способны стать настолько чувствительными, что будут в состоянии определять такие едва заметные и скоротечные изменения в работе организма. Когда систему проверяли на разных аудиториях, исследователям пришлось принять во внимание факт приема некоторыми людьми предписанных лекарственных средств, некоторые из которых, например, имеют побочные эффекты в виде повышенного давления или едва заметных мышечных судорог. Возможно, человек и не сможет заметить данные изменения у другого человека, однако ИИ без труда их выявит, но в то же время может ошибочно принять эффекты от принятия препарата за проявление стрессовых признаков. Это тоже нужно учитывать.
Мощный инструмент
Многие считают, что разумные машины будут лишены предвзятости, однако не следует забывать: эти машины будут создавать люди, и эти люди, разрабатывающие и взаимодействующие с ИИ, могут неосознанно наделить их своими же предубеждениями. С развитием ИИ последствия от накопления этих предубеждений будут становиться все более выраженными и в конечном итоге могут повлиять на различные процессы информационной обработки, например, при опознании той или иной личности или при сборе социальных данных человека, содержащихся в сетях государственных служб.
Так как технологии лицевого распознавания уже начинают проникать в нашу личную жизнь, многие начинают задумываться и уделять больше внимания вопросам этического характера, выражая озабоченность по поводу вероятной предвзятой работы подобных алгоритмов. Та же идея о том, что технологии могут существовать без какой-либо степени вложенных в них предвзятостей, очень спорна. Под серьезное сомнение ее ставит всего лишь один-единственный аргумент: эффективность работы ИИ будет зависит от тех данных, что были в него вложены, и среди этих данных может содержаться информация, которая была изначально окрашена предвзятым отношением человека, который создавал эту систему. С прогрессом разработок ИИ, с созданием машин, которые на самом деле способны обучаться, мы должны разработать ограничительные меры, способные защитить нас от ситуаций, когда эти машины смогут научиться у нас гораздо большему, чем мы намеревались их обучить.
Тем не менее тот же Хамон уверен, что его алгоритм полностью беспристрастен, по крайней мере настолько, насколько это вообще возможно. Его компьютерная система лишь интерпретирует признаки человеческого поведения, независимо от того, какой тип лица или тела находится в его поле зрения.
«Я коренной американец, и следует признать, что здесь иногда происходят вещи, способные накалять окружающую обстановку. Например, вы можете начать нервничать, когда за вашей спиной возникают полицейские. Однако я считаю, что подобные технологии в будущем смогут полностью искоренить этот фактор нервозности. Если вы не делаете ничего плохого, компьютер обязательно оповестит сотрудника полиции, что вы не делаете ничего плохого. Лично я в таком случае буду ощущать повышенный уровень своей собственной безопасности и защиты от полицейского произвола, зная о том, что компьютер сможет осуществлять подобный уровень оценки угроз».
В любом случае Хамон совсем не беспокоится об интерпретировании результатов анализа данных алгоритмом, который он создал. В то же время, несмотря на уверенность в своем алгоритме, он также признает и его ограниченность. Поэтому, если говорить о выводах, составленных на базе анализа, то, по мнению исследователя, это решение лучше оставить на экспертов правоохранительной системы, медицины и психиатрии.
Будущее разработок Хамона в компании Silver Logic Labs только начинается. И варианты сфер применения создаваемого им ИИ ограничены лишь человеческим воображением. Сам Хамон хочет, чтобы его инструмент стал по-настоящему универсальным и использовался при решении самых разных вопросов, однако так или иначе исследователя тянет туда, откуда все это началось: к созданию высококачественного развлекательного контента.
«Повествование – это часть человеческой культуры», — говорит Хамон.
Благодаря своей работе он обнаружил как минимум один неподдающийся оценке элемент, являющийся ключом к медиауспеху.
«Человек по-настоящему наслаждается наблюдением за тем, как один люди взаимодействуют с другими. Это одна из тех вещей, которая составляет формулу успеха», — добавляет исследователь.
Несмотря на то, что общество, возможно, может негативно воспринимать те трансформации, которые ИИ обещает привнести в нашу жизнь, в видении Хамона, безусловно, можно найти и один очень положительный момент. Рано или поздно искусственный интеллект на основе всех собранных им данных однажды сможет подвести нас к пересмотру нашего представления о том, что на самом деле значит быть человеком. Возможно, он сможет увидеть в нас то, что мы никогда раньше сами не видели в других или в нас самих.