Компания Google выпустила API сервис компьютерного зрения Vision Cloud. Использование API позволит реализовать распознавание различных объектов. Об этом сообщается в официальном блоге Google.
С помощью Vision Cloud API разработчики могут реализовать в своих проектах чтения письменного текста, распознавания предметов, логотипов, человеческих лиц и достопримечательностей. Кроме того, облачный сервис помогает распознать опасные изображения и некоторые базовые эмоции человека: гнев, радость, удивление.
Для демонстрации возможностей API представители компании показали несколько примеров на простом колесном работе на базе Raspberry Pi. В частности, робот показал способность распознавать различные объекты и называть их вслух. Кроме того, в опубликованном ролике робот подъезжает ближе к человеку, если видит улыбающееся лицо.