Новый алгоритм Google для отслеживания движений

22/08/2019 - 09:21

224

Поначалу в смарт-очках, для ввода информации пользователем, использовались трекпады, портативные или носимые контроллеры. Тем не менее, интерфейсы управления жестами HoloLens 2 и Magic Leap One определяют будущее системы ввода смарт-очков.

Новая модель машинного обучения, разработанная исследовательской группой Google, позволяет реализовывать сложные системы управления жестами, обычно используемые в высококлассных AR системах, в недорогих очках без дополнительных затрат на специальные датчики глубины и движения.

Новая модель машинного обучения, разработанная исследовательской группой Google

На этой неделе команда разработчиков ПО Google AI представила свой новейший метод для отслеживания движения рук и пальцев, который использует открытый кроссплатформенный фреймворк MediaPipe с открытым кодом, для обработки видео с мобильных устройств (не в облаке) и мгновенного создания карты руки и пальца из 21 точки посредством моделей машинного обучения.

«Мы надеемся, что распространение этого алгоритма по распознаванию рук широкому сообществу исследователей и разработчиков приведет к появлению случаев творческого использования, стимулируя новые приложения и новые направления исследований», — написала команда в блоге, подробно описывая свой подход.

Метод отслеживания рук и пальцев Google фактически разделяет задачу на три модели машинного обучения. Вместо того, чтобы использовать модель машинного обучения для распознавания самой руки, которая поддается широкому спектру размеров и поз, исследователи Google вместо этого использовали алгоритм обнаружения ладоней. Используя этот подход, команда достигла средней точности почти 96%.

Новая модель машинного обучения, разработанная исследовательской группой Google

При обнаружении ладони, другая модель машинного обучения идентифицирует 21 координатную точку кисти и костяшки кисти руки или кисти руки в поле зрения камеры. Третий алгоритм предполагает просмотр жеста, записывая позу для каждого пальца и сопоставляя ее с заранее определенными жестами, с подсчетом жестов и различными поддерживаемыми знаками кисти.

Другими словами, такой подход к машинному обучению может применяться на устройствах Android или iOS без специальных датчиков движения или глубины. Кроме того, команда делает модель общедоступной и с открытым исходным кодом, чтобы ее могли использовать другие разработчики и исследователи. Группа также планирует со временем повысить точность и производительность алгоритма.

В ближайшем будущем, этот алгоритм сможет помочь разработчикам в построении AR опыта, аналогичного опыту на Snapchat и Facebook, который поддерживает распознавание и отслеживание рук в эффектах для камеры.

Google также может использовать эти технологии в совместной работе с солярным радарным датчиком Soli на Pixel 4 для создания уникальных возможностей AR, сходных с Animojis на iPhone X серии, использующих ARKit Apple и камеру TrueDepth.

Однако, более серьезное значение, которое несет в себе эта разработка, это то, что машинный подход к обучению может дать умным очкам. Даже отказавшись от датчиков движения и глубины, производители оборудования смогут приблизиться к методам ввода данных пользователя HoloLens 2 и Magic Leap One.

Все больше и больше технологических компаний полагаются на искусственный интеллект для решения задач, связанных с функциональностью и форм-фактором AR.

Даже компания Microsoft сочетает подход ARKit и ARcore, использующий искусственный интеллект для обнаружения поверхностей, чтобы обеспечить лучшие возможности HoloLens 2 для понимания сцен.

Программный подход также может стать ключом к появлению смарт-очков, которые достаточно тонкие, чтобы носить их каждый день, а не только дома или в офисе.

Vladimir Voronov

Читайте так же

Теперь можно будет сделать аватар, который не только похож на меня, но и на мою версию после успешного похода в спортзал. Интересно, когда я смогу при помощи ИИ подбирать себе одежду и в реальной жизни?

ТихийМакс

01/08/2025 - 12:00

Основные угрозы безопасности XR, которые должен знать каждый бизнес

Технологии XR действительно открывают массу возможностей для бизнеса, но мне кажется, что тема безопасности в этой сфере недостаточно обсуждается.

Vladislav

12/07/2025 - 16:02

В сеть попали рендеры новых очков Ray-Ban Meta.

Интересно, что они назвали модели в честь коктейлей. Надеюсь, в будущем не придется напоминать очкам, что я забыл ключи в баре после того, как выпил настоящий Aperol. Интригует, как они встроят AI в такой компактный аксессуар.

Серёга

12/07/2025 - 15:55

Приложение Zoom теперь доступно на Quest, позволяя проводить совещания в виде аватара.

Интересно, как будет ощущаться совещание, когда коллеги видят не твоё лицо, а аватара. Надеюсь, никто не решит прийти на встречу в виде дракона или робота. Хотя, может, это добавит немного веселья в рабочие будни.

Назар

12/07/2025 - 15:55

Производитель умных контактных линз привлек $250 млн инвестиций при оценке в $1,35 млрд

Умные линзы с ночным видением и масштабированием звучат как что-то из шпионских фильмов. Если они реально смогут всё это реализовать, то обычные очки и смартфоны могут спокойно отправляться на пенсию.

FoxMihail

10/07/2025 - 19:23

Приложение Zoom теперь доступно на Quest, позволяя проводить совещания в виде аватара.

Ну, вот теперь можно будет не только опаздывать на совещания, но и делать это в виде мультяшного аватара. Интересно, коллеги заметят, если я приду на встречу в пижаме? 😅

GromAlex

10/07/2025 - 16:42

Производитель умных контактных линз привлек $250 млн инвестиций при оценке в $1,35 млрд

Представляю, как это может изменить походы на концерты и спортивные мероприятия. С такими линзами каждый зритель станет своим личным оператором. Только вот интересно, каково это будет, если линзы запотеют или потеряются в самый неподходящий момент. 😅

Zheka_Nord

10/07/2025 - 16:08

Производитель умных контактных линз привлек $250 млн инвестиций при оценке в $1,35 млрд

Умные контактные линзы с ночным видением и функцией масштабирования — это уже не просто фантастика, а реальность, которая может кардинально изменить наши привычки.

Димон

09/07/2025 - 19:44

Приложение Zoom теперь доступно на Quest, позволяя проводить совещания в виде аватара.

Прикольно, что теперь можно быть на совещании в образе аватара, но мне кажется, коллеги не сразу привыкнут к мультяшной версии меня 🙂. Надеюсь, это поможет сделать рабочие встречи чуть менее скучными.

MadEvgen

09/07/2025 - 17:25

Meta разрабатывает Bigscreen: социальный VR-проект

Звучит как попытка Meta создать свой кинотеатр в VR, но интересно, как они обойдут все юридические заморочки с контентом. Надеюсь, там можно будет не только кино смотреть, но и иногда "Властелина колец" с друзьями обсуждать. 😅

Палыч

09/07/2025 - 14:55

Новый алгоритм Google для отслеживания движений

Читайте так же

Комментарии

Xiaomi представила китайский ответ на умные очки Meta с несколькими выдающимися функциями

AWE 2025: 4 компании, которые формируют будущее XR

От идеи к реальности: как Meta Quest помогает в ремонте

Производитель умных контактных линз привлек $250 млн инвестиций при оценке в $1,35 млрд

Компания KIWI представила обновлённые версии аудиосистемы и аккумулятора для Quest 3.