В понедельник компания Amazon анонсировала новый универсальный ИИ-агент под названием Nova Act, который может брать на себя управление веб-браузером и выполнять простые действия самостоятельно. В комплект с этой моделью входит Nova Act SDK — набор инструментов для разработчиков, позволяющий создавать прототипы агентов с использованием Nova Act.
Nova Act была разработана недавно открывшейся лабораторией искусственного интеллекта Amazon в Сан-Франциско. Этот агент также будет поддерживать ключевые функции обновленной версии Alexa+, улучшенной генеративной версии популярного голосового помощника Amazon. Однако на данный момент доступная версия Nova Act немного менее совершенна и рассматривается как исследовательский предварительный просмотр.
Разработчики могут начать работу с инструментами Nova Act на новом веб-сайте nova.amazon.com, который также служит витриной для различных моделей Nova Foundation от Amazon.
Nova Act — это ответ Amazon конкурентам, таким как OpenAI и Anthropic, в области создания универсальных ИИ-агентов. Многие технологические компании считают, что такие агенты, способные работать с веб-сайтами, могут значительно повысить полезность современных чат-ботов.
Хотя Amazon, возможно, не была первой компанией, разработавшей подобную агентскую технологию, благодаря Alexa+ она имеет потенциал для самого широкого охвата.
Amazon утверждает, что с помощью Nova Act SDK разработчики смогут автоматизировать базовые действия от имени пользователей, например, заказывать салаты в Sweetgreen или бронировать столики на ужин. Инструментарий Nova Act позволяет создавать ИИ-агента, который может перемещаться по веб-страницам, заполнять формы и выбирать даты в календарях.
Amazon утверждает, что Nova Act превосходит агентов OpenAI и Anthropic в нескольких тестах
Amazon заявляет, что Nova Act превзошла агентов OpenAI и Anthropic в нескольких внутренних тестах компании. Например, в тесте ScreenSpot Web Text, который оценивает, как агент AI взаимодействует с текстом на экране, Nova Act набрала 94%, обогнав CUA от OpenAI (88%) и Claude 3.7 Sonnet от Anthropic (90%).
Тем не менее, Amazon не проводила сравнение Nova Act с более популярными метриками агентов, такими как WebVoyager.
Nova Act является первым публичным продуктом, разработанным в недавно открывшейся лаборатории AGI Amazon, которая была создана с участием бывших исследователей OpenAI Дэвида Луана и Питера Аббеля. Оба ранее основали свои стартапы — Луан создал Adept, а Аббел стал соучредителем Covariant, — прежде чем присоединиться к Amazon в прошлом году для возглавления усилий по созданию агентов AI.
Хотя может показаться странным, что лаборатория AGI занимается разработкой агентов, способных, например, заказывать еду из SweetGreen, Луан объяснил TechCrunch, что он видит агентов как ключевой этап на пути к созданию сверхразумных систем AI. Луан определяет AGI как «систему AI, которая может помочь вам делать все, что человек делает на компьютере».
Он также отметил, что команда разработала Nova Act SDK для надежной автоматизации простых задач и предоставления разработчикам инструментов, которые позволят точно определить, когда вмешательство человека необходимо в процессе работы агента. Луан надеется, что это позволит создавать более надежные агентные приложения, хотя и не полностью автономные.
Amazon выводит своего первого универсального AI-агента на переполненный рынок, но эта технология представляет собой важное направление, на которое компания возлагает большие надежды. Ранние тесты Nova Act могут дать представление о возможностях давно ожидаемой обновленной версии Alexa+, что станет критическим для усилий Amazon в области AI.
Основной проблемой ранних агентов AI от OpenAI, Google и Anthropic является их надежность в разных областях. В тестах TechCrunch системы демонстрируют медлительность, сложности с автономной работой на длительных промежутках времени и склонность к ошибкам, которых бы не допустил человек. Ожидается, что в ближайшее время мы увидим, сможет ли Amazon избежать этих недостатков или же её агенты столкнутся с теми же проблемами, что и конкуренты.
Nova Act была разработана недавно открывшейся лабораторией искусственного интеллекта Amazon в Сан-Франциско. Этот агент также будет поддерживать ключевые функции обновленной версии Alexa+, улучшенной генеративной версии популярного голосового помощника Amazon. Однако на данный момент доступная версия Nova Act немного менее совершенна и рассматривается как исследовательский предварительный просмотр.
Разработчики могут начать работу с инструментами Nova Act на новом веб-сайте nova.amazon.com, который также служит витриной для различных моделей Nova Foundation от Amazon.
Nova Act — это ответ Amazon конкурентам, таким как OpenAI и Anthropic, в области создания универсальных ИИ-агентов. Многие технологические компании считают, что такие агенты, способные работать с веб-сайтами, могут значительно повысить полезность современных чат-ботов.
Хотя Amazon, возможно, не была первой компанией, разработавшей подобную агентскую технологию, благодаря Alexa+ она имеет потенциал для самого широкого охвата.
Amazon утверждает, что с помощью Nova Act SDK разработчики смогут автоматизировать базовые действия от имени пользователей, например, заказывать салаты в Sweetgreen или бронировать столики на ужин. Инструментарий Nova Act позволяет создавать ИИ-агента, который может перемещаться по веб-страницам, заполнять формы и выбирать даты в календарях.
Amazon утверждает, что Nova Act превосходит агентов OpenAI и Anthropic в нескольких тестах
Amazon заявляет, что Nova Act превзошла агентов OpenAI и Anthropic в нескольких внутренних тестах компании. Например, в тесте ScreenSpot Web Text, который оценивает, как агент AI взаимодействует с текстом на экране, Nova Act набрала 94%, обогнав CUA от OpenAI (88%) и Claude 3.7 Sonnet от Anthropic (90%).
Тем не менее, Amazon не проводила сравнение Nova Act с более популярными метриками агентов, такими как WebVoyager.
Nova Act является первым публичным продуктом, разработанным в недавно открывшейся лаборатории AGI Amazon, которая была создана с участием бывших исследователей OpenAI Дэвида Луана и Питера Аббеля. Оба ранее основали свои стартапы — Луан создал Adept, а Аббел стал соучредителем Covariant, — прежде чем присоединиться к Amazon в прошлом году для возглавления усилий по созданию агентов AI.
Хотя может показаться странным, что лаборатория AGI занимается разработкой агентов, способных, например, заказывать еду из SweetGreen, Луан объяснил TechCrunch, что он видит агентов как ключевой этап на пути к созданию сверхразумных систем AI. Луан определяет AGI как «систему AI, которая может помочь вам делать все, что человек делает на компьютере».
Он также отметил, что команда разработала Nova Act SDK для надежной автоматизации простых задач и предоставления разработчикам инструментов, которые позволят точно определить, когда вмешательство человека необходимо в процессе работы агента. Луан надеется, что это позволит создавать более надежные агентные приложения, хотя и не полностью автономные.
Amazon выводит своего первого универсального AI-агента на переполненный рынок, но эта технология представляет собой важное направление, на которое компания возлагает большие надежды. Ранние тесты Nova Act могут дать представление о возможностях давно ожидаемой обновленной версии Alexa+, что станет критическим для усилий Amazon в области AI.
Основной проблемой ранних агентов AI от OpenAI, Google и Anthropic является их надежность в разных областях. В тестах TechCrunch системы демонстрируют медлительность, сложности с автономной работой на длительных промежутках времени и склонность к ошибкам, которых бы не допустил человек. Ожидается, что в ближайшее время мы увидим, сможет ли Amazon избежать этих недостатков или же её агенты столкнутся с теми же проблемами, что и конкуренты.