Presentando Amazon Nova: Una nueva generación de modelos fundacionales

En AWS re:Invent, Amazon.com Inc (NASDAQ: AMZN) presentó Amazon Nova, una
nueva generación de modelos fundacionales (FM, su sigla en inglés) que cuentan con inteligencia de última generación
con una amplia gama de tareas y una relación precio-rendimiento líder en la industria. Los modelos de Amazon Nova
estarán disponibles en Amazon Bedrock e incluyen: Amazon Nova Micro (un modelo de texto a texto muy rápido); y
Amazon Nova Lite, Amazon Nova Pro y Amazon Nova Premier (modelos multimodales que pueden procesar imágenes y
videos para generar texto). Amazon también lanzó dos modelos adicionales: Amazon Nova Canvas (que genera
imágenes con calidad de estudio) y Amazon Nova Reel (que genera videos con calidad de estudio).
“En Amazon, tenemos cerca de 1,000 aplicaciones de IA generativa en funcionamiento y hemos tenido una visión general
de lo que los desarrolladores de aplicaciones aún están afrontando”, afirmó Rohit Prasad, vicepresidente sénior de
Inteligencia Artificial General de Amazon. “Nuestros nuevos modelos Amazon Nova están pensados ​​para ayudar a los
desarrolladores internos y externos a afrontar estos desafíos, y proporcionar una inteligencia y una generación de
contenido convincentes, al tiempo que ofrecen un progreso significativo en latencia, rentabilidad, personalización,
Generación Aumentada de Recuperación (RAG, su sigla en inglés) y capacidades de agente”.
Los modelos de comprensión de Amazon Nova demuestran inteligencia, capacidades y velocidad excepcionales
Amazon Nova incluye cuatro modelos de última generación. El primero, Amazon Nova Micro, es un modelo de solo texto
que ofrece las respuestas con la latencia más baja a un costo muy pequeño. Los tres siguientes son: Amazon Nova Lite,
un modelo multimodal de muy bajo costo que es increíblemente rápido para procesar entradas de imágenes, videos y
texto; Amazon Nova Pro, un modelo multimodal de gran capacidad con la mejor combinación de precisión, velocidad y
costo para una amplia gama de tareas; y Amazon Nova Premier, el modelo multimodal más capaz de Amazon para
tareas de razonamiento complejas y para su uso como el mejor maestro para destilar modelos personalizados. Amazon
Nova Micro, Amazon Nova Lite y Amazon Nova Pro están disponibles en general hoy; Amazon Nova Premier estará
disponible en el primer trimestre de 2025.
Probamos los modelos Amazon Nova en comparación con una amplia gama de parámetros de referencia estándar de la
industria. Amazon Nova Micro, Amazon Nova Lite y Amazon Nova Pro tienen un rendimiento bastante competitivo en
comparación con los mejores modelos en sus respectivas categorías.
Se determinó que Amazon Nova Micro es igual o mejor 1 que Meta LLaMa 3.1 8B en los 11 puntos de referencia
aplicables y que Google Gemini 1.5 Flash-8B en los 12 puntos de referencia aplicables. Con la velocidad líder en la
industria de Amazon Nova Micro de 210 tokens de salida por segundo, es ideal para aplicaciones que requieren
respuestas rápidas.
Amazon Nova Lite también es altamente competitivo con otros modelos de la misma clase de inteligencia; tiene un
rendimiento igual o mejor en 17 de 19 puntos de referencia en comparación con GPT-4o mini de OpenAI, igual o mejor
en 17 de 21 puntos de referencia en comparación con Gemini 1.5 Flash-8B de Google, e igual o mejor en 10 de 12 puntos
1 Cuando dos modelos se superponen en sus intervalos de confianza del 95% de precisión medida, se consideran
“iguales”.

2
de referencia en comparación con Claude Haiku 3.5 de Anthropic. Además de ofrecer precisión en los puntos de
referencia de texto, Amazon Nova Lite se destaca en la comprensión de videos, gráficos y documentos según lo medido
por puntos de referencia como VATEX, ChartQA y DocVQA. Amazon Nova Lite también se destaca en flujos de trabajo de
agentes, como la llamada de función medida por Berkeley Function Calling Leaderboard, y en las capacidades básicas de
comprensión de elementos visuales para realizar acciones en navegadores y pantallas de computadora, según lo medido
por VisualWebBench (punto de referencia para acciones en navegador web) y Mind2Web (punto de referencia de
agentes multimodales generalistas).
Amazon Nova Pro tuvo un rendimiento igual o mejor en 17 de 20 puntos de referencia en comparación con GPT-4o de
OpenAI, igual o mejor en 16 de 21 puntos de referencia en comparación con Gemini 1.5 Pro de Google, e igual o mejor
en 9 de 20 puntos de referencia en comparación con Anthropic Claude Sonnet 3.5v2. Además de la precisión en los
puntos de referencia de inteligencia visual y de texto, Amazon Nova Pro se destaca en el seguimiento de instrucciones y
los flujos de trabajo de agentes multimodales, según las mediciones del Comprehensive RAG Benchmark (CRAG), el
Berkeley Function Calling Leaderboard y Mind2Web.
Compatibilidad multilingüe y multimodal con contexto extenso
Amazon Nova Micro, Lite y Pro admiten más de 200 idiomas. Amazon Nova Micro admite una longitud de contexto de
128,000 tokens de entrada, mientras que Amazon Nova Lite y Amazon Nova Pro admiten una longitud de contexto de
300,000 tokens, o 30 minutos de procesamiento de video. A principios del 2025, Amazon admitirá una longitud de
contexto de más de 2 millones de tokens de entrada.
Rápido y rentable
Todos los modelos de Amazon Nova son rápidos, rentables y se han diseñado para que resulten fáciles de usar con los
sistemas y los datos de un cliente. Amazon Nova Micro, Amazon Nova Lite y Amazon Nova Pro son al menos un 75% más
económicos que los modelos con mejor rendimiento en sus respectivas clases de inteligencia en Amazon Bedrock.
También son los modelos más rápidos en sus respectivas clases de inteligencia en Amazon Bedrock.
Integración continua con Amazon Bedrock
Todos los modelos de Amazon Nova están integrados con Amazon Bedrock, un servicio totalmente administrado que
hace que los FM de alto rendimiento de las principales empresas de IA y Amazon estén disponibles para su uso a través
de una única API. Con Amazon Bedrock, los clientes pueden experimentar y evaluar fácilmente los modelos de Amazon
Nova, así como otros FM, para determinar cuál es el mejor modelo para una aplicación.
Soporte para realizar ajustes finos a fines de aumentar la precisión
Los modelos también admiten ajustes finos personalizados, que permiten a los clientes indicarles ejemplos en sus
propios datos propietarios que han sido etiquetados para aumentar la precisión. El modelo de Amazon Nova aprende lo
que más le importa al cliente a partir de sus propios datos (incluidos texto, imágenes y videos) y, luego, Amazon Bedrock
entrena un modelo privado que proporcionará respuestas personalizadas.
Destilación para entrenar modelos más pequeños y eficientes
Además de respaldar el ajuste fino, los modelos también admiten la destilación, que permite la transferencia de
conocimiento específico desde un “modelo maestro” más grande y de gran capacidad a un modelo más pequeño y
eficiente que es altamente preciso, pero también más rápido y económico de ejecutar.
RAG para fundamentar las respuestas en los datos
Los modelos de Amazon Nova están integrados con las bases de conocimiento de Amazon Bedrock y se destacan en la
RAG, lo que permite que los clientes garanticen la mejor precisión al fundamentar las respuestas en los datos propios de
la organización.

3
Optimizado para aplicaciones de agentes
Los modelos de Amazon Nova se han optimizado para que sean fáciles de usar y eficaces en aplicaciones de agentes que
requieren interactuar con los sistemas y datos propietarios de una organización a través de múltiples API para ejecutar
tareas de varios pasos.
Acceso a contenido visual de calidad de producción con los modelos de generación de contenido creativo de Nova
Amazon Nova Canvas es un modelo de generación de imágenes de última generación que crea imágenes de calidad
profesional a partir de texto o imágenes proporcionadas en las prompts Amazon Nova Canvas también proporciona
funciones que facilitan la edición de imágenes mediante entradas de texto y proporciona controles para ajustar el
esquema de colores y el diseño. El modelo viene con controles integrados para respaldar el uso seguro y responsable de
la IA, que incluyen funciones como la marca de agua, que permite rastrear siempre la fuente de una imagen, y la
moderación de contenido, que limita la generación de contenido potencialmente dañino. Amazon Nova Canvas tiene un
mejor rendimiento que los generadores de imágenes como OpenAI DALL-E 3 y Stable Diffusion en evaluaciones humanas
en paralelo realizadas por un tercero y en métricas automatizadas clave.
Amazon Nova Reel es un modelo de generación de videos de última generación que permite a los clientes crear
fácilmente videos de alta calidad a partir de texto e imágenes. Es ideal para la creación de contenido en publicidad,
marketing o capacitación. Los clientes pueden usar prompts en lenguaje natural para controlar el estilo visual y el ritmo,
incluido el movimiento de la cámara, la rotación y el zoom. Supera a los modelos comparables en calidad y consistencia,
según evaluaciones humanas en paralelo realizadas por un tercero que prefirió los videos generados por Amazon Nova
Reel sobre los generados por Gen-3 Alpha de Runway. Al igual que Amazon Nova Canvas, Amazon Nova Reel viene con
controles integrados para respaldar la seguridad y el uso responsable de la IA, incluida la marca de agua y la moderación
de contenido. Amazon Nova Reel genera actualmente videos de seis segundos y admitirá la generación de videos de
hasta dos minutos de duración en los próximos meses.
Próximos pasos: modelos de voz a voz y multimodal a multimodal
Amazon presentará un modelo de voz a voz Amazon Nova en el primer trimestre de 2025. El modelo está diseñado para
transformar las aplicaciones de IA conversacional al comprender la entrada de voz en lenguaje natural, interpretar
señales verbales y no verbales (como el tono y la cadencia) y brindar interacciones naturales reciprocas, similares a las
humanas, con baja latencia.
Amazon también está desarrollando un modelo novedoso que puede tomar texto, imágenes, audio y video como
entrada y generar salidas en cualquiera de estas modalidades. Este modelo Amazon Nova con capacidades nativas de
multimodal a multimodal (o de cualquier modalidad a cualquier modalidad) se presentará a mediados de 2025.
Simplificará el desarrollo de aplicaciones en las que se puede utilizar el mismo modelo para realizar una amplia variedad
de tareas, como traducir contenido de una modalidad a otra, editar contenido y potenciar agentes de IA que puedan
comprender y generar todas las modalidades.
Los socios y clientes de AWS ya están aprovechando las capacidades y la relación precio-rendimiento de los modelos
de Amazon Nova
SAP, un socio estratégico de AWS, está integrando los modelos de Amazon Nova en la familia de modelo de lenguaje de
gran tamaño (LLM) compatibles de su hub de IA generativa SAP AI Core. Esto permite a los desarrolladores crear nuevas
habilidades para Joule, el copiloto de inteligencia artificial de SAP, y desarrollar de forma segura soluciones impulsadas
por inteligencia artificial que aprovechen todo el contexto empresarial capturado en los datos de SAP, lo que permite la
automatización, la personalización y soluciones avanzadas como la planificación de la cadena de suministro.
Deloitte, socio estratégico de AWS, se compromete a ofrecer los mejores servicios de IA generativa a empresas globales
de todos los sectores. Deloitte sabe que las soluciones de inteligencia artificial y los modelos básicos no son iguales para

4
todos y cree que las capacidades avanzadas de personalización y la seguridad mejorada de los modelos de Amazon Nova
impulsarán la innovación que ofrece un valor excepcional a sus clientes en todo el mundo.
Dentsu Digital Inc., una empresa de marketing digital, está integrando Amazon Nova Reel en su proceso creativo, lo que
le permite a su equipo mejorar y acelerar el desarrollo de sus campañas, desde la presentación de informes hasta el
desarrollo del concepto y la generación de contenido de video creativo. Amazon Nova Reel reduce el tiempo total que
lleva generar nuevos activos de semanas a días.
Musixmatch es la plataforma de letras de canciones más grande del mundo, con más de 80 millones de usuarios y una
base de datos de más de 11 millones de letras únicas. Musixmatch incluye Amazon Nova Reel en Musixmatch Pro, que
ayuda a los creadores a distribuir letras en todos los principales servicios de streaming digital y redes sociales. Los
artistas emergentes pueden usar Amazon Nova Reel para producir videos musicales de alta calidad utilizando el contexto
de sus canciones como entrada y personalizarlos con prompts en lenguaje natural.
123RF, un portal de fotografías y videos de archivo con una biblioteca de más de 200 millones de imágenes y videos,
utiliza Amazon Nova Canvas y Amazon Nova Reel para simplificar el proceso de diseño con herramientas más
inteligentes, rápidas y fáciles de usar para los creadores que producen medios visuales. La relación precio-rendimiento
líder de Amazon Nova, la velocidad, el razonamiento multilingüe y la moderación de contenido a escala ayudan a ofrecer
estas nuevas capacidades a clientes y creadores de todo el mundo.
Caylent, una empresa de servicios en la nube de última generación, está utilizando los modelos de Amazon Nova para
ofrecer capacidades de comprensión de video a clientes de los sectores de los medios de comunicación, los deportes y el
comercio minorista. Anteriormente, Caylent combinaba diferentes técnicas y modelos para ofrecer comprensión de
video a clientes de estos sectores. Ahora, Amazon Nova ofrece resultados líderes en la industria por una fracción del
costo, al tiempo que reduce el tiempo que lleva pasar del prototipo a la producción y elimina complejidades como el
mosaico de imágenes, el muestreo y el hash semántico.
Palantir Technologies crea software que permite la toma de decisiones basada en IA en muchos de los contextos más
críticos del mundo. Las capacidades de razonamiento avanzado de Amazon Nova Pro se integrarán con el Sistema
Ontology dentro de la Plataforma de Inteligencia Artificial (AIP, su sigla en inglés) de Palantir para impulsar nuevas
eficiencias operativas y flujos de trabajo de toma de decisiones en más de 40 industrias. Por ejemplo, esta integración
potenciará a los agentes de seguros que procesan solicitudes de pólizas complejas y a los agentes de la cadena de
suministro que organizan procesos de reasignación de extremo a extremo.
  
Shutterstock es una plataforma creativa líder que ofrece soluciones integrales, contenido de alta calidad y herramientas
para marcas transformadoras, medios digitales y empresas de marketing. Basándose en la alta calidad de imagen de
Amazon Nova Canvas, el equipo de Shutterstock está entusiasmado por incluir el modelo en el generador de imágenes
con IA de Shutterstock, lo que ofrece a los usuarios una oferta intuitiva y fácil de usar.
Amazon está comprometida con el desarrollo responsable de la inteligencia artificial
Los modelos de Amazon Nova están diseñados con medidas de seguridad y protecciones integradas. La empresa ha
lanzado las AI Service Cards de AWS para Amazon Nova, que ofrecen información transparente sobre casos de uso,
limitaciones y prácticas de inteligencia artificial responsables. Para obtener más información, explore las Tarjetas de
Servicio aquí: Amazon Nova Canvas, Amazon Nova Reel y Amazon Nova Micro, Amazon Nova Lite y Amazon Nova Pro.
Para comenzar a utilizar los modelos de Amazon Nova, visite: https://aws.amazon.com/nova/

FOLLOW US ON:
AWS anuncia nuevos c
Motorola es la prime

juanmesia@gmail.com

Comunicador, periodista dedicado al periodismo tecnológico, nomofóbico total. De niño desarmaba mis juguetes para saber cómo funcionaban... Sigo jugando a lo mismo... para saber más googlea: Juan Martín Mesía Castro

Rate This Article:
NO COMMENTS

Sorry, the comment form is closed at this time.