Ataque a ChatGPT: Extracto de Datos de Gmail sin Rastro

  • Autor de la entrada:
  • Categoría de la entrada:AI Actualidad

Investigadores han descubierto un ataque llamado ShadowLeak que permite a un agente de IA de OpenAI, Deep Research, extraer información confidencial de Gmail sin que el usuario lo note. Esto resalta la necesidad de mejorar la seguridad en asistentes de inteligencia artificial.

Continuar leyendoAtaque a ChatGPT: Extracto de Datos de Gmail sin Rastro

Google presenta VaultGemma: modelo de lenguaje con privacidad

Google ha lanzado VaultGemma, un modelo de lenguaje que utiliza privacidad diferencial para evitar la memorización de datos sensibles durante el entrenamiento. Este avance busca equilibrar la innovación en inteligencia artificial con la protección de la privacidad del usuario.

Continuar leyendoGoogle presenta VaultGemma: modelo de lenguaje con privacidad

Estos trucos psicológicos pueden hacer que los LLM respondan a mensajes «prohibidos»

Un estudio de la Universidad de Pennsylvania revela que técnicas de persuasión psicológica pueden inducir a modelos de lenguaje (LLMs) a responder a prompts prohibidos. Estas técnicas, como la adulación, explotan vulnerabilidades del modelo, generando respuestas "parahumanas".

Continuar leyendoEstos trucos psicológicos pueden hacer que los LLM respondan a mensajes «prohibidos»

Cómo el nuevo algoritmo evolutivo de Sakana AI crea potentes modelos de IA

Sakana AI ha desarrollado el algoritmo evolutivo M2N2, que fusiona modelos existentes para crear agentes multifuncionales. Esta técnica reduce costos y necesidades de datos, permitiendo aplicaciones versátiles y eficientes en múltiples industrias, como salud y finanzas.

Continuar leyendoCómo el nuevo algoritmo evolutivo de Sakana AI crea potentes modelos de IA