El FOMO de la inteligencia artificial 💅🏼
Lo nuevo de OpenAI, Google y el emoji más incomprendido
Muy buenos días. Yo creo que este boletín es un remedio contra el FOMO (Fear Of Missing Out) que significa el miedo a perderse de algo, una sensación de ansiedad provocada por la cantidad de estímulos visuales que vemos en las redes sociales de gente haciendo o sabiendo cosas.
Si eso siento yo con la inteligencia artificial no me quiero imaginar alguien que no se dedica a leer sobre el tema. Es imposible no leer un titular, un comentario, ver un reel de TikTok, etc. ¿Qué nos estamos perdiendo? ¿Es posible hacer tantas cosas de verdad?
Una amiga me pidió algo inimaginado el otro dia: quiero envejecer una foto, pero no mucho, unos años nomás 👵🏻. Se que no hay herramientas que puedan hacer eso bien, al menos las gratuitas, menos que menos manejada por alguien que no es diseñador. Además, la IA nos entrega resultados -aún- no humanos.
Intentaré en este boletín ser realista. Estamos bombardeados de información no deglutida e imprudente sobre los alcances de la IA. Vamos a los hechos.
Pero antes algo importante: estas herramientas se nutrieron de contenidos con derechos de autor. En el caso de OpenAI, hay varias demandas en la justicia. En el caso de Google, Autoridad de la Competencia de Francia multó a la empresa por entrenar a Bard con material de sus diarios.
🕣 Este boletín tiene 1800 palabras y lleva 9 minutos de lectura.
1. El gran cambio: el sistema multimodal
Esta semana vieron la luz ChatGPT 4o y Gemini, dos sistemas con múltiples versiones y formatos que estarán disponibles paulatinamente a lo largo del año y serán multimodales, es decir, funcionan con texto, imagen, video y voz: ven, escuchan, hablan, escriben y generan contenido visual.
Cualquier cosa que ingresemos en estas máquinas virtuales puede ser usado para seguir entrenando los sistemas. A menos que la política de privacidad diga lo contrario, es lo que tenemos que imaginar.
Todo esto se puede resumir en que los asistentes de voz (tipo Alexa o Siri) volvieron recargados, porque son veloces, más completos y tienen tonos de voz (en especial ChatGPT que hasta entiende el sarcasmo).
Además de escuchar pueden ver y escribir. Eso es lo que presentó, a grandes rasgos, tanto Google como OpenAI. ¿Qué nos cambia? Ya, ya, el buscador.
Google y Gemini: Gemini es una app pero también es su motor de IA incorporado a todos los productos de Google. Miren esto.
Es asombroso y en este caso, no se equivoca. Pero las IA suelen cometer errores en los datos que entregan. Dice el especialista en tecnología Max Read al respecto: “es basura generada por un LLM incorrecta, no deseada e innavegable, forzada a vivir experiencias que realmente no la necesitan”.
Mis pruebas para este newsletter fueron reprobadas por ambos sistemas: no son para responder información, para eso, el camino siguen siendo los buscadores. Los chabots alucinan: mienten, aportan información falsa e inexacta. Bastó por preguntarle quien soy yo en reiteradas oportunidades y a pesar de tener mucha información en google me dice que soy una escritora de cuentos infantil mexicana o una periodista mexicana.
Tanto Gemini (en su versión Proyecto Astra) como ChatGPT-4o, podrán interactuar con imágenes, vídeo, audio y texto a través del celular o computadora pero aún no lo podemos usar. En el caso de Gemini, será paulatino, en el de ChatGPT, para la versión paga.
2. Usos de ChatGPT hoy
Usarlos como co-pilotos, como asistentes, como herramientas de apoyo pero no como generador de productos finales porque ahí pueden fallar.
Cada semana, más de cien millones de personas utilizan ChatGPT. La versión paga de ChatGPTo incluye generación de imágenes, resúmenes de PDFs, preguntas y respuestas y buscar en internet. La gratuita tiene información anterior a 2023.
Hablar: Ya está disponible la posibilidad de hablar -con diferentes tonos- con ChatGOPT desde la app del celular -o acceder desde la computadora-.
Consultarle temáticas y pedirle contexto y fuentes
Consultar sobre una imagen (fotografiarla en el momento o subirla): detecta lo que es y describe cada objeto y situación.
Lo asombroso de lo que vimos en los videos es la velocidad de respuesta (menos latencia entre que le pedimos algo y responde) y las intenciones con las que la voz -femenina, claro-, responde, con un tono tan natural y amable como podría hacerlo un humano.
Esto es lo que podemos hacer en la versión gratuita. En la paga, hay generación de imágenes y consulta de PDFs para su análisis o resúmenes. En el futuro, habrá mucho más. En el futuro, lo que se podrá hacer, pagando, es:
Profesor particular: como verán, en este video, es el mismo Sal Khan, fundador de una plataforma educativa que tiene más de 1600 millones de usuarios, el que le pide al sistema que le ayudara a su hijo a entender cómo solucionar un problema matemático.
Pero ojo con lo que le piden. Miren-escuchen este diálogo sobre música argentina que acabo de tener: alucina con la letra de Los Libros de la Buena Memoria y me dice que Roberto Goyeneche es un cantante de boleros 😅.
3. Usos de Gemini y Google con IA
Casi todos usamos Google. Bueno, ahora, la IA estará embebida en casi todo, desde el buscador tradicional hasta las fotos y los correos electrónicos. Si pagamos, podremos acceder a la frutilla del postre. Pero si lo usamos gratis, de a poco también.
¿Cómo se usa? Varias maneras. A través de la app Gemini y/o el gesto Círculo para buscar y vendrá empaquetado en diferentes opciones y planes. El nombre técnico de todo esto es LearnLM, su familia de modelos optimizados para el aprendizaje.
Fotos: la nueva función “Ask Photos” permitirá pedirle a Google foto cosas. Por ejemplo: "Muéstrame la mejor foto de cada parque nacional que he visitado" pero también “¿Cuál es mi número de licencia de conducir o de patente?”. La herramienta recordará las conversaciones y tendrá esa data a la mano
Estafas: Gemini Nano podrá escanear intentos de estafas en el celular (por ahora, solo en Pixel) según las palabras que te vayan diciendo.
Asistente de voz: la función TalkBack, disponible en Nano, podrá generar descripciones de imágenes y más cositas.
Asistente general: el Proyecto Astra es el que nos va relatando lo que vemos. Una función ideal para personas ciegas, con visibilidad reducida o, simplemente, para consultar algo que no entendemos.
Realización visual y audiovisual: Con Image 3 y Veo la IA de Google avanza sobre este polémico campo en el que dibujar, hacer ilustraciones o crear videos será posible a partir de un prompt (una descripción textual). Lyria, por su parte, es la IA para generar piezas musicales a partir de texto.
¿Qué podemos hacer hoy?
Búsquedas en internet: AI Overviews es la función desarrollada para que Google nos entregue la información masticada cuando hagamos una búsqueda. De a poco, nos permitirá buscar un comercio por cercanía o pedirle que nos sugiera el mejor lugar para comer pizza (información no curada por un humano).
Texto: El otro día Cata de Elía, la periodista, me contaba y mostraba como usaba ChatGPT para hacer sus notas. Ella le entrega la información exacta, le dice qué tiene que hacer y en qué tono lo desea, por ejemplo, con el estilo de tal diario. El resultado es una nota periodística. Si está medio formal, se le pide que mejore, y lo mismo al revés. Imprescindible que le demos nosotros la información porque si la levanta de internet puede mentir. Después, la editás.
Infografías y análisis de datos:
, periodista Mexicano y autor de Story Baker, contaba en su newsletter cómo le pidió a ChatGPT que analizara un gráfico del New York Times y lo desglosara en datos escritos. Después, le pidió que haga una infografía nueva en base a esa información. Tuvo que pedirle varias veces que corrigiera alguno de los aspectos de lo que le entregó pero lo logró. Aquí lo cuenta. Esta función en ChatGPT es paga, pero en Gemini es gratuita y funciona muy bien.4. El emoji más incomprendido 💅🏼
La empresa Preply hizo una encuesta entre 2200 estadounidenses para ver cómo usaban este lenguaje, aparentemente, universal. Las conclusiones fueron que
💅, 💨 y 🙃 son los emojis más confusos en 2024.
El uso de un emoji por parte de otros ha causado confusión en el 81%.
El 48%, vio un emoji mal interpretado y se creó una situación incómoda.
El emoji del fénix es el más confuso de los que se lanzarán en 2024 🐦🔥.
Con respecto a este emoji 💅🏼, el 40% usa el ícono para significar tener clase o ser elegante, otros dicen que significa "solo esmalte de uñas", "No me hagas caso, jeje" y "cuidado personal". Los emojis confusos que siguen en la lista se alejan corriendo 💨 y la cara al revés 🙃.
Dice el estudio (coincido) que mientras que alguien puede interpretar su 👍 como aprobación o acuerdo, otro puede tomarlo como una respuesta pasivo-agresiva o desdeñosa.
Con respecto a la ✌️, este emoji significa "paz" en el Reino Unido y Estados Unidos. En Gran Bretaña y Australia la palma mira hacia adentro, es como mostrar el dedo medio. Agrego: en Argentina, es la V de la victoria o el símbolo del peronismo.
El principal emoji que no se usan según lo previsto es el de la cara perseverante 😣: solo el 5% lo usa según lo previsto y la mayoría lo usa para indicar frustración. Los dos siguientes emojis que se rebelaron contra fueron la cara de miedo 😨 y el esmalte de uñas 💅.
Es muy interesante el estudio. Se puede leer aquí.
Recomendados ✍️
Calculadora de consumo eléctrico: Esta calculadora del ENRE permite hacer un balance de lo que consumimos mes a mes en electricidad. Si bien hay que cargar cada artefacto a mano, permite calcular el consumo de tus artefactos eléctricos, consultar tu consumo de energía eléctrica liquidada durante los últimos seis bimestres (sólo para usuarios de EDENOR y EDESUR) y repasar consejos de uso eficiente.
Los tamaños reales de los países: Una gran herramienta de pensamiento crítico sobre lo que vemos y lo que sucede en realidad con los tamaños de los países. Ideal para quienes tienen niños y niñas en época escolar.
GPTZero: Esta es uno de los tantos sitios que nos permite detectar si un texto fue escrito con alguna de las herramientas disponibles de inteligencia artificial generativa. No es infalible pero ayuda.
Desinformación Revelada: Este proyecto de Chequeado no es nuevo pero está buenísimo. Dirigido a docentes -también padres, madres, tutores- que quieran herramientas lúdicas para detectar desinformaciones y a evitar su circulación. Es un jueguito, elegís el personaje y empezás a pensar :)
Nunca aplastaríamos la creatividad dice Samsung, en su contra-video ante la criticada publicidad de la nueva iPad de Apple. Se llama #UnCrush
Este boletín es semanal y gratuito, pero cada vez son más los que se suman al modo suscripción ♥️. Gracias María Sol por suscribirte y Andrés, Matias y Romina por la colaboración.
Maneras de apoyar el trabajo independiente ☕️
Más allá de Hugo del Carril como cantante de tangos, que te diga que sos mexicana es parte del sesgo de carga que tienen estos bichos... para la gran mayoría de los gringos, todos los que estamos al sur del Rio Grande somos "mexicans".
Uno de los grandes problemas definitivamente es que a pesar de que la IA pueda estar alucinando, el tono con el que va a entregarte una información o darte cierto output ya está calibrado para ser convincente (no se si por diseño, o simplemente por estar entrenado en contenido muy orientado a SEO), lo cual lo hace doblemente peligroso para el que lo consume.
Con lo que es generación de imagenes o retocado artificial ya estamos ahi tambien, hace un par de dias me comi un deepfake y un perfil de influencer creado por IA que me dejo tecleando, porque suelo cazarlos rapido.