Escribir y hablar cómo ChatGPT 🧠 ✅ 👀
Cómo el excesivo uso de los modelos de lenguaje está transformando nuestra manera de comunicarnos.
¡Buen dia!
Les doy la bienvenida a los que recién se suman con los números anteriores y a quienes -como me contaron- no pueden seguirle el ritmo. Use rayita del medio y todavía no asimilo lo que hablaremos en la edición de hoy. ¿Sigo siendo yo al escribir?
Les cuento que estaré dando una clase de IA de 1.30 horas de duración el martes 2 de diciembre de 18 a 19.30 horas. Será en vivo, gratuita para suscriptores pagos y con un valor de 30.000 pesos para el resto. Más info aquí.
🕣 Este newsletter lleva 7 minutos de lectura. Gracias a los que apoyan este proyecto independiente con palabras, retuits, cafecitos y suscripciones 🤗
1) El lenguaje algorítmico
Existe algo llamado lenguaje algorítmico. Son neologismos de esta época que modifican nuestra manera de hablar por dos razones: las redes sociales y el uso de IA.
En el libro “Algospeak: How Social Media Is Transforming the Future of Language” su autor Adam Aleksic reflexiona al respecto. Los adolescentes hablan de brain rot como si fueran manzanas. Brain Rot (cerebro podrido) se refiere al deterioro intelectual que padecemos por la avalancha de contenido digital.
Este tipo de términos en inglés es intenso y va creciendo porque se consolidan tendencias en redes que hacen que los creadores de contenido generen más y más videos con las tendencias como rizz (carisma).
En español, se usan de manera similar o se van traspasando según la tribu que lo utiliza. Le pregunté a mi sobrino de 10 años qué era un brain rot y, escucharán, es otra acepción que va asociada a su consumo de Roblox.
Tenemos términos asimilados como funar (cancelar) o Aesthetic (algo estético), lore (relato), etc.
Si analizamos los hooks o palabras de gancho inicial de los videos de internet veremos que tenemos un acotado lenguaje. Es decir, si usamos determinadas palabras, un video tiene más posibilidades de ser viral. Le pregunté a Gemini cuáles serían los ganchos de un video para este newsletter. Je, je. No tienen sentido o aburren, como lo escrito por los modelos de lenguaje.
“No preguntes a ChatGPT. Estos son los 4 algospeak que te hacen viral ahora mismo. Dejá de adivinar qué palabras funcionan.”
“El autor de Algospeak se equivocó en algo. El problema no es el brain rot, es el algospeak en español. Te digo cuáles son y por qué te están silenciando.”
“Dejá de usar esa palabra. Solo necesitás un gancho viral, y no es rizz. La única regla de algospeak que te va a hacer crecer es esta.”
Más allá del contenido de las frases, lo asombroso es que efectivamente vemos multitud de videos armados con ellas: creadores de contenidos que nos dan ordenes, nos dicen cómo hacer las cosas o por qué las estamos haciendo mal.
2) Si salimos del algoritmo y vamos a ChatGPT…
Los modelos de lenguaje, algunos más que otros, tienen una salida de palabras que nos entrega una versión aplanada del lenguaje. Prolijita, pero sin alma. De hecho, una de las mejores maneras de darse cuenta que algo está hecho con IA es percibir lo que sentimos al leerlo: ¿nos aburre? ¿nos parece demasiado formal? ¿da demasiadas vueltas? ¿repite? ¿no dice demasiado? Es IA.
El otro día me llegó una invitación a participar de algo muy compleja. No entendía lo que me querían decir. Es que eran cuatro o cinco párrafos para resumir un “me gustaría que pudieras venir porque te va a interesar”. Lo pasé por el detector de IA GPTZero y detalló por qué era IA.
Las palabras más usadas en inglés son sesgadas. Según Aleksic, tiene que ver con cómo se entrenaron los modelos de lenguaje. No lo hicieron automáticamente sino que, aún lo hacen, con trabajadores de bajos ingresos de Nigeria y Kenia en donde “delve” se usa con más frecuencia que en el inglés estadounidense o británico.
3) Las palabras más usadas por ChatGPT
Una investigación del Washington Post analizó cómo escribe la IA y esta información, que ya la suponíamos, es valiosa. Los investigadores desmenuzaron 38.000 conversaciones de ChatGPT y detectaron los emojis y palabras más frecuentes. También de qué manera subieron y cómo bajaron en el tiempo.
Los más usados son ✅ y 🧠
Los guiones largos —que en inglés se llaman dash—. ChatGPT se apropió de algo que los periodistas adoran usar.
La palabra delve (profundizar) se está dejando de usar en ChatGPT.
La palabra core (núcleo) despegó este último año.
El término moderno se está usando cada vez más.
Las formas de entregar respuestas de los modelos varían por diferentes razones, nuevo entrenamiento y, sobre todo, refuerzo con retroalimentación humana (RLHF). El problema es que todo esto se está transfiriendo al habla.
En español, algunos de los conectores más usados son: “sin embargo”, “por otro lado”, “además”, “cabe destacar”, “es importante mencionar”
📧 ¿Cansado del correo lleno? Te recomiendo Meco como suite de correo para escapar del mail lleno y leer newsletters sin tanto ruido. ¡Es gratuita! Si te anotás, recibo una comisión como afiliado.
4) Dime como hablas y te diré que IA eres
Estuve charlando con Agustín Gravano, Profesor y Director del Laboratorio de IA en la Universidad Torcuato Di Tella e Investigador del CONICET sobre cómo procesan el lenguaje en el laboratorio y trabajan con el habla.
Irina: ¿Cómo se procesa el habla computacionalmente?
Agustín Gravano: Es una pregunta compleja, porque el habla es bastante más compleja de lo que solemos darnos cuenta.
En pocas palabras, un sistema de reconocimiento automático del habla (sus siglas en inglés son ASR) funciona de la siguiente manera: toma como entrada un audio (una grabación de una persona hablando) y devuelve como salida un texto (la transcripción de lo que la persona dijo). En el medio hace muchas cosas, con notables paralelismos con las cosas que ocurren en el oído y en el cerebro cuando escuchamos hablar a alguien.
Primero descompone el audio en muchas frecuencias: unas más graves, otras más agudas. Ese conjunto de frecuencias es lo que da su impronta a cada sonido. Permite que identifiquemos las voces, los instrumentos musicales, el viento, los pájaros. En el habla, esas frecuencias se agrupan para definir cómo suena cada vocal y cada consonante.
Entonces, un sistema de ASR (una gigantesca red neuronal artificial) primero debe ser capaz de reconocer esas combinaciones de frecuencias, para determinar qué secuencia de vocales y consonantes dijo la persona. Después debe agrupar esos sonidos en sílabas, luego en palabras y por último en frases.
Esa historia (muy resumida) es solo para extraer una parte de la información que hay en el habla: las palabras que se dijeron. Pero hay mucha más información disponible. Los seres humanos, cuando hablamos con alguien, podemos inferir su género, su edad, su origen, su estado de ánimo, su nivel de cansancio, sus intenciones, si está afirmando, preguntando o exclamando, si está siendo sarcástica/o, y un largo etcétera.
Todas estas tareas, que las personas hacemos muy bien, en las computadoras vienen rezagadas respecto del ASR. Actualmente hay mucha investigación activa en esos temas.
I: ¿Qué es lo que pasa con el castellano argentino y estos modelos?
A.G.: En Argentina se hablan muchas variantes distintas del castellano. No hay tal cosa como un “castellano argentino” bien definido. Por ejemplo, la forma en que se habla en San Juan es muy distinta a la de Jujuy y a la de Rosario. Incluso dentro de una ciudad como Buenos Aires, cambia mucho según la zona y los sectores socio-económicos.
Al escuchar a gente de distintos lugares del país, son muy evidentes las diferencias en todos los niveles del habla: en los sonidos (pensar en cómo pronunciamos las erres o en cómo aspiramos las eses), en las sílabas (cordooobés), en las palabras que elegimos (*) y hasta en la manera de armar las frases. Lo increíble (y maravilloso) es que pese a todas esas diferencias nos entendemos sin problemas.
I: ¿Qué detalles notás? (por ejemplo, determiadas palabras, formas de decir las cosas, etc).
A.G.: Toda esa riqueza se pierde en la interacción con los modelos modernos, porque homogeneizan el lenguaje. Eligen la forma “promedio” de decir las cosas y dejan de lado la variabilidad, en pos de una supuesta eficiencia. Es un fenómeno parecido a los doblajes de películas y series en “español neutro”: fueron construidos para que ser entendidos por la mayor cantidad de gente con el mejor esfuerzo (presupuesto) posible.
Algo notable es que si a un modelo le pedimos que conteste de cierta manera (por ejemplo, en porteño) en general lo hace bastante bien (con voseo, “che” y hasta algo de lunfardo). Entonces, en principio no hay impedimentos técnicos para intentar preservar las variantes dialectales. El cuello de botella está en la cantidad de datos disponibles para entrenar los modelos: las variantes y lenguas minoritarias corren con mucha desventaja, porque por definición siempre estarán subrepresentadas en los datasets de entrenamiento. Para evitar que se vayan perdiendo, serían necesarios esfuerzos concretos en la dirección opuesta.
El newsletter queda largo, la entrevista y ganas de hablar con Agustín quedan cortas. Por la necesidad de entrevistar a los nuestros y de expandir las voces disponibles voy a reactivar mi canal de YouTube de a poco. ¿Vienen? Se suscriben aquí. Hay mucho material vintage para apaciguar la espera 🙌
Empresas que apoyan a LadoBNews.
Argentina: El grupo de Ransomware INC Ransom anuncia a Grupo Vía Argentina como su nueva víctima.











Buenos días.
Hoy ando medio corto de tiempo, pero me pareció muy interesante lo expuesto por Agustín.
Uno no dimensiona lo complejo y rico que es el habla.
Hace unos años, pre era IA, años 2009 o 2010, iba a un psicólogo y no recuerdo como me empezo a hablar del habla y que si bien estaba el habla de palabras, también estaba el de expresiones corporales, que juntas, te pueden dar una idea de lo que se puede estar dicieindo.
Usó como ejemplo, no sé si el más acertado, los discursos de Hitler.
Me dice "yo no sé nada de alemán, pero lo veo y escucho e infiero que esta diciendo algo me genera inquietud y preocupación, ya que esos gestos y ese tono me transmiten, y no solo a mí, también con colegas y otras personas con las que he hablado sobre este tema".
Ante el comentario, lo primero que hice cuando llegué a mi casa fue buscar un discurso sin subtitulos y sentí algo parecido a lo que me comento el psicólogo.
Saludos y buen fin de semana.
Aaaaaah, hay un asterisco que no lleva a ningún ladooooooo... no voy a poder dormir...