Lightnews — Scholar-powered news

Isabel

@issyinthesky.bsky.social

20/ Si te ha picado la curiosidad, te interesa cómo se cruzan palabras y algoritmos, o quieres charlar sobre #IA o #Lingüística… ¡escríbeme! (se aceptan memes lingüísticos) 🧩

¡Gracias! 👋

@crueuniversidades.bsky.social
@filarramendi.bsky.social
@divulgauca.bsky.social
@univcadiz.bsky.social

June 13, 2025 at 8:14 AM

Isabel

@issyinthesky.bsky.social

19/ Esta tesis nace del deseo de que las máquinas aprendan nuestro lenguaje… si se lo explicamos bien. Porque ser #LingüistaComputacional va de eso: de hacer explícito lo implícito, de enseñar a las máquinas… y de recordar que las #Humanidades también tienen mucho que decir en todo esto de la #IA 💬

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

18/ 🧰 Pero no me quedo ahí: estoy empaquetando todo este trabajo —extracción de rasgos, anotación, evaluación— en una librería de #PLN, para que otras personas puedan usarla en sus proyectos 🔁 Porque la ciencia también es compartir: #CienciaAbierta y reutilizable. ¡Win-win! 🧑‍🔬💻

a purple laptop with a cup of coffee next to it

ALT: a purple laptop with a cup of coffee next to it

media.tenor.com

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

17/ Muchos de los términos que detecta mi sistema acabarán en un glosario digital sobre #Lingüística. 📚 Un recurso para estudiantes, profes y curiosos del lenguaje, donde cada término irá con su contexto real y otros datos relevantes. ¡Así la #IA nos ayuda también a enseñar mejor! 👩‍🏫✨

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

16/ A lo largo de mi tesis he ido construyendo un inventario de rasgos que caracterizan a los términos: morfosintácticos, estadísticos, contextuales… Una especie de modelo teórico-computacional de lo que es (y no es) un término 🔍

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

15/ ¿Y para qué sirve todo esto? Pues para crear diccionarios técnicos 📖; mejorar traducciones automáticas 🌍; facilitar la búsqueda y organización de documentos 🔎, o investigar cómo evoluciona el conocimiento en un campo de especialidad 🧠. En contextos técnicos, los términos lo son todo ✨

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

14/ Pero no basta con que funcione. También me interesa entender por qué funciona: ¿Qué rasgos ayudan más? ¿Por qué algunos términos se le escapan? ¿Qué errores comete? 🤖 Ahí es donde la #Lingüística vuelve a entrar en juego. Y también la parte más divertida del análisis 💡

Meme del "muro conspiranoico" con el personaje Charlie Day de la serie It’s Always Sunny in Philadelphia, gesticulando intensamente frente a un mural lleno de papeles, hilos rojos y notas.
Texto arriba: “CUANDO QUIERO SABER POR QUÉ MI MODELO HA FALLADO”
Texto abajo: “Y ACABO HACIENDO UNA TESIS DENTRO DE LA TESIS”
El meme refleja la obsesión investigadora por entender el fallo de un modelo de IA y cómo el análisis se vuelve cada vez más profundo.

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

13/ De hecho, ¡mi mejor modelo acierta 9 de cada 10 veces al decir si una palabra es un término! 📈 Y no porque se lo haya memorizado, sino porque ha aprendido a distinguirlos por cómo se comportan en el texto. 🧩✨Nada mal para una máquina que no entiende el lenguaje como nosotros, ¿no? 😉

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

12/ Eso que te acabo de contar se llama “aprendizaje supervisado”. Le damos a la #IA ejemplos con pistas (rasgos) y la respuesta correcta (si es término o no). Con eso, aprende a predecir por sí misma. Yo he probado varios algoritmos para ver cuál lo hace mejor… ¡y los resultados no están nada mal!

a woman in an orange fur coat is standing next to another woman in a red coat .

ALT: a woman in an orange fur coat is standing next to another woman in a red coat .

media.tenor.com

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

11/ Para que una máquina aprenda, no basta con ejemplos: necesita pistas. 🧩 ¿Es un sustantivo? ¿Aparece muchas veces? ¿Se combina con otros términos? Cada rasgo es una pieza del puzzle. Por separado dicen poco, pero juntas construyen la imagen completa de lo que es un término 🧠📊

Meme del cerebro en expansión (expanding brain), con cuatro niveles de iluminación cerebral que representan grados crecientes de sofisticación cognitiva:

Nivel básico: “CONTAR FRECUENCIAS” – cerebro oscuro y apagado.

Nivel intermedio: “BUSCAR SUSTANTIVOS” – cerebro con luces suaves.

Nivel avanzado: “DETECTAR PATRONES LINGÜÍSTICOS” – cerebro brillante.

Nivel máximo: “MODELAR ‘TÉRMINO’ CON DATOS REALES DEL CORPUS.” – cerebro iluminado intensamente con rayos azules saliendo hacia fuera, símbolo de un alto nivel de comprensión o genialidad.

El meme parodia la progresión desde métodos simples hasta enfoques más complejos y fundados para la detección de términos en lingüística computacional.

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

10/ Trabajo con manuales, papers... Lenguaje técnico de verdad, con repeticiones, siglas, rarezas… ¡tal y como lo usamos los científicos! 🧪 Ese es el hábitat natural de los términos. (Curiosidad: a este conjunto de textos lo llamamos “corpus” 📚, y es una de las herramientas clave en #PLN)

Meme del "distracted boyfriend". Un chico (etiquetado como "YO") camina de la mano con una chica molesta (etiquetada como "TEXTOS RANDOM"), pero gira la cabeza para mirar con interés a otra chica que pasa (etiquetada como "CORPUS TÉCNICO, ANOTADO Y CON TEXTOS DE CALIDAD"). Representa la preferencia del investigador por trabajar con datos lingüísticos bien curados frente a textos al azar de internet.

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

9/ ¿Por dónde empezamos? Necesitamos:

1️⃣ Un montón de textos científicos (¡cuantos más, mejor, pero de buena calidad!), en mi caso, sobre #Lingüística, y
2️⃣ Marcar los términos en los textos (esto último no es tan fácil como parece 👀)

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

8/ Ahí es donde entra en juego mi tesis:

Un sistema que detecta #términos de forma automática, observando cómo se comportan en los textos. Sin reglas rígidas, solo con pistas lingüísticas ¡y estadísticas! que las propias palabras dejan atrás, como si fueran miguitas de pan 🧠🍞

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

7/ 🔍 ¿Y por qué es tan difícil extraer términos?

1️⃣ Porque no hay una definición única de “término”;
2️⃣ porque no todos los términos se parecen entre sí (algunos son más largos, más cortos, de diferentes categorías gramaticales…), o
3️⃣ porque un término en un texto puede no serlo en otro 🤯

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

6/ A eso nos dedicamos los lingüistas computacionales: a traducir nuestro conocimiento sobre el lenguaje en reglas, datos y modelos que una máquina pueda procesar. Para que entienda que, por ejemplo, en #Lingüística, “compositional semantics” es un término… pero “theoretical approach” no…

Meme de “dos botones” clásico. En la primera viñeta, una mano duda entre dos botones: uno dice “compositional semantics” y el otro “theoretical approach”. En la segunda viñeta, un personaje con sudor en la frente y cara de angustia (etiquetado como “IA”) no sabe qué botón pulsar. El meme representa la dificultad de una inteligencia artificial para decidir qué conceptos deben considerarse términos en lingüística.

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

5/ Pero ¿cómo se enseña a la máquina qué es un término? Podemos intentar enseñarle estructuras y reglas... o mostrarle ejemplos. Lo más común es lo segundo: le damos mucho texto con términos marcados y la entrenamos para que aprenda por sí sola, como cuando aprendes una lengua a base de ver series 😉

Meme de dos doges. A la izquierda, un Doge musculoso con el texto:
“modelo entrenado – tengo 50 rasgos lingüísticos y estadísticos establecidos por una lingüista”.
A la derecha, un Doge triste y delgado con el texto:
“modelo sin entrenar – sólo sé contar”.
La imagen parodia la diferencia entre un modelo de IA entrenado con rasgos complejos y uno sin entrenamiento.

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

4/ Claro que “entender” no es lo mismo para una máquina que para un humano. Un ordenador no interpreta, no razona, no sabe qué significa “término”... pero sí puede hacer cosas que a nosotros se nos escapan: detectar patrones, contar, observar millones de textos y decir: 👉 “Esto suena técnico”

a computer screen with a lot of binary code

ALT: a computer screen with a lot of binary code

media.tenor.com

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

3/ Siempre hemos asociado inteligencia y lenguaje 💬 Por eso, en 1950, #AlanTuring preguntó: "¿Pueden pensar las máquinas?” Hoy la #IA produce texto, sí, pero entenderlo —especialmente el científico— es otra historia. Ahí entra el Procesamiento del Lenguaje Natural o #PLN. Y, claro, los lingüistas 😉

June 12, 2025 at 5:38 PM

Isabel

@issyinthesky.bsky.social

2/ Te cuento: soy Isabel, doctoranda en #Lingüística en la @univcadiz.bsky.social y me paso el día enseñándole a las máquinas a hacer tareas con el lenguaje que usamos los científicos 🧠 Términos, conceptos, estructuras… cosas que nos resultan evidentes, pero para una #IA no tanto. ¡Encantada! 💬

Una profesora enseñándole a su alumno robot a aprender estructuras lingüísticas.

June 12, 2025 at 5:38 PM

Add to Home Screen

Light up
your news

Add to Home Screen

Light upyour news

Sign in to Lightnews

Sign up to start reading

Connect Bluesky

Connect with Bluesky

Light up
your news