Isabel
banner
issyinthesky.bsky.social
Isabel
@issyinthesky.bsky.social
FPU Predoc. @univcadiz | HUM-147 | #ComputationalLinguistics #LanguageEngineering #Terminology 💻

🔗 https://isabel-mm.github.io/website/
20/ Si te ha picado la curiosidad, te interesa cómo se cruzan palabras y algoritmos, o quieres charlar sobre #IA o #Lingüística… ¡escríbeme! (se aceptan memes lingüísticos) 🧩

¡Gracias! 👋

@crueuniversidades.bsky.social
@filarramendi.bsky.social
@divulgauca.bsky.social
@univcadiz.bsky.social
June 13, 2025 at 8:14 AM
19/ Esta tesis nace del deseo de que las máquinas aprendan nuestro lenguaje… si se lo explicamos bien. Porque ser #LingüistaComputacional va de eso: de hacer explícito lo implícito, de enseñar a las máquinas… y de recordar que las #Humanidades también tienen mucho que decir en todo esto de la #IA 💬
June 12, 2025 at 5:38 PM
18/ 🧰 Pero no me quedo ahí: estoy empaquetando todo este trabajo —extracción de rasgos, anotación, evaluación— en una librería de #PLN, para que otras personas puedan usarla en sus proyectos 🔁 Porque la ciencia también es compartir: #CienciaAbierta y reutilizable. ¡Win-win! 🧑‍🔬💻
a purple laptop with a cup of coffee next to it
ALT: a purple laptop with a cup of coffee next to it
media.tenor.com
June 12, 2025 at 5:38 PM
17/ Muchos de los términos que detecta mi sistema acabarán en un glosario digital sobre #Lingüística. 📚 Un recurso para estudiantes, profes y curiosos del lenguaje, donde cada término irá con su contexto real y otros datos relevantes. ¡Así la #IA nos ayuda también a enseñar mejor! 👩‍🏫✨
June 12, 2025 at 5:38 PM
16/ A lo largo de mi tesis he ido construyendo un inventario de rasgos que caracterizan a los términos: morfosintácticos, estadísticos, contextuales… Una especie de modelo teórico-computacional de lo que es (y no es) un término 🔍
June 12, 2025 at 5:38 PM
15/ ¿Y para qué sirve todo esto? Pues para crear diccionarios técnicos 📖; mejorar traducciones automáticas 🌍; facilitar la búsqueda y organización de documentos 🔎, o investigar cómo evoluciona el conocimiento en un campo de especialidad 🧠. En contextos técnicos, los términos lo son todo ✨
June 12, 2025 at 5:38 PM
14/ Pero no basta con que funcione. También me interesa entender por qué funciona: ¿Qué rasgos ayudan más? ¿Por qué algunos términos se le escapan? ¿Qué errores comete? 🤖 Ahí es donde la #Lingüística vuelve a entrar en juego. Y también la parte más divertida del análisis 💡
June 12, 2025 at 5:38 PM
13/ De hecho, ¡mi mejor modelo acierta 9 de cada 10 veces al decir si una palabra es un término! 📈 Y no porque se lo haya memorizado, sino porque ha aprendido a distinguirlos por cómo se comportan en el texto. 🧩✨Nada mal para una máquina que no entiende el lenguaje como nosotros, ¿no? 😉
June 12, 2025 at 5:38 PM
12/ Eso que te acabo de contar se llama “aprendizaje supervisado”. Le damos a la #IA ejemplos con pistas (rasgos) y la respuesta correcta (si es término o no). Con eso, aprende a predecir por sí misma. Yo he probado varios algoritmos para ver cuál lo hace mejor… ¡y los resultados no están nada mal!
a woman in an orange fur coat is standing next to another woman in a red coat .
ALT: a woman in an orange fur coat is standing next to another woman in a red coat .
media.tenor.com
June 12, 2025 at 5:38 PM
11/ Para que una máquina aprenda, no basta con ejemplos: necesita pistas. 🧩 ¿Es un sustantivo? ¿Aparece muchas veces? ¿Se combina con otros términos? Cada rasgo es una pieza del puzzle. Por separado dicen poco, pero juntas construyen la imagen completa de lo que es un término 🧠📊
June 12, 2025 at 5:38 PM
10/ Trabajo con manuales, papers... Lenguaje técnico de verdad, con repeticiones, siglas, rarezas… ¡tal y como lo usamos los científicos! 🧪 Ese es el hábitat natural de los términos. (Curiosidad: a este conjunto de textos lo llamamos “corpus” 📚, y es una de las herramientas clave en #PLN)
June 12, 2025 at 5:38 PM
9/ ¿Por dónde empezamos? Necesitamos:

1️⃣ Un montón de textos científicos (¡cuantos más, mejor, pero de buena calidad!), en mi caso, sobre #Lingüística, y
2️⃣ Marcar los términos en los textos (esto último no es tan fácil como parece 👀)
June 12, 2025 at 5:38 PM
8/ Ahí es donde entra en juego mi tesis:

Un sistema que detecta #términos de forma automática, observando cómo se comportan en los textos. Sin reglas rígidas, solo con pistas lingüísticas ¡y estadísticas! que las propias palabras dejan atrás, como si fueran miguitas de pan 🧠🍞
June 12, 2025 at 5:38 PM
7/ 🔍 ¿Y por qué es tan difícil extraer términos?

1️⃣ Porque no hay una definición única de “término”;
2️⃣ porque no todos los términos se parecen entre sí (algunos son más largos, más cortos, de diferentes categorías gramaticales…), o
3️⃣ porque un término en un texto puede no serlo en otro 🤯
June 12, 2025 at 5:38 PM
6/ A eso nos dedicamos los lingüistas computacionales: a traducir nuestro conocimiento sobre el lenguaje en reglas, datos y modelos que una máquina pueda procesar. Para que entienda que, por ejemplo, en #Lingüística, “compositional semantics” es un término… pero “theoretical approach” no…
June 12, 2025 at 5:38 PM
5/ Pero ¿cómo se enseña a la máquina qué es un término? Podemos intentar enseñarle estructuras y reglas... o mostrarle ejemplos. Lo más común es lo segundo: le damos mucho texto con términos marcados y la entrenamos para que aprenda por sí sola, como cuando aprendes una lengua a base de ver series 😉
June 12, 2025 at 5:38 PM
4/ Claro que “entender” no es lo mismo para una máquina que para un humano. Un ordenador no interpreta, no razona, no sabe qué significa “término”... pero sí puede hacer cosas que a nosotros se nos escapan: detectar patrones, contar, observar millones de textos y decir: 👉 “Esto suena técnico”
a computer screen with a lot of binary code
ALT: a computer screen with a lot of binary code
media.tenor.com
June 12, 2025 at 5:38 PM
3/ Siempre hemos asociado inteligencia y lenguaje 💬 Por eso, en 1950, #AlanTuring preguntó: "¿Pueden pensar las máquinas?” Hoy la #IA produce texto, sí, pero entenderlo —especialmente el científico— es otra historia. Ahí entra el Procesamiento del Lenguaje Natural o #PLN. Y, claro, los lingüistas 😉
June 12, 2025 at 5:38 PM
2/ Te cuento: soy Isabel, doctoranda en #Lingüística en la @univcadiz.bsky.social y me paso el día enseñándole a las máquinas a hacer tareas con el lenguaje que usamos los científicos 🧠 Términos, conceptos, estructuras… cosas que nos resultan evidentes, pero para una #IA no tanto. ¡Encantada! 💬
June 12, 2025 at 5:38 PM